南科大计算机系本科生在计算机视觉领域多个国际赛事中喜获佳绩

发布时间:2022-07-01


6月19日,2022年计算机视觉领域国际顶级学术会议CVPR下的多个赛事落下帷幕。由我校本科生张金锐,博士生王腾组成的队伍在其中的ActivityNet(International Challenge on Activity Recognition)和LOVEU(Long-form Video Understanding)两个竞赛中表现突出,荣获两个全球亚军,并受邀在大会的workshop上作口头报告,据悉,该队伍还在6月25日结束的多媒体领域顶会ACM MM下的PIC(Person In Context)竞赛中获得两个赛道的全球冠军。该队伍的指导老师为郑锋副教授。


图片1.png

PIC竞赛排行榜


LOVEU证书.jpg


LOVEU比赛获奖证书

合照.jpg

王腾、郑锋副教授、张金锐(从左至右)


学术会议介绍

CVPR是计算机视觉和模式识别领域的国际顶级学术会议,在中国计算机学会推荐国际期刊和会议中,CVPR为人工智能领域的A类会议,在最新的谷歌学术期刊和会议影响力TOP100榜单中,CVPR位居第四,仅次于Science。ACM Multimedia(ACM MM)始于1993年,是国际多媒体领域的顶级学术会议,也是中国计算机学会推荐的多媒体领域唯一A 类国际学术会议。


比赛介绍

该队伍参加的ActivityNet,LOVEU和PIC均为视频理解领域的顶级赛事, 举办方分别来自 KAUST, 新加坡国立大学, 中国人民大学等机构,历届参赛队伍多来自多个全球知名机构,包括斯坦福,清华,字节跳动等。三个比赛均聚焦于长视频中的视觉语言理解,需要攻克视频中的事件定位,事件关键文本建模,以及事件描述文本生成等多个挑战,我校学子克服重重困难,在多个赛道中均取得了极其优异的成绩。


LOVEU参赛队伍.jpg

LOVEU比赛参赛队伍


大赛官网

ActivityNet:

www.activity-net.org/challenges/2022


LOVEU:

www.sites.google.com/view/loveucvpr22/home


PIC:

www.picdataset.com


获奖本科生张金锐


张金锐同学是我校2018级的本科生,因对计算机视觉、多模态感知等领域有着极其浓厚的兴趣,在大三时加入了郑锋老师的课题组,在郑老师的指导下做视觉语言理解研究方向的创新实践项目,计算机系的创新实践课程以“学生小组+导师”配对的形式每周指导学生解决真实的科研和工程难题,致力于培养本科生的创新能力和动手能力,这次比赛的内容正是他创新实践研究课题的拓展,他说:“正是得益于做创新实践时积累的经验,我才有信心和能力与世界强队一决高下”。


南方科技大学视觉智能与感知实验室


实验室致力于跨媒体技术、多模态感知等领域的相关研究,取得了一系列重要的科研成果。近五年,已在人工智能CCF推荐的A类国际顶级期刊和会议上发表学术论文50余篇,在多个国际重要竞赛中均取得了领先名次。