南科大计算机系学子在2021全球高性能云计算创新大赛中获佳绩

发布时间:2022-04-28


2022年4月20日,由中国信息通信研究院和中国计算机学会高性能计算专业委员会指导, ACM中国高性能计算专家委员会(ACMSIGHPC)和云计算开源产业联盟以及亚马逊云科技、腾讯云联合主办的2021全球高性能云计算创新大赛(简称2021 MAXP大赛)圆满落幕。本次竞赛的DGL图机器学习赛道吸引了来自全球14个国家和地区的342所机构(学校、企业、个人),总计1448 支队伍,南科大学子与来自中国科学院大学、中科院计算所的同学组队参赛,荣获亚军。


南科大参赛成员付浪、张烙铭现为计算机科学与工程系Nature Inspired Computation and Applications Laboratory(NICAL)实验室研究生,本次参赛由导师杨鹏研究副教授和李皈颖研究助理教授负责技术指导,由南方科技大学计算机系-深圳证券信息有限公司行情云联合创新实验室提供整体支持。

4-2.jpg

4-3.jpg

4-4.jpg

4-5.jpg

赛题背景

近几年来,针对图结构化数据的机器学习算法发展得如火如荼,其中图神经网络作为最新的图机器学习研究方向获得了广泛的关注,相关的论文也成为主流人工智能会议的热点方向。在现实场景里,图神经网络在计算机视觉、自然语言处理、生物制药、知识图谱、推荐系统等多个领域得到了应用,并取得了良好的表现。  


任务说明

本次比赛的任务为利用图结构预测无标签论文的类别,使用的数据是基于微软学术文献生成的论文关系图,整个图包含百万级节点以及千万级边。


方法简介

4-6.jpg

图网络本质是聚合节点邻居的信息及其自身的信息,通过消息传递来获取节点的高阶特征,最终生成节点的表示。当节点邻居个数较多的时候图网络难以聚合全部邻居信息,所以需要通过采样的方式进行近似,然而采样又会使得图网络难以完整捕获图的全局信息,进而造成预测错误。针对上述问题提出通过图嵌入的方式嵌入节点的标签、Deep Walk特征、邻域统计特征来使得网络性能大幅提升;其次提出通过DesNet连接各个采样层以及使用多头自注意力机制和软注意力机制等多模态融合技术实现对于GCN、SAGE、GAT网络特征的有效融合再次实现性能提升;并且还研究了模型自蒸馏、伪标签增强、对比学习、图数据增强、训练策略等多种方法在该任务上的表现。最终在初赛以及复赛中均取得亚军的成绩。


大赛官网

https://www.biendata.xyz/competition/maxp_dgl/ 


赛事联合发起单位

•中国信息通信研究院

•中国计算机学会

•中国移动通信集团有限公司

•天翼云科技有限公司

•阿里云计算有限公司

•中国联合网络通信集团有限公司

•中国移动通信集团研究院

•中国电信股份有限公司研究院

•腾讯云计算( 北京) 有限责任公司

•华为技术有限公司

•浪潮云信息技术股份有限公司

•上海有孚网络股份有限公司

•优刻得科技股份有限公司   

•国家超级计算长沙中心

•东方超算科技有限公司

•北京超级云计算中心

•北京天云融创软件技术有限公司 

•北京燧原智能科技有限公司


南科大计算机系-深圳证券信息有限公司行情云联合创新实验室简介

成立于2022年1月,面向国际领先交易所和信息服务商的证券行情服务云化技术变革趋势,聚焦于证券大数据、人工智能、云计算等先进技术的理论方法突破,积极探索落地我国首项基于云原生的证券行情服务行业基础设施,提升深市行情在国际上的影响力和话语权。计算机系杨鹏研究副教授任联合实验室负责人。