南科大计算机系3篇论文被可视化领域顶会IEEE VIS 2023录用
近日,南方科技大学计算机系3篇论文被可视化领域国际顶级会议IEEE VIS 2023录用。我系马昱欣副教授、唐博助理教授、程然副教授为指导老师。IEEE VIS(IEEE Visualization and Visual Analytics Conference)是数据可视化和人机交互领域最重要的学术会议之一,旨在为学术界和产业界搭建一个可视化和可视分析领域前沿理论、技术和应用的交流平台。该会议是中国计算机学会推荐的A类国际学术会议,今年会议有539篇投稿进入评审流程,最终录用133篇,录用率24.68%。
1
A Comparative Visual Analytics Framework for Evaluating Evolutionary Processes in Multi-objective Optimization
Yansong Huang, Zherui Zhang, Ao Jiao, Yuxin Ma*, Ran Cheng
进化多目标优化算法是用于求解有多个目标约束的优化问题的一类算法。在多目标优化领域的研究中,如何对各算法进行合理的评估和比较,仍是一项关键的课题。现有方法主要依赖数值化质量指标来量化算法性能,进而通过这些指标对不同算法的结果进行比较。然而,这种聚合性的量化指标难以全面反映算法演化过程的异同,也无法帮助用户理解作为“黑箱”模型存在的演化行为本身。
近年来,可视分析方法在可解释人工智能领域得到了广泛的应用。受此启发,我们设计了一套面向进化多目标优化算法的可视分析框架,主要用于支持算法演化过程的比较分析。我们通过与演化计算领域专家合作,构建出了“算法概览——演化过程——解集细节”的多层级比较流程。框架中包含的一系列交互式可视化视图能够有效地帮助用户理解多个算法间的代际相似关系,进而探索和发现不同算法演化行为间的异同。该框架的代码实现已发布于南科大数据可视化实验室(DVA Lab)项目仓库:
https://github.com/VIS-SUSTech/visual-analytics-for-emo-algorithm-comparison。
图1
南科大计算机系数据可视化实验室2019级本科生黄彦淞与2021级硕士生张哲瑞为论文共同第一作者,2020级本科生焦傲参与算法和系统实现工作。该论文由计算机系马昱欣老师和程然老师共同指导,马昱欣老师为通讯作者,南科大计算机系为第一单位。
2
QEVIS: Multi-grained Visualization of Distributed Query Execution
Qiaomu Shen, Zhengxin You, Xiao Yan, Chaozu Zhang, Ke Xu, Jianbin Qin, Dan Zeng, Bo Tang*
大数据系统(如Apache Hive, Apache Spark)被国内外顶尖IT公司应用于各类大数据分析业务中。因大数据系统的复杂性,分析和优化大数据系统中分布式查询的处理性能一直是工业界和学术界的热点问题。南方科技大学数据库课题组DBGroup从2020年开始致力于通过可视分析方法,深入理解这些系统的查询执行过程,揭示大数据系统查询处理过程中存在的性能问题,从而实现系统性能优化。
在IEEE VIS 2023上,DBGroup提出了多粒度可视分析系统QEVIS (Query Execution VISualization)。针对大数据系统Apache Hive,QEVIS设计并实现了多粒度(查询query 作业 job 任务 task)分析逻辑;提出了针对查询任务细粒度执行过程异常检测算法及其可视分析视图;同时通过多视图协作的方式来辅助开发人员将执行异常与导致异常的潜在原因进行关联。该系统已经在合作企业落地,其代码以及数据已开源于南方科技大学DBGroup课题组项目仓库:
https://github.com/DBGroup-SUSTech/QEVIS。
图2
该工作第一作者为DBGroup申乔木研究助理教授,南方科技大学2022届本科生游正新(现为南方科技大学-香港理工大学联培博士生)、南方科技大学2021级硕士生张超祖参与系统设计与实现,通讯作者为唐博老师。南方科技大学斯发基斯可信自主系统研究院为第一单位。
3
GeoExplainer: A Visual Analytics Framework for Spatial Modeling Contextualization and Report Generation
Fan Lei, Yuxin Ma*, A. Stewart Fotheringham, Elizabeth A. Mack, Ziqi Li, Mehak Sachdeva, Sarah Bardin, Ross Maciejewski
地理模型常被应用于处理带有空间信息的数据推理任务中,例如 “为什么在美国总统选举中,投票偏好通常表现出强烈的空间依赖性”。这些复杂的地理数据分析任务通常依赖于高级回归建模技术(如多尺度地理加权回归,MGWR)来揭示数据中决定空间分布模式的相关因素。然而,现有方法在帮助用户理解这些回归模型的输出方面,缺乏地理空间和数据相关的上下文信息与背景知识的呈现,通常只展示基本的统计结果。
针对这一问题,我们提出了GeoExplainer,一个用于辅助地理数据建模、分析和报告编写的可视分析框架。该框架受到当前可解释机器学习研究和叙述性可视化技术的启发,通过易于理解的交互式可视化方式,在地理数据分析流程的各个阶段(包括数据预处理、模型训练、预测分析等)提供解释支持。在易用性方面,该框架提供了回归建模的参数推荐和预警功能、基于模板的文本注释生成,以及基于外部知识库的上下文展示模块。数据分析师可以通过生成文字报告的方式,对模型的训练和预测结果进行总结,从而使其他相关人员能够快速理解数据分析结果。GeoExplainer的代码实现已开源:
https://github.com/VADERASU/geoexplainer。
图3
该工作由亚利桑那州立大学VADER实验室Ross Maciejewski教授和南科大计算机系马昱欣老师共同指导,VADER实验室博士生雷凡为论文第一作者。马昱欣老师为通讯作者。
南方科技大学计算机科学与工程系