南科大计算机系2篇本科生第一作者的论文被GECCO 2023 接收
近日,南科大计算机系Hisao Ishibuchi教授课题组6篇论文被遗传与进化计算国际会议GECCO 2023 接收。其中2篇论文的第一作者为我系在读本科生。他们分别是:计算机系2019级本科生安广言、吴子彧、沈挚龙(共同第一作者)和2020级本科生朱晗。论文通讯作者为计算机系研究副教授尚可和讲席教授Hisao Ishibuchi。
两篇论文均为本科生创新实验课程成果,他们从大三开始选修创新实验课程,进入Hisao Ishibuchi教授课题组接受科研训练。南方科技大学计算机科学与工程系从创系之初就强调本科生的综合能力培养,以实际问题为导向,以项目为驱动,以学科交叉融合为辅助,以“学生项目小组+导师”配对的方式从大三开始每周指导本科生做多样的工程或科研项目。这样的培养方式极大地提高了学生们的动手能力、抽像思维能力、沟通表达能力和团队精神,为学生的长期发展打下了坚实的基础,促进学生从知识学习型向知识创造型转变。
1
Evolutionary Multi-Objective Deep Reinforcement Learning for Autonomous UAV Navigation in Large-Scale Complex Environments
Guangyan An, Ziyu Wu, Zhilong Shen, Ke Shang* Hisao Ishibuchi*
该论文提出了一种创新的多目标无人机自主导航方法。该方法结合了演化多目标优化(EMO)和深度强化学习(RL),在大规模复杂环境中实现了无人机的飞行安全和飞行效率两种目标的自主导航,为无人机自主导航任务提供了更加灵活的解决方案。
在当前的无人机自主导航领域,如何在完成无人机自主导航任务的基础上,同时考虑无人机的飞行安全和飞行效率,是一个重要且挑战性的问题。针对这个问题,该论文提出了一种结合演化多目标优化和深度强化学习的无人机自主导航方法框架。该框架通过演化多目标优化算法产生一组非支配的奖励函数参数集,实现了无人机在飞行安全和飞行效率上的多样化控制策略。在无人机自主导航的任务测试中,该框架相比传统的深度强化学习方法展现出了显著的性能提升。
图1. 文章提出的多目标无人机自主导航框架
图2. 由框架得到的不同参数的无人机的轨迹比较(安全型、平衡型和效率型)
这项研究为大规模复杂环境中的多目标无人机自主导航提供了新的解决方案,并展示了通过整合深度强化学习和演化多目标优化进一步提升无人机自主导航性能的可能性。
本论文三位共同第一作者为计算机系2019级本科生安广言、吴子彧、沈挚龙。论文通讯作者为计算机系研究副教授尚可和讲席教授Hisao Ishibuchi。
2
Hypervolume Approximation based on Set Transformer
Han Zhu, Ke Shang* Hisao Ishibuchi*
该论文改进了一种用于近似超体积评价指标(Hypervolume Indicator)的深度神经网络模型。新的模型通过修改、简化并应用Set Transformer替换掉了原模型HV-Net中的DeepSet模块。该论文还优化了HV-Net的训练策略,同时重新设计了损失函数解决了HV-Net训练过程中出现的无法收敛的问题并实现了更低的近似误差。
图3. 文章及后续工作提出的网络近似模型
多目标优化问题是指在优化过程中需要同时考虑多个目标函数的优化问题。超体积评价指标(Hypervolume Indicator)是一种常用的多目标优化算法评价指标,用于衡量算法得到的解集在目标空间中所支配的空间大小。超体积评价指标是一种一元评价指标,该指标能够同时评估一组解的收敛性与多样性,因此能够帮助算法设计者更好地了解算法的性能。
然而,现有的精确计算超体积评价指标的算法的计算复杂度是指数级的,在维度以及解的数量两方面的扩展性都不友好。因此牺牲一定的精度来换取更短的计算时间是有必要的。
图4. 三维目标空间中的超体积示意图
相较于原模型HV-Net,这项研究提出的模型STHV-Net以略微增加的计算时间为代价,大幅提升了各个维度下的超体积评价指标近似精度(10维目标空间中HV-Net的近似误差为4.2%,所提出的Version1模型的近似误差为1.87%,Version2模型的近似误差为0.86%)。这为一些基于超体积评价指标的优化算法,如SMS-EMOA,提供了一种可能的优化方案。
本论文第一作者为2020级本科生朱晗,论文通讯作者为计算机系研究副教授尚可和讲席教授Hisao Ishibuchi。