南科大计算机系余剑峤团队在智慧交通领域取得多项研究成果

Release Time:2020-08-19

近期,南科大计算机科学与工程系助理教授余剑峤课题组在智慧交通领域取得一系列科研进展,在IEEE Internet of Things Journal,IEEE Transactions on Intelligent Transportation Systems,Transportation Research Part C: Emerging Technologies等相关领域国际顶级期刊,以及2020年IEEE国际智能交通系统会议上发表6篇论文。

 

(一)交通信息预测是交通运输研究中的关键问题,现有的预测方法基于深度学习以及大数据集而取得了出色的表现。然而,研究往往忽略了这些共享数据可能包含敏感的隐私信息,从而导致潜在的隐私泄露。

1.jpg


图1 交通流预测中的隐私与安全问题

针对此,余剑峤课题组发表在物联网领域顶级期刊IEEE Internet of Things Journal上的文章以“Privacy-preserving Traffic Flow Prediction: A Federated Learning Approach”为题,提出了基于联合学习的门控循环单元神经网络算法(FedGRU)来在隐私保护的约束下准确预测交通流。

该算法将联邦学习与GRU结合,不会直接访问分布式组织数据,而是采用安全参数聚合机制在云中聚合分布式训练到的局部模型。此外,其采用联合平均算法(FedAVG)进行随机子采样以减少模型参数传输过程中的通信开销,同时引入一个联合公告协议(Joint-Announcement)来提高算法可扩展性。与传统的方法相比,此算法在可达到同等的预测精度的情况下,无需共享隐私数据集而降低隐私泄露的危险。


2.jpg

图2.基于联邦学习的交通流预测架构


3.jpg

图3. 联邦学习联合声明协议


4.jpg

图4安全参数聚合机制

该论文的第一作者为南科大访问学生刘毅,余剑峤助理教授为通讯作者,新加坡南洋理工大学教授Dusit Niyato,博士后Jiawen Kang以及南科大大三学生张舒昱为论文合作者。南科大为论文第一通讯单位。


(二)实时交通速度估计是现代运输控制和管理应用程序的基础,目前工业方法主要涉及固定速度传感器和车辆全球定位系统(GPS)记录,但是其存在速度数据不完整的问题。此外,此前方法没有利用相邻道路实时交通速度之间的空间相关性,仅通过每条道路单独执行估计算法来构建,导致计算不高效。

课题组在智能交通系统领域顶级期刊IEEE Transactions on Intelligent Transportation Systems上发表了题为“Real-Time Traffic Speed Estimation with Graph Convolutional Generative Autoencoder”的论文,该论文提出了一种新的深度学习模型GCGA,结合了深度学习技术的最新发展,利用少数众包车辆提供GPS记录,用于大区域的实时速度估计。

该模型融合了GCN和GAN的概念和设计原理,以完成出色的图形特征提取,并采用一种实用的GCGA训练方法来微调网络参数以解决图形输入数据不完整的问题。

与传统方法相比,该模型可以提取交通网络中与图有关的空间特征,一次绘制交通速度图,同时放宽了对固定速度传感器的依赖,充分利用了动态,独立和不完整的车载GPS记录。仿真结果表明,此方案可以取得目前最优的预测精度,且提出的GCGA作为一个通用的图形特征生成方法,有望应用于解决其他研究和工业问题。


5.jpg

图5 GCGA模型示意图

该论文的第一作者及通讯作者均为南科大助理教授余剑峤,Facebook AI Research及香港大学电气与电子工程系研究员Jiatao Gu为合作作者,南科大为第一单位。

 

(三)交通模式识别作为智能交通系统中的另一项基本任务,目前的研究主要基于可提供有关个人出行方式的详细且精确信息的GPS数据,但是其面临特征选择不足,数据维数高以及数据利用不足等问题。

针对此,余剑峤课题组还在IEEE Transactions on Intelligent Transportation Systems上发表了题为“Travel Mode Identification with GPS Trajectories using Wavelet Transform and Deep Learning ”的论文,提出了一种基于离散小波变换(DWT)和深度学习技术(DNN)的最新发展的新型出行模式识别机制,采用任意长度的GPS轨迹在全局和在线出行模式识别场景中得到精确的结果。

该机制是在出行模式识别中使用小波变换和递归神经网络的开创性研究之一,利用DWT获得隐藏的时频域特征并使用DNN进行出行模式推断。与先前的工作不同,该机制充分利用了GPS轨迹中的时间相关性来训练用于识别的智能系统,并且轨迹的长度不需要固定,且由于DWT和DNN的计算效率高,采用该机制可实时进行整个识别过程。

实验结果表明,该机制显着优于相同数据集上现有的行驶模式识别方法,并且计算时间短。


6.jpg

图6.提出的出行模型识别机制的数据流

7.jpg

图7. 提出的出行模型识别器示意图

南科大余剑峤助理教授为论文唯一作者。

 

(四)此外,目前对于出行模式识别的研究严重依赖于具有准确行驶模式信息的GPS轨迹的手动注释,存在经济上效率低下且容易出错的问题。

课题组在交通工程领域顶级期刊Transportation Research Part C 上发表了论文“Semi-supervised Deep Ensemble Learning for Travel Mode Identification”,提出了一种基于代理标签的半监督深度集成学习方法,以使用最少数量的带注释数据进行出行模式识别任务。

该方法利用集成四种网络的神经网络,基于已知的少量带注释数据,生成未标注数据的代理标签,并将其与原始注释数据一起用作训练目标。


8.jpg

图8.数据处理流程

基于GeoLife数据集的案例研究证实了该方法的有效性,与最先进的出行模式识别方法相比,该方法在所有相同数据集配置下取得的结果明显优于其他方法。

论文唯一作者为余剑峤助理教授。

 

(五)除上述国际顶级期刊文章成果发表外,余剑峤课题组在2020年度IEEE国际智能交通系统会议上发表了多篇交通模式识别研究论文,开创性地提出通过半监督及无监督学习方法进行出行模式识别的学习模型。课题组发表题为“MultiMix: A Multi-Task Deep Learning Approach for Travel Mode Identification with Few GPS Data”的会议论文,提出了基于GPS数据的另一种基于多任务的半监督学习框架的交通模式识别方法。该方法使用标记、未标记和合成数据来训练一个深度自动编码器,通过同时优化三个相应的目标函数来进行训练。案例学习结果表明,与以前的方法(有监督和半监督)相比,基于数据混合的多任务学习方法表现出最佳的识别性能。


9.jpg

图9. MultiMix的结构

论文第一作者为南科大一年级硕士研究生宋晓壮,通讯作者为余剑峤助理教授,南科大与悉尼科技大学联培博士研究生Christos Markos为论文合作者。

(六)课题组同时发表了题为“Unsupervised Deep Learning for GPS-Based Transportation Mode Identification”的会议论文,首次利用无监督深度学习方法对运输模式下的GPS轨迹数据进行聚类以进行交通模式识别。

该方法通过利用固定大小的轨迹段作为输入数据对深度卷积自编码器网络(CAE)进行预训练,并在CAE中的嵌入层上附加一个聚类层,将聚类中心保持为可训练的权重。之后通过重训练复合聚类模型来取得模型重构和聚类损失之间的平衡。在真实数据集上的实验证实该方法在交通模式识别方面显著优于传统聚类算法和半监督技术,无需使用任何标签就可取得具有竞争力的识别精度。

论文的第一作者为南科大与悉尼科技大学联培博士Christos Markos,通讯作者为余剑峤助理教授。

以上几项工作获得国家自然科学基金、广东省自然科学基金、广东省类脑智能计算重点实验室等项目和机构的资助。