最近,山东大学教授白露团队和北京大学教授程翔团队联合在Nature的期刊上《Scientific Data》发表研究论文,正式发布SynthSoM,世界上第一个通信和多模态感知智能集成数据集。该数据集填补了通信和多模态感知智能集成研究领域的数据空白,为智能交通、6G网络、无人系统等前沿技术的研发提供了重要支撑。
SynthSoM数据集包含通信数据和多模态感知数据在多车和多路端场景中,涵盖sub-6 GHz、各种频段,如毫米波和SISO、MIMO、大型MIMO等天线配置的射频通道信息集成了多模态感知数据,如毫米波雷达、RGB图像、深度图像、激光雷达点云等。数据集涵盖城市、郊区、农村等多元化网络智能低空交通场景,包括多时间、多天气、多视角、多交通密度等复杂条件。总通信通道数据37.3万套,波形数据23万套,RGB图像45.5万张,深度图像89.1万张,激光雷达点云数据24.1万套,是目前该领域最完整的公共数据集。
随着人工智能和网络连接智能技术的快速发展,无人系统越来越迫切需要多模态感知和通信协同。但现有数据集存在模式单一、场景局限等问题,难以满足复杂环境下算法验证的需求。研究小组通过自主研发的数据生成和采集平台,构建了SynthSoM数据集,其核心创新是实现通信与感知数据的深度融合,为无人驾驶、无人仓储等应用提供了高保真、多场景的算法训练和测试基础。
为了保证数据的可靠性,研究小组采用了统计分析和机器学习的双重验证方法。通过比较模拟数据和实际测量数据的统计分布和传播路径特征,确认了数据集的准确性;同时,基于“模拟训练-实际测试”(TSTR)以及“实测训练-实测测试”(TRTR)在真实场景中,机器学习评估框架验证了数据的可移动性。
实验结果表明,SynthSoM数据集在不同智能体密度和天气条件下的性能与实际测量高度一致,具有很高的可信度和实用性。
目前,SynthSoM数据集已经通过开源平台向全球学术界和工业界公开,预计将推动智能网络连接系统、6G通信感知一体化等领域的突破性研究。
该团队表示,将继续更新数据场景和模式,进一步扩大其在智慧城市、低空经济等新兴领域的应用潜力。
赞一个