UniTraj 这项研究提出了数据 + 模型的基础模型构建范式。
轨迹数据分析的重要性
在智慧城市和大数据时代背景下,人类轨迹数据的分析对交通优化、城市管理和物流配送等领域具有重要意义。然而,现有的轨迹模型常常面临任务特异性、区域依赖性以及数据质量敏感性等问题,限制了其泛化能力和实际应用。
WorldTrace数据集的构建
来自香港科技大学(广州)、南方科技大学和香港城市大学的研究团队首次整理了全球大规模轨迹数据集WorldTrace,涵盖70个国家和地区,包含245万条轨迹和十亿级别的数据点。这为构建通用的轨迹基础模型提供了丰富的数据支持。
UniTraj模型的设计
研究团队基于WorldTrace数据集训练了首个世界轨迹基础大模型UniTraj。该模型采用灵活的编码器-解码器架构,集成了多种重采样和掩码策略,旨在提升模型的计算效率和对不同数据质量的适应能力。重采样策略包括基于对数采样率衰减的动态重采样和间隔一致性重采样,以控制冗余和调整采样率。
掩码策略的应用
UniTraj使用重构式预训练的方法,通过多种掩码策略(如随机掩码、块状掩码、关键点掩码和最后点掩码)来提升模型对轨迹局部和全局模式的建模能力。这些策略帮助模型理解和捕捉轨迹序列的时空关系。
实验验证与应用
研究团队进行了系列实验,评估UniTraj在真实世界轨迹数据处理中的准确性和泛化能力。实验设计涵盖了多种任务适用性分析、数据集比较以及模型组件的影响研究,结果显示UniTraj在零样本和少样本学习场景下表现优异。
总结与展望
UniTraj的研究为轨迹数据的处理提供了新的思路,提出了数据和模型结合的基础模型构建范式。通过构建全球范围的轨迹数据集和灵活的模型设计,该研究为未来的轨迹分析和相关应用奠定了基础,推动了智能交通和城市管理的发展。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...