伯克利实验室研究员Sherry Li(图片来源:Roy Kaltschmidt/伯克利实验室)
城市交通的周期模式,大致遵循典型的朝九晚五工作时间表的模式。然而,发生事故时,交通模式就被打乱了。交通工程师必须适应不可预见的实时交通场景,对于他们而言,一个重大挑战是设计准确的交通流量模型,以便在事故中使用。
劳伦斯伯克利国家实验室的一些计算机科学家正在与加州运输部(Caltrans)合作,他们使用高性能计算机(HPC)和机器学习,帮助Caltrans在事故发生时做出实时决策。这项研究是与加州先进交通技术合作伙伴(PATH,加州大学伯克利分校交通研究所(ITS)的一部分)以及互联走廊(Connected Corridors)合作完成的。互联走廊是对加州交通走廊的综合交通通道管理方法进行研究、开发和测试的一个合作项目。
加州运输部和互联走廊项目正在洛杉矶I-210试点试验运行该系统。他们使用来自南加州市、县和州的合作方提供的实时数据,通过执行可协调的多个司法管辖区交通事故响应计划,限制这些事件的负面影响。该系统的第一个版本将于2020年在阿卡迪亚、杜阿尔特、蒙罗维亚和帕萨迪纳等城市部署,并计划在该州各地进行部署。
伯克利实验室计算研究部(CRD)的数学家Sherry Li说:“预测交通流量的方法有很多,每一种都可以在适当的情况下发挥优势。”人工操作员有时会盲目信任,某种特定模型,为了消除这种弊端,我们的目标是整合多个模型,从而生成更稳定、更准确的交通流量预测方法。为此,我们设计了一个结合不同子模型的集成学习(ensemble-learning)算法。”
集成学习是一种将不同学习单元(单个模型)组合在一起,来提高模型稳定性和预测能力的方法。长期以来,机器学习研究人员一直在探索这一方法。交通流量的特殊之处在于其瞬时性;交通流量的测量值是随时间变化而变化的,不同单个模型的预测结果也是如此。
在伯克利实验室与加州运输部的合作中,集成模型应用了子模型之间的依赖性,并分配“投选份额”来平衡它们的个体性能和相互依赖性。集成模型对近期预测性能的评价也高于对以往预测性能的评价。最后,该组合模型在预测精度和稳定性方面都优于测试中使用的任何单一模型。
该项目的启动资金来自伯克利实验室的实验室指导研究和发展计划(LDRD)。目标是建立一个将高性能计算用于交通的计算框架,如优化和控制交通平衡。PATH系统的研发经理Brian Peterson领导该系统的研发团队,他同时也管理互联走廊系统的研发团队。前伯克利实验室计算机科学暑期班学生、来自宾州州立大学的詹宏元(Hongyuan Zhan)为这项研究中的互联走廊工作做出突出贡献。
基于TDEC算法的交通流量预测,这是一种能够跟踪交通流量的模型组合方案。绿色代表预测范围,蓝色代表真实流量,红色代表TDEC算法预测。 (图片来源:Hongyuan Zhan)
实时数据,实时决策
利用从加州高速公路上的Caltrans传感器收集到的数据,该项目生成新的算法,可以在15分钟滚动的基础上实现准确预测。之后,研究团队利用实时交通数据验证并集成新算法,这些交通数据是通过互联走廊系统收集——一个基于流量的实时交通数据中心,其中Spark MLlib(一个可扩展的机器学习库)提供了可在所提集成学习框架中使用的机器学习模型。这项工作具体是在高速公路上有传感器的地方生成预测的交通流,进而预测高速公路入口处的交通需求和出口处的交通流量。
集成学习一定程度上解决了交通运输中车辆类型不同的问题;然而,它不能解决由建筑或事故引起的突然变化而产生的问题。研究团队使用在线(实时)学习技术,使算法不仅能学习过去的数据,而且能实时适应沿途的新交通条件。
该算法可以与车辆绕行、变更交通灯配置等纠正措施技术相结合,实现更准确、更及时的交通预测,并有助于实时交通控制。
Peterson说:“互联走廊项目的首次部署旨在验证这一理念,并在现实条件下量化传播时间、交通流量和延误问题方面的改善力度。模拟交通显示,随着交通管理策略的发展,各种交通问题可能会有显著的改善。未来的部署还在规划阶段,有机会进行系统改进和采用新方法。”
除了李、Peterson和詹,伯利克实验室研究员John Wu及其同事Gabriel Gomes也是该项目的贡献者。
翻译:黄颜茹
审校:赵欢
引进来源:劳伦斯伯克利国家实验室