Ferran Torrent
Aimsun高级数据科学家
交通仿真系统非常复杂,需要大量的计算工作,特别是在处理大规模模型的动态交通仿真以表达其拥堵状况随时间的演变的时候。 Aimsun团队始终关注这一挑战,并积极寻求各种方法来减少我们自己研发的实时交通仿真系统 Aimsun Live 的计算工作量,尤其是在处理超大规模路网方面。
机器学习(ML)有时被误认为可以替代仿真。 机器学习模型可以根据数据高效构建,构建完成后,可以根据输入数据提供预测。 对机器学习而言,处理庞大的数据不在话下,即便是需要应对每分钟的交通通行量。 然而,当机器学习模型必须对未观察到过的目标变量或训练数据集中从未出现过的情况提供预测时,机器学习模型会遇到严重的困难。 这是因为机器学习模型寻求解释变量和目标变量之间的相关性(线性或非线性关系),而不是因果关系。 因果推理或因果模型可以解决这一挑战。文献展示了一些利用因果推理理论和基于图解的模型进行时间序列预测的方法。 然而,在正常观测水平下,即使在最好的情况下,哪怕仅覆盖网络的一小部分,因果推断目前是不可行的。
另一方面,交通仿真系统需要消耗不少的时间和人力资源来对交通需求和网络进行模型计算,以便即使在不可观测的位置,也可以根据估计的需求和供应的交通状态,对将要发生的情况进行因果推断。 然而,基于需求的模型需要数周的工作,并且通常仅对主要需求模式进行建模,例如典型的工作日、周末和假期,这意味着需求是和模式集定义的分辨率相关的。 任何超出这些需求模式的需求变化都需要生成新的模式,以确保仿真的输出反映在现实生活中发生的情况; 如果需求变化异常频繁,对新的需求模式建模可能变得不可行。
显然,单独的仿真或机器学习都无法提供经济而快速的模型、廉价而快速地适应新环境以及在新的和未见过的情况下进行稳健预测的完美解决方案。 Aimsun Live 将仿真和机器学习相结合,并使用基于机器学习的预测来动态调整需求。Aimsun Live结合了二者的优势,又弥补了彼此的不足, 但还有继续成长的空间。 Aimsun 分析了 ML 模型在给定的包含从仿真得来的所有路段数据的离线数据集(用于训练)的情况下,在不可观测路段(没有实时观测数据的路段)估计交通流量方面的表现。 以及该模型在面临需求变化时的表现。
我们从两个城市获取了两个真实数据集:卑尔根(25 个月的数据 – 2018 年、2019 年和 2021 年 3 月)和威斯巴登(11 个月的数据 – 从 2020 年 8 月到 2021 年 6 月)。 然后,我们从这些数据集中提取需求模式(卑尔根的 8 个需求模式和威斯巴登的 12 个需求模式),其中每个模式代表以15 分钟为时间间隔的24小时的需求,即每个模式代表某一天的需求 。 最后,我们在正常供应端条件下了仿真每种天类型,分别生成了 8 天和12 天的综合数据集。 借助这个合成数据集,我们使用 5 折交叉验证来训练和测试 ML 模型。 这意味着对于每个城市,我们用 80% 的合成天数训练 5 个 ML 模型,并用剩余 20% 的天数测试每个模型。 但机器学习模型经过训练,只能从可观察的路段(具有真实环形检测器的路段)接收数据,并尝试估计不可观察路段的交通流量。 这意味着它使用 110 和 322 个路段的数据分别估算了卑尔根和威斯巴登 3732 和 4403 个路段的交通流量。
下图以 %GEH <5 和均方根误差 (RMSE) 的形式显示了该实验的结果。 箱线图表示第一和第三分位数、中位数(橙色)、平均值(绿色三角形)以及第一和第三分位数减/加 1.5 倍四分位距。 为了证明仿真的合成日是不同的,并且它们代表了真实数据集中最常见的需求模式,箱线图还显示了训练集中的最佳合成日(用作训练的80% 当中的最佳日)用于预测测试集中的每一天(剩余 20% 的天)。
结果表明,机器学习模型有效地对不可观察部分的仿真流量进行了模型处理,并且该模型在面对新的需求模式时具有非常好的泛化能力。
但哪个系统能够更好地模拟现实呢? 我们的下一个实验包括: (i) 使用真实的离线数据集(现在包括悉尼市)训练机器学习模型, (ii) 随机设置带有环形检测器的路段作为可观察或不可观察路段,以及 (iii) 使用新的真实数据集(使用 2021 年 9 月和 10 月的数据)测试模型。 本实验中可观察路段和不可观察路段的数量分别为:
下图显示了该实验的结果,并将其与使用 Aimsun Next 的仿真结果以及每天的最佳需求模式进行了比较。
结果表明,与使用先前交通需求模式的仿真相比,所提出的模型在新交通需求条件下进行预测时具有更高的准确性。
训练和验证集的条件强化了这一肯定:卑尔根训练集包括 2018 年、2019 年和 2021 年 3 月,因此仿真使用的交通需求模式涵盖了 COVID-19 爆发和交通限制之前的 24 个月,以及 COVID-19 交通限制。 然而,验证集所在的交通背景有所不同,因为没有交通限制,而且疫苗接种率很高,我们可以将其视为新冠疫情之前和 2021 年 3 月之间的中间地带。
悉尼训练数据集包括2020年下半年和2021年8月,分别对应的交通背景是部分交通限制和严重的封锁。 另一方面,验证数据集对应的交通背景是交通的逐渐正常化。 目前的状态介于 2020 年和 2021 年 8 月的需求模式之间。
对于卑尔根和悉尼来说,所提出的方法大大优于仿真预测,这意味着它更适合新的需求环境。 请注意,交通仿真系统需要对需求进行准确的模型计算以作为输入; 它们对于输入需求也是刚性的,除非动态需求调整算法将需求调整到观察到的交通状态。
威斯巴登则不同:训练数据集从2020年8月持续到2021年5月至2021年6月,但在2021年6月末,位于模型南部边界的一座重要桥梁被关闭。 由于其处于边境位置,这座桥梁的关闭代表了供应变化和需求变化的混合。 此外,交通需求也因新冠肺炎 (COVID-19) 而发生小幅变化。 威斯巴登采用的方法总体上比仿真获得了更好的精度,但由于桥梁关闭及其相连接路段的影响,精度的变异性比卑尔根和悉尼更大。 事实上,平均 RMSE 与通过仿真获得的结果类似。
因此,结果证明了所提出的方法在估计不可观测部分流量及其在应对需求变化方面强大的能力。 同时,结果也揭示了单凭数据驱动方法的缺陷,其在应对供应端变化面前显得无计可施。 然而,这种估计网络范围流量的能力可能是丰富或更新仿真初始条件的有用方法。 机器学习可以大力加强基于仿真的预测,提高其准确性并降低需求变化带来的计算时间成本。 而仿真则担负预测供应端在异常交通条件下的交通预测。将机器学习和仿真结合,为我们提供了一个最可靠且可行的方法。
分享
Aimsun Next 20
Aimsun Next 8.4
Aimsun Next 20
@manual {AimsunManual,
title = {Aimsun Next 20 User’s Manual},
author = {Aimsun},
edition = {Aimsun Next 20.0.3},
address = {Barcelona, Spain},
year = {2021. [In software]},
month = {Accessed on: Month, Day, Year},
url = {qthelp://aimsun.com.aimsun.20.0/doc/UsersManual/Intro.html},
}
Aimsun Next 8.4
@manual {AimsunManual,
title = {Aimsun Next 8.4 User’s Manual},
author = {Aimsun},
edition = {Aimsun Next 8.4.4},
address = {Barcelona, Spain},
year = {2021. [In software]},
month = {Accessed on: Month, Day, Year},
url = {qthelp://aimsun.com.aimsun.8.4/doc/UsersManual/Intro.html},
}
Aimsun Next 20
TY – COMP
T1 – Aimsun Next 20 User’s Manual
A1 – Aimsun
ET – Aimsun Next Version 20.0.3
Y1 – 2021
Y2 – Accessed on: Month, Day, Year
CY – Barcelona, Spain
PB – Aimsun
UR – [In software]. Available: qthelp://aimsun.com.aimsun.20.0/doc/UsersManual/Intro.html
Aimsun Next 8.4
TY – COMP
T1 – Aimsun Next 8.4 User’s Manual
A1 – Aimsun
ET – Aimsun Next Version 8.4.4
Y1 – 2021
Y2 – Accessed on: Month, Day, Year
CY – Barcelona, Spain
PB – Aimsun
UR – [In software]. Available: qthelp://aimsun.com.aimsun.8.4/doc/UsersManual/Intro.html