1. 引言
当今世界面临的诸多挑战之一是城市的可持续发展。随着超大城市的不断发展,它们的增长越来越受有限的地上空间限制。为了克服这一限制,城市开始将地下空间用于各种用途,研究发现使用地下交通凯发国际一触即发的解决方案,特别是在交通节点和中央商务区等高度发达地区,可节约土地资源,减少噪音和污染,缓解交通堵塞[1]。如今越来越多的快速路采用了隧道的建设形式[2],然而隧道中产生的事故往往更加危险,产生的影响也更加严重[4]。以往的研究表明行车速度和安全会受到道路线形设计的影响[3],设计不当的曲线会导致司机在行驶过程中过度改变速度,从而增加驾驶风险[5]。因此准确预测隧道中的运行速度,对隧道的交通安全性和几何设计的评估非常重要。
近年来,国内外研究者针对各类道路开发了多种运行速度预测模型。往往通过分析不同的自变量如速度限制、车道宽度、路肩宽度、曲率和坡度等,利用回归分析、神经网络以及模糊理论等方法建立运行速度预测模型。polus等[6]建立了线性回归模型来通过直线段前后平曲线的平均曲率预测直线段上的运行速度。jacob和anjaneyulu [7]对路段中直线和曲线路段建立了运行速度预测模型,发现曲线的半径和长度是预测曲线中点速度的重要变量。符锌砂等[8]通过模糊理论构建了理想运行速度预测模型。russo等[9]考虑了路段长度、车道宽度、道路单元曲率、均匀路段曲率变化率和每公里住宅车道数,使用了普通最小二乘法分别建立了直线、平曲线和直线与平曲线情况下的运行速度预测模型。郭启明等[10]通过驾驶模拟实验采集运行速度数据,考虑坡度、超高和曲率,建立了山区高速公路运行速度预测模型。田佩汐等[11]将使用向量自回归模型建立了运行速度预测模型发现线形的曲率和挠率都对运行速度有显著影响。庞建勋等[12]基于lstm神经网络建立了针对快速路的运行速度预测模型。张弛等[13]利用多元非线性回归方法建立了互通隧道小净距路段运行速度预测模型。在以往研究中运行速度预测模型参数的选取并不唯一,选择合适的参数对于构建运行速度预测模型至关重要。此外与真实道路实验相比驾驶模拟器具有可还原场景进行重复实验,可测试高危险驾驶场景,具有高安全性,经济性,高可控性,在运行速度建模中被广泛应用[14]。因此本文采用驾驶模拟器采集运行速度数据。
快速路隧道的地质和障碍要求工程师设计线形组合复杂的道路,此类道路在城市地上空间开发趋近完成的情况下将越来越多。为快速路隧道环境建立针对性的运行速度模型能为在设计阶段评价隧道设计、改善隧道几何线形和更好地理解隧道几何特征对运行速度产生的影响提供帮助。
2. 实验与数据准备
2.1. 实验场景设计
本研究使用的驾驶模拟器的硬件平台包括一个三自由度运动仿真平台,可以模拟车辆的起步抬头、刹车点头、颠簸等动作;一辆仪表齐全内饰完整的polo汽车;和一个环屏作为整个驾驶仿真系统的前景仿真。道路环境通过silab驾驶模拟平台模拟。仿真软件包括场景建模、车辆参数、场景脚本、实验仿真、数据分析等模块。
本研究模拟了两段双向三车道的快速路地下通道。第一段是通过正交实验法设计的17,900 m长实验路段,从该路段上获取的驾驶行为数据用于训练运行速度预测模型。第二段是8630 m长的参考北横通道地下路段设计的验证路段,该路段用于测试预测模型的泛化能力。这两段道路横截面和标志标线设计均相同。
2.1.1. 实验路段设计
我们在实验路段设计中考虑了以下影响因素:平曲线长度,平曲线半径,坡度,纵曲线类型,纵曲线与平曲线组合方式。坡度(5%,3.5%,2%,0.5%)、路段长度(100 m, 300 m, 500 m, 700 m)和路段半径(无,500 m,900 m,1400 m)分别考虑了四个水平。对于坡和平曲线组合的情况,我们还考虑了路段类型(上坡,下坡)的两个水平;对于竖曲线和平曲线组合的情况,我们还考虑了路段类型(上坡凹曲线,上坡凸曲线,下坡凹曲线,上坡凹曲线)和竖曲线位置(缓和曲线,曲线前部,曲线中部,曲线后部)这两个分别具有四水平的因素。为了找出具有代表性的线形组合简化实验,本研究采用了正交实验法设计实验道路,通过将曲线段分成坡和平曲线组合以及竖曲线与平曲线组合两大类并分别进行正交实验设计,总共得到32种有代表性的线型组合。然后将以上路段前后拼接并适当进行修改以确保实验路段设计符合规范要求[15]。实验路段的几何参数如图1所示。
figure 1. horizontal and vertical design parameters of experimental tunnel (forward)
图1. 实验路段(正向)平纵设计参数
2.1.2. 验证路段设计
验证路段参考现实中的北横通道隧道段的线性设计。北横通道是上海市内连接长宁区、普陀区、静安区、虹口区及杨浦区的城市快速路,也是上海主干路网的组成部分之一。而北横通道西段隧道采用大直径盾构单管双层隧道布置。在北横通道隧道路段中最小的弯道半径为300米,最大的弯道半径为10,000米,路段内平均曲率0.001;共有下坡5级,上坡8级,最大上坡下坡坡度均为5%,路段内平均坡度2%。为了避开地面和地下的障碍物,北横通道的平纵曲线组合较为复杂,因此我们利用北横通道隧道段的几何线型建立验证路段以评价模型的泛化能力。验证路段的几何参数如图2所示。
figure 2. horizontal and vertical design parameters of verification tunnel
图2. 验证路段平纵设计参数
2.2. 实验数据收集
总共有21名男性驾驶员和5名女性驾驶员参与了实验,年龄在24到49岁之间,平均为29.4岁,标准差为7.9。为了满足自由流速度的要求,确保驾驶员的速度不受道路环境因素的影响,所有参与者都在相同的路面条件下驾驶,并且模拟道路上没有其他车辆,限速设置为100 km/h,模拟汽车为自动挡。
实验分为准备、热身和测试三个阶段进行。在准备阶段,参与者被要求完成一份调查问卷,包括个人信息,驾驶经历和驾驶行为。并简要介绍了模拟车辆的操作。在热身阶段,参与者进行10分钟的驾驶练习。在测试阶段,每个参与者从头到尾在实验路段上行驶一次,休息5分钟后在相反方向再行驶一次,完成后再休息五分钟并在验证路段上行驶一次。实验结束后填写参与者眩晕和反馈调查问卷。反馈调查结果表明超过85%的司机认为驾驶条件和道路场景满足实验需要。在实验过程中以20 hz的频率采样每个驾驶员的速度和其他运动特征。为了对同一地点的不同驾驶员进行比较,每隔五米计算一次前后2.5米内平均速度。计算公式如式(1)所示
(1)
其中:n为计算断面前后2.5米内采得的速度数量,
为第i个速度测样点距离计算断面的距离,
为该采样点获得的速度。由于驾驶员通常在旅程开始时加速,在结束时减速停车,因此距离起点1公里内和距离终点1公里内的数据被排除在分析之外。所有驾驶员完成实验后,通过集计每个点处所有驾驶员的个体速度获得第85百分位速度。
3. 模型构建
驾驶员在道路上某处的驾驶行为受到沿道路的已经过和未经过的区域影响,既受到上游路段线形特征、当前位置以及下游路段线形特征影响。上游路段是驾驶员刚通过的路段,其线形是当前位置车速的基础;当前位置是驾驶员所处的路段,其几何特征对速度的影响反映了驾驶员当下对路段的感受;下游路段是驾驶员尚未行驶到的路段,其线形决定了驾驶员所期望的车速,不同的下游路段类型将对运行速度产生不同影响。此外驾驶员会对道路特征的明显变化做出反应,因此区间内的几何特征中还包括区间内几何特征的变化量。为了建立运行速度模型,需要在驾驶员当前位置的一定距离内的区间提取这些几何特征,以建立几何特征与运行速度之间的关系。车速预测模型的结构如式(2)所示。
(2)
其中,
是当前位置的预测车速;
、
和
是道路几何特征变量,分别代表上游路段、当前位置的几何特征以及上下游路段间几何特征的差值;
、
和
是对应的模型系数;
是模型的误差项。在下游路段中使用上下游路段间几何特征的差值是为了消除上下游特征之间的相关性,并反映上下游路段特征变化对驾驶员产生的影响。为了确保模型不过于复杂,将通过观察模型估计的结果保留有意义的特征。上游和下游的路段范围通过使用几个固定长度和可变长度对模型进行重复估计确定。对于上游路段考虑了以50 m为最小单位的从0 m到600 m的全部长度,对于下游路段考虑了视距范围内的几何特征,这是因为隧道内视线严重受限,我们希望输入模型内的特征与驾驶员感知一致。
运行速度的影响因素包括速度限制、车道宽度、路肩宽度、曲率和坡度等。在本研究中主要考虑道路的平纵线型,所以将曲率和坡度作为两个主要几何设计参数。提取当前位置和上下游路段内的曲率和坡度值,包括极值、平均值、变化量和分类变量,作为潜在的解释变量,在上游路段,当前路段和下游路段中选取的特征如表1所示。当前路段为仅包含当前样本中车辆所处道路断面的区间。下游路段中各坡度和曲率的最大值,最小值和平均值特征值皆取与上游路段对应特征的差值。
table 1. features calculated in each segment
表1. 各区间中计算的特征
特征 |
类型 |
计算方法 |
区间平均曲率 |
连续 |
该区间内的各道路断面的曲率平均值(1/m) |
区间平均绝对曲率 |
连续 |
该区间内的各道路断面的曲率绝对值的平均值(1/m) |
区间最大绝对曲率 |
连续 |
该区间内的各道路断面中最大曲率的绝对值(1/m) |
区间最小绝对曲率 |
连续 |
该区间内的各道路断面中最小曲率的绝对值(1/m) |
区间内平曲线路段占比 |
连续 |
该区间内各个道路断面中位于平曲线上的断面占比 |
区间内是否存在路段线形变化 |
离散 |
该区间内曲线之间和平曲线与直线之间的断面数量(0或1) |
区间内平曲线上右转路段占比 |
连续 |
该区间内的各平曲线上道路断面中处于右转路段的断面占比 |
区间平均坡度 |
连续 |
该区间内的各道路断面的坡度平均值(m/m) |
区间最大坡度 |
连续 |
该区间内的各道路断面中的最大坡度(m/m) |
区间最小坡度 |
连续 |
该区间内的各道路断面中的最小坡度(m/m) |
区间平均绝对坡度 |
连续 |
该区间内的各道路断面坡度绝对值的平均值(m/m) |
上坡路段占比 |
连续 |
该区间内的各道路断面中处于上坡路段的断面占比 |
区间内是否存在变坡 |
离散 |
该区间内是否存在坡度变化(0或1) |
区间内竖曲线路段占比 |
离散 |
区间内的竖曲线上路段占全部路段比例 |
区间内坡度变化 |
连续 |
区间内各断面坡度中较后出现的极值减较前出现的极值(m/m) |
区间内曲率变化 |
连续 |
区间内各断面曲率中较后出现的极值减较前出现的极值(1/m) |
此外由于本研究中建模使用的运行速度是在以5 m为间隔的点上连续采样得到的。样本之间存在相关,因此模型误差分布并不独立。因此我们采用了混合线性回归模型以考虑空间自相关的影响。为了获得线性混合模型中系数的无偏估计,采用了三种不同的协方差结构来解释误差的自相关性:球面(sph),空间幂(pow)和对数线性(linl)。三种协方差结构如下式(3~5)所示。
sph:
(3)
pow:
(4)
linl:
(5)
式中
为误差协方差元素,
为确定各协方差结构中空间自相关程度的参数,
为第i点与第j点之间的距离。我们尝试了欧氏距离和行驶里程间距两种距离计算方式以计算协方差结构。
4. 模型结果
4.1. 模型参数选择
道路特征统计范围对模型结果有较大影响,若统计范围过大,将掩盖重要特征的影响,若统计范围过小则会缺少重要特征。因此本文对上游路段特征统计范围尝试了以50 m为最小单位从0 m到600 m的全部长度。发现当上游路段特征统计范围为250 m时模型预测能力最好,具有更高的拟合度。为了消除样本间的空间自相关性产生的误差,我们尝试了不同协方差结果和距离计算方式,发现使用欧式距离考虑空间幂函数结构的空间协方差时模型具有最高的拟合度。然后我们逐步删除模型中最不显著的特征直到模型的赤池信息量准则(aic)达到最低值,以保证模型具有恰当的复杂度。利用残差图检查最终得到的混合线性回归模型,结果显示残差服从正态分布,不存在明显的异方差问题,模型考虑的几何特征与运行速度之间存在线性相关关系。使用方差膨胀系数(vif)对模型进行共线性检验,结果显示模型考虑的各特征间的vif均小于10,模型保留的特征之间没有明显的共线性问题。该运行速度预测模型在实验路段上调整后
为0.58,模型拟合程度较好,能反应运行速度随路段几何特征变化而产生的改变。
4.2. 模型显著变量解释
table 2. operating speed model parameter estimation result
表2. 运行速度模型参数估计结果
变量 |
系数 |
标准误差 |
p值 |
上游路段平均曲率 |
159.3662 |
94.4080 |
0.0915 |
上游路段绝对值平均曲率 |
−709.9906 |
149.1866 |
<0.0001 |
上游路段平均坡度 |
−52.2137 |
4.7234 |
<0.0001 |
下游路段与上游路段间绝对值最小曲率差值 |
−83.5171 |
39.0790 |
0.0327 |
下游路段中右转路段占比 |
0.1845 |
0.0769 |
0.0165 |
截距 |
30.9605 |
157.6472 |
<0.0001 |
混合线性回归模型的各参数估计结果如表2所示。模型中共有五个显著特征:上游路段的平均曲率,上游路段的绝对值平均曲率,上游路段的平均坡度,下游路段和上游路段间的绝对值最小曲率差值和下游路段的右转路段占比。
上游路段的平均曲率:该特征在计算时右转为正,左转为负。曲率是半径的倒数,直线路段上曲率为0。该特征的系数为正数,说明当上游路段左转路段平均曲率的绝对值大于右转路段平均曲率的绝对值时,当前位置的运行速度预测值会降低;当上游路段左转路段平均曲率的绝对值小于右转路段平均曲率的绝对值时,当前位置的运行速度预测值会升高。既在上游通过右转路段时会比通过左转路段时有更高的运行速度。
上游路段的绝对值平均曲率:该特征在计算时通过将上游路段内的各道路截面的曲率取绝对值后平均得到。绝对值平均曲率的大小反应了路段的弯曲程度。该特征的系数为负值,反应了驾驶员在通过弯曲程度较高的路段后会选择较低的运行速度,路段的弯曲程度越高,运行速度越低。
上游路段的平均坡度:该特征在计算时通过将上游路段内各道路界面的坡度值取平均值得到,在计算时上坡坡度为正值,下坡坡度为负值。平均坡度反应了路段总体性的坡度情况。该特征的系数为负值,反应了在通过上坡后会选择较低的运行速度,通过下坡后会选择较高的运行速度。且运行速度的上升和下降幅度随坡度绝对值的增大而增大。
下游路段和上游路段间的绝对值最小曲率差值;该特征通过计算下游路段的绝对值最小曲率减去上游路段的绝对值最小曲率得到。绝对值最小曲率差值反应了上游和下游间的道路弯曲程度变化情况,该特征的系数为负数,说明了驾驶员在下游路段弯曲程度增大时速度的减小量随着弯曲程度的增大而增大,当弯曲程度不变时运行速度也不发生变化。在下游路段弯曲程度减小时,运行速度随着弯曲程度的减小而增大。
下游路段的右转路段占比:该特征通过计算下游路段的所有不在直线上的道路截面中右转截面的占比得到。该特征的系数为正值即在下游路段将要通过右转路段时会比通过左转路段时有更高的运行速度。
4.3. 模型预测能力
根据实验路段样本拟合得到的混合线性回归模型的参数,对实验路段和验证路段的运行速度分别进行预测。并通过均方根误差(rmse)、平均绝对误差(mae)和拟合优度(
)评价模型的预测结果。以上三种指标的计算公式如下式(6~8)所示:
(6)
(7)
(8)
式中
是样本观测值,
是模型对对应样本的预测值,
是所有样本的均值。度量拟合优度的统计量是确定系数
,它的值越接近1,说明回归直线对观测值的拟合程度越好。rmse是预测值与真实值之差的平方与观测次数n比值的平方根,mae是预测值和观测值之间绝对误差的平均值。与mae相比rmse针对异常值更敏感。
与传统的基于点的运行速度预测模型不同,我们对驾驶员在路段上任何位置的速度变化行为都没有任何假设,每个断面的速度都是通过一个模型预测得到的。为了评估所得模型的可靠性,计算了平均绝对误差(mae)和均方根误差(rmse)。结果表明,该模型在速度预测上表现良好,所有速度观测值在验证路段上的
为0.43、mae为2.95 km/h、rmse为3.44 km/h,在实验路段上的
为0.58、mae为3.49 km/h、rmse为4.33 km/h。本模型在实验路段和验证路段上的预测误差均较小,说明了选择的特征对驾驶员的行为具有解释性。此外在验证路段上较小的误差反应了该模型具有较好的泛化能力。图3为在验证路段上通过驾驶模拟实验获取的运行速度和模型通过道路几何特征预测的运行速度对比图,可以看到预测曲线和实测曲线拟合良好,预测到的速度分布能够反应实验得到的速度变化趋势,很好地捕捉了驾驶员群体的速度变化行为。
figure 3. comparison of predicted speed and measured speed on verification tunnel
图3. 验证路段预测与实测速度对比
5. 结论
准确预测隧道中的运行速度,对隧道的交通安全性和几何设计的评估非常重要。本文利用了考虑空间自相关的混合线性回归模型建立了快速路隧道内任意位置的运行速度预测模型。该模型利用从相邻的上下游段以及驾驶员当前位置提取的几何参数来预测运行速度。研究发现考虑空间幂结构的协方差和欧式距离时模型预测效果最好。预测断面上游250米范围内的平均曲率,绝对值平均曲率和平均坡度,直到当前所处断面最远可见处的下游路段的右转路段占比以及下游路段和上游路段间的绝对值最小曲率差值是对车辆所处断面的运行速度预测最重要的几何特征。利用仿照上海市北横通道线形设计的验证路段上获取的数据进行的样本外测试表明,该模型预测的运行速度能反应实测运行速度的变化趋势,且能对样本外数据进行预测,具有较强的泛化能力,对验证路段进行的预测所有速度观测值的平均mae为2.95 km/h,rmse为3.44 km/h。本文验证了通过驾驶模拟器和混合线性回归建立运行速度预测模型的可行性。该模型能为在设计阶段评价隧道设计、改善隧道几何线形和更好地理解隧道几何特征对运行速度产生的影响提供帮助。