1.本发明涉及交
通流量预测技术领域,具体地涉及一种面向时空图自编码器的交通流量预测方法。
背景技术:
2.交通流量预测是智能交通系统(itss)和先进交通管理系统(atmss)的重要组成部分。获取及时准确的交通流量信息是实现交通控制和制定交通管理的关键,通过预测未来的交通状况,进而设计有效的交通组织策略以缓解交通拥堵,提高城市交通系统的服务水平和管理效率。
3.然而,当前大多数方法都是假设先验的、静态的、无定向的交通拓扑图,与交通流节点之间的实际动态交互属性不相匹配。因此,探索交通流动态交互的建模方法和捕捉时空依赖性的方法是关键技术问题。对于具有非欧几里得结构的图数据,
卷积神经网络等深度学习模型无法直接利用。基于图神经力网络模型的交通流预测方法可以解决该问题,这些模型的空间关系是通过将相邻节点的信息聚合到目标节点来发现。目前,基于gcn的模型依赖于图的先验信息,要求每个输入都有相同的图结构,因此它们不能在模型迁移过程时从新的拓扑结构中学习空间特征。基于注意力机制的模型被广泛应用于深度学习任务,它可以从所有输入中选择对当前任务相对关键的信息。
4.但是,现有基于图注意力网络的方法仅考虑了交通流的单层空间动态依赖性,而忽略了复杂的交通转换规律性具有多层性质的事实,从而导致交通流量预测精度低的技术问题。
技术实现要素:
5.本发明所要解决的技术问题是针对上述现有技术的不足,提供一种面向时空图自编码器的交通流量预测方法,提高交通流量预测的准确性和鲁棒性,该方法考虑了交通流的时空相关性的影响权重,提升了捕捉交通流量非线性特征的能力,有效提高了交通流量预测的准确性和鲁棒性,解决了交通流时空依赖性建模复杂且困难的问题。
6.本发明解决上述技术问题的技术方案如下:
7.一种面向时空图自编码器的交通流量预测方法,包括:
8.
步骤1:使用改进的ha-rts算法平滑处理给定的交通流样本数据;
9.步骤2:由encode层对步骤1处理的交通流样本数据进行编码,编码是指各模块通过参数学习将输入数据输出为包含了预测信息的隐藏特征,其中,encode层是由稀疏特征的全连接层、捕捉时间依赖性的记忆
门控卷积模块gmcnn和建模多层次空间依赖性的多层注意力网络模块mgan所构建;
10.步骤3:由多层注意力网络模块、记忆门控卷积模块和全连接层构建的decode层对步骤2的encode层中得到的隐藏特征解码为预测值,解码是指各模块通过参数学习将隐藏特征映射为预测目标,由此得到交通流量预测结果。
11.优选的,所述的步骤1的ha-rts(
·
)具体处理步骤如下:
12.步骤1.1:城市交通系统中交通流的状态随时间演变的过程用公式(1)表示为一阶马尔可夫链,用公式(2)表示交通流状态的观测过程:
13.zk=ak(z
k-1
)=φ
k,k-1zk-1
+wkꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
14.xk=bk(zk)=γkzk+vkꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
15.其中,ak(
·
)是交通流状态的演变函数,zk表示当前第k步的交通流状态值,z
k-1
表示上一步状态值,φ
k,k-1
表示一步转移矩阵,wk表示交通流演变系统的噪声,bk(
·
)表示交通流状态的观测函数,xk表示当前交通流状态观测值,γk表示观测矩阵,vk表示观测噪声;
16.步骤1.2:设为第h天第k时刻的交通流状态观测值,则得到一天中第k时刻的交通流状态均值其中h为历史数据中第k时刻的交通流状态数据统计个数,由此对第k时刻的缺失或异常的数值进行填充,公式如下:
[0017][0018]
步骤1.3:建立表征预测性能的协方差矩阵和系统状态模型,实现对系统状态及系统噪声随时间演变的估计:
[0019][0020][0021]
其中,为一步预测协方差矩阵,表示一步预测值,表示一步转移矩阵,w
k-1
为系统噪声矩阵,上标f表示滤波过程,k=0,1,
…
,n;
[0022]
步骤1.4:计算卡尔曼滤波增益矩阵,基于系统量测信息进行状态修正,给出表征滤波性能的协方差阵:
[0023][0024][0025][0026]
其中,为滤波增益矩阵,γk为观测矩阵,vk为观测噪声矩阵,xk为观测值,为状态变量z的滤波值,为滤波协方差矩阵;
[0027]
步骤1.5:基于前向卡尔曼滤波的结算数据的后向平滑解算,还原在卡尔曼模型下的交通流真实状态值,即最优平滑估计值:
[0028][0029]
[0030][0031][0032]
其中,为系统k时刻状态的最优平滑估计,为平滑增益真,为平滑协方阵,上标s表示后向平滑过程,k=n,n-1,
…
,0。
[0033]
优选的,所述步骤2具体为:
[0034]
步骤2.1:将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
),输出隐藏时空特征;
[0035]
步骤2.2:将步骤2.1得到的隐藏时空特征x
in
输入门控记忆卷积神经网络,经过处理后输出g
out
;
[0036]
步骤2.3:将步骤2.2的g
out
输入多层注意力网络模块mgan(
·
),经过处理后得到隐藏空间特征。
[0037]
优选的,所述步骤2.1具体为:
[0038]
将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
):
[0039][0040]
其中,x
in
为输出的隐藏时空特征,为步骤1的输出结果,即最优平滑估计;w与b为网络的学习参数。
[0041]
优选的,所述步骤2.2具体为:
[0042]
步骤2.2.1:将步骤2.1得到的隐藏时空特征x
in
输入门控记忆卷积神经网络,经过因果卷积得到g
in
,再输入到门控单元,由于特征x
in
的时间长度经过卷积层后会变短,需对其进行裁切以得到残差x
residual
,计算公式如下:
[0043]gin
=conv
causal
(x
in
),
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0044]
x
residual
=crop[align(x
in
)],
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0045]
其中conv
causal
(
·
)为因果卷积函数,align(
·
)为维度变换函数;
[0046]
步骤2.2.2:将步骤2.1.1得到的x
residual
与g
in
拼接并使用1
×
1卷积核进行因果卷积变换,再经过sigmoid激活,得到遗忘门r和记忆门z的门值,r和z的计算公式如下:
[0047][0048][0049]
其中是卷积核为1
×
1的2维卷积函数,d表示维数;
[0050]
步骤2.2.3:时空特征g
in
通过步骤2.2.2得到的遗忘门r选择性保留后与x
residual
相加,再经过1
×
1卷积核卷积变换和全连接层linear(
·
)激活后,得到新的时空特征计算公式如下:
[0051]
[0052]
步骤2.2.4:记忆门z作用在步骤2.2.3的而1-z作用在g
in
上,随后将两者与残差x
residual
相加,经过prelu激活,得到隐含状态输出g
out
,计算公式如下:
[0053][0054]
优选的,所述步骤2.3具体如下:
[0055]
步骤2.3.1:在时间区间τ=(t-τ+1,t-τ+2,...,t)内,将多层空间图表示为g
τ
=(v,a
τ
),其中v={vi|i=1,2,3,...,n}是图g
τ
中交通流检测节点vi的集合,a
τ
=(a
t-τ+1
,a
t-τ+2
,...,a
t
)表示时间区间τ内的权重连接张量,a
t
为t时刻权重连接矩阵,表示t时刻节点vi到节点vj的权重信息,因为使用多头注意力机制,所以其中m为多头注意力机制的头数;
[0056]
步骤2.3.2:根据步骤2.3.1构建的多层空间图g
τ
=(v,a
τ
),拆分t时刻节点vi的输入与节点vj的输入得到输入张量其中输入张量是步骤2.2的输出,m=1,2,...m,输入张量的通道数为dm;
[0057]
步骤2.3.3:步骤2.3.2的经过全连接神经网络linearq与lineark后分别生成查询向量与键值向量,再经过缩放点积,得到节点vi与vj的注意力得分的注意力得分计算公式如下:
[0058][0059]
步骤2.3.4:通过softmax函数对注意力得分进行归一化,得到t时刻两点的权重值表明节点j的交通流与节点i的交通流的空间相关性大小,计算公式如下:
[0060][0061]
步骤2.3.5:将权重值加入dropout神经元随机丢弃机制,模拟城市交通中的突发事件对交通流节点之间相关性的影响,经卷积计算后得到隐藏空间特征计算公式如下:
[0062][0063]
其中,为mgan层的输出,w
t,m
为可学习的参数矩阵,m为多头注意力的头数,为mgan层的输入,σ(
·
)为sigmoid激活函数。
[0064]
优选的,所述步骤3的decode层为包括依次设置的多层注意力网络模块mgan(
·
)、
记忆门控卷积模块gmcnn(
·
)和稀疏特征的全连接层linear(
·
),且mgan(
·
)、gmcnn(
·
)和linear(
·
)的操作步骤与步骤2相同。
[0065]
优选的,由encode层和decode层构建时空图自编解码网络stgae(
·
),并输出流通流量的预测数据,具体为:
[0066][0067]
其中,x
τ
为交通流样本数据,为stgae网络得到的交通流预测数据,encode(
·
)为步骤2中的encode层,decode(
·
)为步骤3中的decode层,layernorm(
·
)表示在通道维度中进行规一化。
[0068]
优选的,对预测数据所对应的真实值y
t
同样进行平滑处理,以消除网络在训练过程中的噪声,由此得到网络stgae训练过程中的损失函数为:
[0069][0070]
与现有技术相比,本发明的有益效果是:
[0071]
本发明集成了自适应生成多层注意力矩阵建模多层次动态空间依赖关系的多层注意力神经网络(mgan),以及为序列化的隐藏特征提供并行计算和非线性处理能力的门控记忆卷积神经网络(gmcnn),并采取平滑网络训练法(nst)去除模型训练中所受观测噪声影响。有效地提高交通流量预测的准确性和鲁棒性,解决了交通流时空依赖性建模复杂且困难的问题。
附图说明
[0072]
附图用以提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一并用于解释本发明,并不构成对本发明的限制。
[0073]
在附图中:
[0074]
图1面向时空图自编解码网络stgae的交通流预测框架;
[0075]
图2多层注意力神经网络mgan;
[0076]
图3门控记忆卷积神经网络gmcnn;
[0077]
图4网络平滑训练法nst流程;
[0078]
图5ha-rts算法框架;
[0079]
图6本发明的方法流程图。
[0080]
本发明中名词解释如表1所示:
[0081]
表1
[0082]
[0083]
具体实施方式
[0084]
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0085]
实施例:
[0086]
参照附图1-6所示,在面向时空图自编码器的交通流量预测方法中采取端对端框架,集成了自适应生成多层注意力矩阵建模多层次动态空间依赖关系的多层注意力神经网络(mgan)(通过扩展多层自注意力机制来建模多层动态空间依赖,自适应地生成多层注意矩阵),以及为序列化的隐藏特征提供并行计算和非线性处理能力的门控记忆卷积神经网络(gmcnn)(在卷积神经网络中引入了遗忘门和记忆门,可以为序列化隐藏特征提供并行计算和非线性处理,以提高执行效率和非线性逼近能力),并采取平滑网络训练法(nst)(平滑输入数据和目标数据的噪声,以提高系统鲁棒性)去除模型训练中所受观测噪声影响。有效地提高交通流量预测的准确性和鲁棒性,解决了交通流时空依赖性建模复杂且困难的问题。
[0087]
一种面向时空图自编码器的交通流量预测方法,包括:
[0088]
步骤1:使用改进的ha-rts算法平滑处理给定的交通流样本数据。从而忽略输入数据中的噪声,并从数据中得到更多有价值的信息。具体如下:
[0089]
步骤1.1:城市交通系统中交通流的状态随时间演变的过程用公式(1)表示为一阶马尔可夫链,用公式(2)表示交通流状态的观测过程:
[0090]
zk=ak(z
k-1
)=φ
k,k-1zk-1
+wkꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0091]
xk=bk(zk)=γkzk+vkꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0092]
其中,ak(
·
)是交通流状态的演变函数,zk表示当前第k步的交通流状态值,z
k-1
表示上一步状态值,φ
k,k-1
表示一步转移矩阵,wk表示交通流演变系统的噪声,bk(
·
)表示交
通流状态的观测函数,xk表示当前交通流状态观测值,γk表示观测矩阵,vk表示观测噪声;
[0093]
步骤1.2:设为第h天第k时刻的交通流状态观测值,则得到一天中第k时刻的交通流状态均值其中h为历史数据中第k时刻的交通流状态数据统计个数,由此对第k时刻的缺失或异常的数值进行填充,公式如下:
[0094][0095]
步骤1.3:建立表征预测性能的协方差矩阵和系统状态模型,实现对系统状态及系统噪声随时间演变的估计:
[0096][0097][0098]
其中,为一步预测协方差矩阵,表示一步预测值,表示一步转移矩阵,w
k-1
为系统噪声矩阵,上标f表示滤波过程,k=0,1,
…
,n;
[0099]
步骤1.4:计算卡尔曼滤波增益矩阵,基于系统量测信息进行状态修正,给出表征滤波性能的协方差阵:
[0100][0101][0102][0103]
其中,为滤波增益矩阵,γk为观测矩阵,vk为观测噪声矩阵,xk为观测值,为状态变量z的滤波值,为滤波协方差矩阵;
[0104]
步骤1.5:基于前向卡尔曼滤波的结算数据的后向平滑解算,还原在卡尔曼模型下的交通流真实状态值,即最优平滑估计值:
[0105][0106][0107][0108][0109]
其中,为系统k时刻状态的最优平滑估计,为平滑增益真,为平滑协方阵,上标s表示后向平滑过程,k=n,n-1,
…
,0。
[0110]
步骤2:由encode层对步骤1处理的交通流样本数据进行编码,编码是指各模块通
过参数学习将输入数据输出为包含了预测信息的隐藏特征,其中,encode层由稀疏特征的全连接层、捕捉时间依赖性的记忆门控卷积模块gmcnn和建模多层次空间依赖性的多层注意力网络模块mgan所构建。
[0111]
步骤2.1:将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
),输出隐藏时空特征。具体为:将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
):
[0112][0113]
其中,x
in
为输出的隐藏时空特征,为步骤1的输出结果,即最优平滑估计;w与b为网络的学习参数。
[0114]
步骤2.2:结合cnn的并行计算、梯度稳定性和结构简单的优点以及gru网络中的门控机制,使得gmcnn模块在捕获长距离序列时避免耗时的迭代传播和梯度消失/爆炸的问题。特别地,gmcnn模块中的门控存储器单元可以挥发冗余的时空特征并增强长期的时间特征,以提高预测精度。将步骤2.1得到的隐藏时空特征x
in
输入gmcnn模块,经过处理后输出g
out
;具体为:
[0115]
步骤2.2.1:将步骤2.1得到的隐藏时空特征x
in
输入门控记忆卷积神经网络,经过因果卷积得到g
in
,再输入到门控单元,由于特征x
in
的时间长度经过卷积层后会变短,需对其进行裁切以得到残差x
residual
,计算公式如下:
[0116]gin
=conv
causal
(x
in
),
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0117]
x
residual
=crop[align(x
in
)],
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0118]
其中conv
causal
(
·
)为因果卷积函数,align(
·
)为维度变换函数;
[0119]
步骤2.2.2:将步骤2.1.1得到的x
residual
与g
in
拼接并使用1
×
1卷积核进行因果卷积变换,再经过sigmoid激活,得到遗忘门r和记忆门z的门值,r和z的计算公式如下:
[0120][0121][0122]
其中是卷积核为1
×
1的2维卷积函数,d表示维数;
[0123]
步骤2.2.3:时空特征g
in
通过步骤2.2.2得到的遗忘门r选择性保留后与x
residual
相加,再经过1
×
1卷积核卷积变换和全连接层linear(
·
)激活后,得到新的时空特征计算公式如下:
[0124][0125]
步骤2.2.4:记忆门z作用在步骤2.2.3的而1-z作用在g
in
上,随后将两者与残差x
residual
相加,经过prelu激活,得到隐含状态输出g
out
,计算公式如下:
[0126][0127]
步骤2.3:根据节点交通流状态的相似性来确定节点之间的权重,并以此刻画节点
间相互影响的关系。在此基础上构建表征交通流节点之间结构关系的空间图,用于描述交通流节点之间的结构关系,并从时间维度引入了多层空间图。针对交通流节点的多层次动态交互特性,基于多层注意力神经网络(mgan),将多层时间信号映射到共同的潜在表征中,以实现对交通流扩散过程的模拟,由此提高模型的预测精度。将步骤2.2的g
out
输入多层注意力网络模块mgan(
·
),经过处理后得到隐藏空间特征。具体如下:
[0128]
步骤2.3.1:在时间区间τ=(t-τ+1,t-τ+2,...,t)内,将多层空间图表示为g
τ
=(v,a
τ
),其中v={vi|i=1,2,3,...,n}是图g
τ
中交通流检测节点vi的集合,a
τ
=(a
t-τ+1
,a
t-τ+2
,...,a
t
)表示时间区间τ内的权重连接张量,a
t
为t时刻权重连接矩阵,表示t时刻节点vi到节点vj的权重信息,因为使用多头注意力机制,所以其中m为多头注意力机制的头数;
[0129]
步骤2.3.2:根据步骤2.3.1构建的多层空间图g
τ
=(v,a
τ
),拆分t时刻节点vi的输入与节点vj的输入得到输入张量其中输入张量是步骤2.2的输出,m=1,2,...m,输入张量的通道数为dm;
[0130]
步骤2.3.3:步骤2.3.2的经过全连接神经网络linearq与lineark后分别生成查询向量与键值向量,再经过缩放点积,得到节点vi与vj的注意力得分的注意力得分计算公式如下:
[0131][0132]
步骤2.3.4:通过softmax函数对注意力得分进行归一化,得到t时刻两点的权重值表明节点j的交通流与节点i的交通流的空间相关性大小,计算公式如下:
[0133][0134]
步骤2.3.5:将权重值加入dropout神经元随机丢弃机制,模拟城市交通中的突发事件对交通流节点之间相关性的影响,经卷积计算后得到隐藏空间特征计算公式如下:
[0135][0136]
其中,为mgan层的输出,w
t,m
为可学习的参数矩阵,m为多头注意力的头数,为mgan层的输入,σ(
·
)为sigmoid激活函数。
[0137]
步骤3:由多层注意力网络模块、记忆门控卷积模块和全连接层构建的decode层对
步骤2的encode层中得到的隐藏特征解码为预测值,解码是指各模块通过参数学习将隐藏特征映射为预测目标,由此得到交通流量预测结果。所述decode层为包括依次设置的多层注意力网络模块mgan(
·
)、记忆门控卷积模块gmcnn(
·
)和稀疏特征的全连接层linear(
·
),且mgan(
·
)、gmcnn(
·
)和linear(
·
)的操作步骤与步骤2相同。具体为:
[0138]
步骤3.1:多层注意力网络模块mgan(
·
),具体如下:
[0139]
步骤3.1.1:在时间区间τ=(t-τ+1,t-τ+2,...,t)内,将多层空间图表示为g
τ
=(v,a
τ
),其中v={vi|i=1,2,3,...,n}是图g
τ
中交通流检测节点vi的集合,a
τ
=(a
t-τ+1
,a
t-τ+2
,...,a
t
)表示时间区间τ内的权重连接张量,a
t
为t时刻权重连接矩阵,表示t时刻节点vi到节点vj的权重信息,因为使用多头注意力机制,所以其中m为多头注意力机制的头数;
[0140]
步骤3.1.2:根据步骤2.1构建的多层空间图g
τ
=(v,a
τ
),拆分t时刻节点vi的输入与节点vj的输入得到输入张量输入张量的通道数为dm;
[0141]
步骤3.1.3:步骤2.2的经过全连接神经网络linearq与lineark后分别生成查询向量与键值向量,再经过缩放点积,得到节点vi与vj的注意力得分的注意力得分计算公式如下:
[0142][0143]
步骤3.1.4:通过softmax函数对注意力得分进行归一化,得到t时刻时两点的权重值表明节点j的交通流与节点i的交通流的空间相关性大小。计算公式如下:
[0144][0145]
步骤3.1.5:将权重值加入dropout神经元随机丢弃机制,模拟城市交通中的突发事件对交通流节点之间相关性的影响,经卷积计算后得到隐藏空间特征计算公式如下:
[0146][0147]
其中,w
t,m
为可学习的参数矩阵,m为多头注意力的头数,为mgan层的输入,为mgan层的输出,σ(
·
)为sigmoid激活函数。
[0148]
步骤3.2:记忆门控卷积模块gmcnn(
·
),具体如下:
[0149]
步骤3.2.1:将隐藏时空特征x
in
输入门控记忆卷积神经网络,经过因果卷积得到gin
,再输入到门控单元,由于特征x
in
的时间长度经过卷积层后会变短,所以需要对其进行裁切以得到残差x
residual
,其计算公式如下:
[0150]gin
=conv
causal
(x
in
),
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(26)
[0151]
x
residual
=crop[align(x
in
)],
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(27)
[0152]
其中conv
causal
(
·
)为因果卷积函数,align(
·
)为维度变换函数,
[0153]
步骤3.2.2:将x
residual
与g
in
拼接并使用1
×
1卷积核进行卷积变换,再经过sigmoid激活,得到遗忘门r和记忆门z的门值,r和z的计算公式如下:
[0154][0155][0156]
步骤3.2.3:时空特征g
in
通过遗忘门r选择性保留后与x
residual
相加,再经过1
×
1卷积核卷积变换和全连接层激活后,得到新的时空特征计算公式如下:
[0157][0158]
步骤3.2.4:记忆门z作用在而1-z作用在g
in
上,随后将两者与残差x
residual
相加,经过prelu激活,得到隐含状态输出g
out
,计算公式如下:
[0159][0160]
步骤3.3:稀疏特征的全连接层linear(
·
),具体如下:
[0161]
linear(
·
)=wx+b,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(32)
[0162]
其中,x为输入,w与b为可学习参数。
[0163]
由encode层和decode层构建时空图自编解码网络stgae(
·
),并输出流通流量的预测数据,具体为:
[0164][0165]
其中,x
τ
为交通流样本数据,为stgae网络得到的交通流预测数据,encode(
·
)为步骤2中的encode层,decode(
·
)为步骤3中的decode层,layernorm(
·
)表示在通道维度中进行规一化。
[0166]
对预测数据所对应的真实值y
t
同样进行平滑处理,以消除网络在训练过程中的噪声,从而使得模型能够最大化学习过程中所忽略的噪声,并从数据中学习更多有价值的信息。由此得到网络stgae训练过程中的损失函数为:
[0167]
[0168]
集成了自适应生成多层注意力矩阵建模多层次动态空间依赖关系的多层注意力神经网络(mgan),以及为序列化的隐藏特征提供并行计算和非线性处理能力的门控记忆卷积神经网络(gmcnn),并采取平滑网络训练法(nst)去除模型训练中所受观测噪声影响。有效地提高交通流量预测的准确性和鲁棒性,解决了交通流时空依赖性建模复杂且困难的问题。
[0169]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都纳入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
技术特征:
1.一种面向时空图自编码器的交通流量预测方法,其特征在于:包括:步骤1:使用改进的ha-rts算法平滑处理给定的交通流样本数据;步骤2:由encode层对步骤1处理的交通流样本数据进行编码,编码是指各模块通过参数学习将输入数据输出为包含了预测信息的隐藏特征,其中,encode层是由稀疏特征的全连接层、捕捉时间依赖性的记忆门控卷积模块gmcnn和建模多层次空间依赖性的多层注意力网络模块mgan所构建;步骤3:由多层注意力网络模块、记忆门控卷积模块和全连接层构建的decode层对步骤2的encode层中得到的隐藏特征解码为预测值,解码是指各模块通过参数学习将隐藏特征映射为预测目标,由此得到交通流量预测结果。2.根据权利要求1所述的一种面向时空图自编码器的交通流量预测方法,其特征在于:所述的步骤1的ha-rts(
·
)具体处理步骤如下:步骤1.1:城市交通系统中交通流的状态随时间演变的过程用公式(1)表示为一阶马尔可夫链,用公式(2)表示交通流状态的观测过程:z
k
=a
k
(z
k-1
)=φ
k,k-1
z
k-1
+w
k
ꢀꢀꢀꢀ
(1)x
k
=b
k
(z
k
)=γ
k
z
k
+v
k
ꢀꢀꢀꢀ
(2)其中,a
k
(
·
)是交通流状态的演变函数,z
k
表示当前第k步的交通流状态值,z
k-1
表示上一步状态值,φ
k,k-1
表示一步转移矩阵,w
k
表示交通流演变系统的噪声,b
k
(
·
)表示交通流状态的观测函数,x
k
表示当前交通流状态观测值,γ
k
表示观测矩阵,v
k
表示观测噪声;步骤1.2:设为第h天第k时刻的交通流状态观测值,则得到一天中第k时刻的交通流状态均值其中h为历史数据中第k时刻的交通流状态数据统计个数,由此对第k时刻的缺失或异常的数值进行填充,公式如下:步骤1.3:建立表征预测性能的协方差矩阵和系统状态模型,实现对系统状态及系统噪声随时间演变的估计:声随时间演变的估计:其中,为一步预测协方差矩阵,表示一步预测值,表示一步转移矩阵,w
k-1
为系统噪声矩阵,上标f表示滤波过程,k=0,1,
…
,n;步骤1.4:计算卡尔曼滤波增益矩阵,基于系统量测信息进行状态修正,给出表征滤波性能的协方差阵:性能的协方差阵:
其中,为滤波增益矩阵,γ
k
为观测矩阵,v
k
为观测噪声矩阵,x
k
为观测值,为状态变量z的滤波值,为滤波协方差矩阵;步骤1.5:基于前向卡尔曼滤波的结算数据的后向平滑解算,还原在卡尔曼模型下的交通流真实状态值,即最优平滑估计值:通流真实状态值,即最优平滑估计值:通流真实状态值,即最优平滑估计值:通流真实状态值,即最优平滑估计值:其中,为系统k时刻状态的最优平滑估计,为平滑增益值,为平滑协方阵,上标s表示后向平滑过程,k=n,n-1,
…
,0。3.根据权利要求2所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:所述步骤2具体为:步骤2.1:将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
),输出隐藏时空特征;步骤2.2:将步骤2.1得到的隐藏时空特征x
in
输入门控记忆卷积神经网络,经过处理后输出g
out
;步骤2.3:将步骤2.2的g
out
输入多层注意力网络模块mgan(
·
),经过处理后得到隐藏空间特征。4.根据权利要求3所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:所述步骤2.1具体为:将步骤1的输出结果输入到所述稀疏特征的全连接层linear(
·
):其中,x
in
为输出的隐藏时空特征,为步骤1的输出结果,即最优平滑估计;w与b为网络的学习参数。5.根据权利要求4所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:所述步骤2.2具体为:步骤2.2.1:将步骤2.1得到的隐藏时空特征x
in
输入门控记忆卷积神经网络,经过因果卷积得到g
in
,再输入到门控单元,由于特征x
in
的时间长度经过卷积层后会变短,需对其进行裁切以得到残差x
residual
,计算公式如下:g
in
=conv
causal
(x
in
),
ꢀꢀꢀꢀ
(14)x
residual
=crop[align(x
in
)],
ꢀꢀꢀꢀ
(15)
其中conv
causal
(
·
)为因果卷积函数,align(
·
)为维度变换函数;步骤2.2.2:将步骤2.1.1得到的x
residual
与g
in
拼接并使用1
×
1卷积核进行因果卷积变换,再经过sigmoid激活,得到遗忘门r和记忆门z的门值,r和z的计算公式如下:换,再经过sigmoid激活,得到遗忘门r和记忆门z的门值,r和z的计算公式如下:其中是卷积核为1
×
1的2维卷积函数,d表示维数;步骤2.2.3:时空特征g
in
通过步骤2.2.2得到的遗忘门r选择性保留后与x
residual
相加,再经过1
×
1卷积核卷积变换和全连接层linear(
·
)激活后,得到新的时空特征计算公式如下:步骤2.2.4:记忆门z作用在步骤2.2.3的而1-z作用在g
in
上,随后将两者与残差x
residual
相加,经过prelu激活,得到隐含状态输出g
out
,计算公式如下:6.根据权利要求5所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:所述步骤2.3具体如下:步骤2.3.1:在时间区间τ=(t-τ+1,t-τ+2,...,t)内,将多层空间图表示为g
τ
=(v,a
τ
),其中v={v
i
|i=1,2,3,...,n}是图g
τ
中交通流检测节点v
i
的集合,a
τ
=(a
t-τ+1
,a
t-τ+2
,...,a
t
)表示时间区间τ内的权重连接张量,a
t
为t时刻时权重连接矩阵,表示t时刻时节点v
i
到节点v
j
的权重信息,因为使用多头注意力机制,所以其中m为多头注意力机制的头数;步骤2.3.2:根据步骤2.3.1构建的多层空间图g
τ
=(v,a
τ
),拆分t时刻节点v
i
的输入与节点v
j
的输入得到输入张量其中输入张量是步骤2.2的输出,m=1,2,...m,输入张量的通道数为d
m
;步骤2.3.3:步骤2.3.2的经过全连接神经网络linear
q
与linear
k
后分别生成查询向量与键值向量,再经过缩放点积,得到节点v
i
与v
j
的注意力得分的注意力得分计算公式如下:步骤2.3.4:通过softmax函数对注意力得分进行归一化,得到t时刻两点的权重值表明节点j的交通流与节点i的交通流的空间相关性大小,计算公式如下:
步骤2.3.5:将权重值加入dropout神经元随机丢弃机制,模拟城市交通中的突发事件对交通流节点之间相关性的影响,经卷积计算后得到隐藏空间特征计算公式如下:其中,为mgan层的输出,w
t,m
为可学习的参数矩阵,m为多头注意力的头数,为mgan层的输入,σ(
·
)为sigmoid激活函数。7.根据权利要求6所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:所述步骤3的decode层为包括依次设置的多层注意力网络模块mgan(
·
)、记忆门控卷积模块gmcnn(
·
)和稀疏特征的全连接层linear(
·
),且mgan(
·
)、gmcnn(
·
)和linear(
·
)的操作步骤与步骤2相同。8.根据权利要求7所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:由encode层和decode层构建时空图自编解码网络stgae(
·
),并输出流通流量的预测数据,具体为:其中,x
τ
为交通流样本数据,为stgae网络得到的交通流预测数据,encode(
·
)为步骤2中的encode层,decode(
·
)为步骤3中的decode层,layernorm(
·
)表示在通道维度中进行规一化。9.根据权利要求8所述的一种基于时空图自编解码网络的交通流预测方法,其特征在于:对预测数据所对应的真实值y
t
同样进行平滑处理,以消除网络在训练过程中的噪声,由此得到网络stgae在训练过程中的损失函数为:
技术总结
本发明涉及交通流量预测技术领域,具体地涉及一种面向时空图自编码器的交通流量预测方法。包括:步骤1:使用改进的HA-RTS算法平滑处理给定的交通流样本数据;步骤2:由Encode层对步骤1处理的交通流样本数据进行编码,编码是指各模块通过参数学习将输入数据输出为包含了预测信息的隐藏特征;步骤3:由多层注意力网络模块、记忆门控卷积模块和全连接层构建的Decode层对步骤2的Encode层中得到的隐藏特征解码为预测值,由此得到交通流量预测结果。本发明集成了多层注意力神经网络和门控记忆卷积神经网络,并去除了模型训练中所受观测噪声影响。有效地提高交通流量预测的准确性和鲁棒性,解决了交通流时空依赖性建模复杂困难的问题。题。题。
技术研发人员:
夏大文 白德伟 李华青 黄丹 张文勇 申冰琪 霍雨佳 耿建 徐海龙 吴菁 冯夫健 蔡静
受保护的技术使用者:
贵州民族大学
技术研发日:
2022.11.08
技术公布日:
2023/3/28