1.本发明涉及交通运输技术领域,特别是一种基于小样本
数据增强集成学习的
列车应急停车方法。
背景技术:
2.对于一些山地城市的轨道列车运行线路来说,边坡问题较突出,易形成危岩、滑坡等地质灾害,特别是随着城市建设活动对边坡平衡的破坏,导致局部地段土质边坡失稳,形成规模不等的堆积层滑坡,对城市轨道线路安全构成严重威胁。现有技术中,车载驾驶控制系统中的摄像头或激光雷达等障碍物探测元件可对列车线路上出现的障碍物进行检测,进而计算得到列车当前所在位置与障碍物之间的
距离,此时列车通常有两种制动方式选择:制动距离较长的最大常用制动力矩制动和制动距离较短的紧急制动力矩制动,最大常用制动力矩制动相对平稳,给乘客造成的不适感较小,但制动距离较长,不一定能满足列车与障碍物之间的刹车制动距离限制;而紧急制动力矩制动的制动距离通常小于探测元件实时检测到的列车与障碍物之间的刹车距离,一旦探测元件检测到障碍物,立即采取紧急制动力矩制动,通常能保证列车在撞上障碍物前制动停车,但由于紧急制动力矩制动力矩大,刹车制动造成的惯性很容易对乘客造成意外次生伤害。由此可见,列车在遇到线路上的障碍物到底采用哪种方式制动,其关键在于能快速、及时预测列车当前采取上述两种制动方式的制动距离,特别是最大常用制动力矩制动的制动距离,如果列车当前的最大常用制动力矩制动的制动距离小于列车与障碍物之间的距离,则采用最大常用制动力矩制动,否侧采用紧急制动力矩制动。
3.现有技术中,列车的停车控制通过在列车自动驾驶系统ato中采用pid控制器跟踪目标速度曲线的方式实现,但上述控制方式需要建立列车精确
模型,由于其控制对象和控制器参数复杂多变,在需要精确控制的列车停车算法中,其控制效果并不理想。随着机器学习的应用以及大数据智能化的发展,业内也提出将深度学习网络模型运用到列车运行过程中,控制列车紧急情况下的停车控制,但存在以下问题:深度学习需要用到的输入参数如列车的即时速度、列车所处线路坡度等是随机、不确定的;而且上述场景设计的情况出现比较少,样本量特别是带标签数据稀少,样本多样性低,属于典型的小样本学习问题,建立的用于应急停车的深度学习模型泛化能力差,预测出的制动距离误差过大,无法在实际列车应急制动停车控制中使用。
技术实现要素:
4.针对背景技术的问题,本发明提供一种基于小样本数据增强集成学习的列车应急停车方法,以解决现有技术中列车行驶过程中遇到障碍物时难以判断或正确选择制动停车方式,以保证列车运行安全的同时保证乘客的安全的问题。
5.为实现本发明的目的,本发明提供了一种基于小样本数据增强集成学习的列车应急停车方法,其创新点在于:包括障碍物探测元件、制动距离计算模块、列车运行控制模块
和列车运行数据监控模块;所述障碍物探测元件和制动距离计算模块均与列车运行控制模块连接;所述制动距离计算模块与列车运行数据监控模块连接;所述制动距离计算模块内只有制动距离预测集成学习模型;所述列车运行数据监控模块能获取并存贮列车历史制动样本数据;所述列车运行控制模块能实时获取列车的运行特征数据;所述运行特征数据包括列车速度、列车所在坡度和列车属性;当障碍物探测元件探测到列车的运行线路上有危险障碍物时:1)障碍物探测元件生成应急处理信号,并将所述应急处理信号传输给列车运行控制模块;障碍物探测元件探测获取列车与障碍物之间的距离数据,将列车与障碍物之间的距离记为探测距离,障碍物探测元件将所述探测距离数据传输给列车运行控制模块;2)列车运行控制模块收到应急处理信号后即向制动距离计算模块发出制动距离计算指令,同时列车运行控制模块将列车当前的运行特征数据传输给制动距离计算模块,然后制动距离计算模块将收到的运行特征数据输入到所述制动距离预测集成学习模型,制动距离预测集成学习模型对输入的运行特征数据进行计算处理输出列车当前的预测最大常用制动距离;然后制动距离计算模块将得到所述预测最大常用制动距离数据传输给列车运行控制模块;3)列车运行控制模块对收到的所述预测最大常用制动距离和所述探测距离进行比较:如果预测最大常用制动距离小于探测距离,则列车运行控制模块控制列车采用最大常用制动力矩制动;如果预测最大常用制动距离大于或等于探测距离,则列车运行控制模块控制列车采用最大紧急制动力矩制动;所述制动距离预测集成学习模型按以下方式建立:a)从列车运行数据监控模块获取历史制动样本数据,然后对历史制动样本数据进行数据清洗、位置点离散化采样、数据归一化处理得到小样本数据集;选取列车制动瞬间的列车速度、列车所在坡度和列车属性作为后续模型训练的输入特征,将列车当前的预测最大常用制动距离作为后续模型训练的输出特征;b)采用生成对抗网络gan对小样本数据集进行扩充得到增强训练数据集;c)建立stacking集成学习模型,然后利用所述增强训练数据集对stacking集成学习模型进行训练得到制动距离预测集成学习模型。
6.作为优化,所述步骤c)中,采用进化算法自动选择所述stacking集成学习模型中基学习器所集成的学习模型及自动对超参数进行优化。
7.作为优化,所述stacking集成学习模型的基学习器集成的学习模型包括:极限梯度提升模型、支持向量机、随机森林、卷积神经网络和门控循环单元网络。
8.本发明的原理如下:列车行车过程中的停车任务发生临时变化这种场景发生的几率比正常运行状态要低很多,所采集的数据中包含高价值的数据样本量或标注样本很少,这是典型的小样本学习问题,列车智能停车小样本学习的根本问题在于紧急停车样本量少,带标签数据更是稀少,大多是无标签的样本,且带标签的制动停车场景数据分布和不带标签制动场景的数据分布有可能不同,从而导致样本多样性变低。而仅有稀少标注样本的情况下,若采用深度神经网络模型则容易陷入过拟合、泛化性能不好的问题,当模型应用于有别于训练环境的
场景中时,其性能显著下降,甚至完全不能使用。
9.本发明将数据增强、集成学习模型与自动化机器学习相结合,全方位地从数据、模型融合和算法调优三个层面提升性能,让学习模型从一个或多个场景中提取知识以帮助提高目标场景中的学习性能,使模型能准确预测出在不同制动方式下的制动距离,当列车遇到前方障碍物时能够采用恰当的制动方式,让列车智能制动快速适应新场景、新任务和新环境。具体来说:首先是要解决数据增强问题,目前有以下两种思路:一种方法是利用无标签样本数据进行预训练,例如深度自编码器模型,通过逐层预训练或端到端训练,从无标签样本中学习、发现数据模式,进一步地,利用稀少有标签样本,对预训练模型进行微调,以提高学习到的特征区分能力和网络分类或回归能力;另一种方法是联合大量无标签样本和稀少的有标签样本进行弱监督学习。而本发明采用的生成对抗网络gan突破了以往的概率模型必须通过最大似然估计来学习参数的限制,采用对抗的思想,可用于数据增强,即对小样本数据集进行数据扩充,产生有效、可靠的新数据集,将增强后的数据用于迁移至后续集成学习模型训练中去,数据增强可为后续的stacking集成学习模型训练的基学习器提供充足的示范性历史任务数据,避免元学习器过拟合。
10.在上述数据增强基础上,再通过stacking集成学习训练策略及算法调优,设计出新的自动化集成学习模型,以学习到更多、更有效的元知识。stacking集成学习框架,这是一种串联结构多层学习系统,通常由两层组成,分别包含多个基学习器的基层和一个元学习器的元层,它将基模型和元模型相结合进行训练和预测。元层归纳基层学习结果进行二次学习,基层使用留一交叉验证法对原始数据进行训练生成meta数据供元层进行二级训练。从统计学原理分析,多样化的基学习器因训练原理的差异,可从不同角度探索特征空间、拟合不同特征,让学习到的特征更全面。元学习器归纳基层学习结果,对基层训练结果进行二次泛化学习,可修正偏差和方差,从而避免陷入局部最优。
11.作为优化,本发明选取多个传统统计学习模型(极限梯度提升模型、支持向量机和随机森林)和多个深度学习模型(卷积神经网络和门控循环单元网络)相结合的框架,充分考虑传统学习模型和深度学习模型各自的优势及差距:深度学习参数多,学习能力强,可以很好地拟合数据,达到人们需要的预测精度,但也存在过拟合、泛化能力低的问题;而统计学习参数少、训练快且泛化能力较强,两种学习模型各有所长,相得益彰。
12.作为优化,对于基学习器的模型选择还可采用进化算法自动优化,这是由于基学习器的选择并不是越多越好,过多集成不仅会带来存储计算资源和时间上的开销,还会导致泛化性能降低,而元学习器对不同基学习器组合的偏差修正效果有所差异,另一方面,对集成学习模型的选择及超参数优化具有问题依赖性,即解决不同的问题有其相应不同的恰当组合方式。而进化算法是模拟生物进化历程的一类随机优化算法,拥有优秀的全局搜索潜力,没有目标函数连续或者可导的限定,可以自适应地调整搜索方向。因此,基于自动化机器学习思想,可用进化算法自动选择需要集成的模型及超参数。
13.通过上述过程,基于多模型融合的自动stacking集成学习模型训练完毕,将上述stacking集成学习模型用于列车制动距离计算模块中,当列车遇到障碍物时即能准确预测出列车最大常用制动距离,然后将这个距离值与障碍物探测元件获取的列车与障碍物之间的探测距离进行比较,即能做出判断是采用最大常用制动力矩制动还是采用最大紧急制动
力矩制动,从而科学、灵活、智能地应对紧急情况,在保证列车行驶安全的前提下最大程度保证乘客的人生安全。
14.由此可见,本发明具有如下的有益效果:采用本发明所述的控制方法,克服了小样本标签不足导致的模型表示能力不足和泛化能力差的缺点,进一步降低了小样本学习的过拟合机率,提高了模型的稳定性和预测精度;采用本发明所述的方法,可及时准确地预测列车的最大常用制动距离,让列车准确、有效地选取制动方式,保证了列车安全、平稳运行,使得列车更加灵活和智能地应对复杂环境,同时最大限度保证乘客的人身安全和乘坐舒适性。
附图说明
15.本发明的附图说明如下。
16.附图1本发明所涉及硬件的连接示意图。
17.图中:1、障碍物探测元件;2、制动距离计算模块;3、列车运行控制模块;4、列车运行数据监控模块。
具体实施方式
18.下面结合实施例对本发明作进一步说明。
19.如附图1所示的本发明设计的硬件连接结构示意图包括障碍物探测元件1、制动距离计算模块2、列车运行控制模块3和列车运行数据监控模块4;所述障碍物探测元件1和制动距离计算模块2均与列车运行控制模块3连接;所述制动距离计算模块2与列车运行数据监控模块4连接;所述探测元件通常为设置在车头的摄像头或激光雷达等;所述制动距离计算模块2包括已经训练好的制动距离预测集成学习模型;所述列车运行数据监控模块4通常包括列车运行监控装置lkj和列车控制与管理系统tcms,上述装置和系统能能获取并存贮列车历史制动样本数据;所述列车运行控制模块3能实时获取列车的运行特征数据;所述运行特征数据包括列车速度、列车所在坡度和列车属性;其中,列车属性包括列车型号和车重等;当障碍物探测元件1探测到列车的运行线路上有危险障碍物时:1)障碍物探测元件1生成应急处理信号,并将所述应急处理信号传输给列车运行控制模块(3);障碍物探测元件1探测获取列车与障碍物之间的距离数据,将列车与障碍物之间的距离记为探测距离,障碍物探测元件1将所述探测距离数据传输给列车运行控制模块3;2)列车运行控制模块3收到应急处理信号后即向制动距离计算模块2发出制动距离计算指令,同时列车运行控制模块3将列车当前的运行特征数据传输给制动距离计算模块2,然后制动距离计算模块2将收到的运行特征数据输入到所述制动距离预测集成学习模型,制动距离预测集成学习模型对输入的运行特征数据进行计算处理输出列车当前的预测最大常用制动距离;然后制动距离计算模块2将得到所述预测最大常用制动距离数据传输给列车运行控制模块3;3)列车运行控制模块3对收到的所述预测最大常用制动距离和所述探测距离进行比较:如果预测最大常用制动距离小于探测距离,则列车运行控制模块3控制列车采用最大
常用制动力矩制动;如果预测最大常用制动距离大于或等于探测距离,则列车运行控制模块3控制列车采用最大紧急制动力矩制动;所述制动距离预测集成学习模型按以下方式建立:a)从列车运行数据监控模块4获取历史制动样本数据,然后对历史制动样本数据进行数据清洗、位置点离散化采样、数据归一化处理得到小样本数据集;选取列车制动瞬间的列车速度、列车所在坡度和列车属性作为输入特征,将列车当前的预测最大常用制动距离作为输出特征;b)采用生成对抗网络gan对小样本数据集进行扩充得到增强训练数据集;gan同时训练两个模型:一个可以用来发现数据分布规律的产生式模型;另一个用来区分真实样本和生成数据的判别式模型。具体地,将随机噪声送入到g络的生成器,生成假样本,将真实数据中的样本和由生成网络生成的样本输入判别模型中,该模型将对给定样本进行真假标记。采用最大最小交替化的策略训练gan:一方面,最小化生成器的损失,使其可以生成更为逼真的样本;另一方面,最大化判别器的损失,使其无法判断给定的样本来自真实数据还是生成的数据,这样,生成器能够产生“足够真”的生成样本,即可作为增强样本用;c)建立stacking集成学习模型,然后利用所述增强训练数据集对stacking集成学习模型进行训练得到制动距离预测集成学习模型。
20.作为优化,所述步骤c)中,采用进化算法自动选择所述stacking集成学习模型中基学习器所集成的学习模型及自动对超参数进行优化。
21.作为优化,所述stacking集成学习模型的基学习器集成的学习模型包括:极限梯度提升模型、支持向量机、随机森林、卷积神经网络和门控循环单元网络。
22.本发明中应用到的数据清洗、位置点离散化采样、数据归一化处理、生成对抗网络gan、stacking集成学习、极限梯度提升模型、支持向量机、随机森林、卷积神经网络、门控循环单元网络和进化算法均为现有技术中十分常见的处理手段,相关的内容,本领域技术人员可从现有技术的相关文献中获取。
技术特征:
1.一种基于小样本数据增强集成学习的列车应急停车方法,其特征在于:包括障碍物探测元件(1)、制动距离计算模块(2)、列车运行控制模块(3)和列车运行数据监控模块(4);所述障碍物探测元件(1)和制动距离计算模块(2)均与列车运行控制模块(3)连接;所述制动距离计算模块(2)与列车运行数据监控模块(4)连接;所述制动距离计算模块(2)内置有制动距离预测集成学习模型;所述列车运行数据监控模块(4)能获取并存贮列车历史制动样本数据;所述列车运行控制模块(3)能实时获取列车的运行特征数据;所述运行特征数据包括列车速度、列车所在坡度和列车属性;当障碍物探测元件(1)探测到列车的运行线路上有危险障碍物时:1)障碍物探测元件(1)生成应急处理信号,并将所述应急处理信号传输给列车运行控制模块(3);障碍物探测元件(1)探测获取列车与障碍物之间的距离数据,将列车与障碍物之间的距离记为探测距离,障碍物探测元件(1)将所述探测距离数据传输给列车运行控制模块(3);2)列车运行控制模块(3)收到应急处理信号后即向制动距离计算模块(2)发出制动距离计算指令,同时列车运行控制模块(3)将列车当前的运行特征数据传输给制动距离计算模块(2),然后制动距离计算模块(2)将收到的运行特征数据输入到所述制动距离预测集成学习模型,制动距离预测集成学习模型对输入的运行特征数据进行计算处理输出列车当前的预测最大常用制动距离;然后制动距离计算模块(2)将得到所述预测最大常用制动距离数据传输给列车运行控制模块(3);3)列车运行控制模块(3)对收到的所述预测最大常用制动距离和所述探测距离进行比较:如果预测最大常用制动距离小于探测距离,则列车运行控制模块(3)控制列车采用最大常用制动力矩制动;如果预测最大常用制动距离大于或等于探测距离,则列车运行控制模块(3)控制列车采用最大紧急制动力矩制动;所述制动距离预测集成学习模型按以下方式建立:a)从列车运行数据监控模块(4)获取历史制动样本数据,然后对历史制动样本数据进行数据清洗、位置点离散化采样、数据归一化处理得到小样本数据集;选取列车制动瞬间的列车速度、列车所在坡度和列车属性作为后续模型训练的输入特征,将列车当前的预测最大常用制动距离作为后续模型训练的输出特征;b)采用生成对抗网络gan对小样本数据集进行扩充得到增强训练数据集;c)建立stacking集成学习模型,然后利用所述增强训练数据集对stacking集成学习模型进行训练得到制动距离预测集成学习模型。2.如权利要求1所述的基于小样本数据增强集成学习的列车应急停车方法,其特征在于:所述步骤c)中,采用进化算法自动选择所述stacking集成学习模型中基学习器所集成的学习模型及自动对超参数进行优化。3.如权利要求1所述的基于小样本数据增强集成学习的列车应急停车方法,其特征在于:所述stacking集成学习模型的基学习器集成的学习模型包括:极限梯度提升模型、支持向量机、随机森林、卷积神经网络和门控循环单元网络。
技术总结
本发明提供了一种基于小样本数据增强集成学习的列车应急停车方法,其特征在于:利用小样本数据集通过生成对抗网络GAN进行数据增强,通过stacking集成学习建立制动距离预测集成学习模型,并利用进化算法调优。当列车遇到障碍物时,利用制动距离预测集成学习模型预测出最大常用制动距离,从而准确判断采用最大常用制动力矩制动还是采用最大紧急制动力矩制动,在保证列车安全行驶的前提下,最大程度保证乘客的人身安全和乘坐舒适性。证乘客的人身安全和乘坐舒适性。证乘客的人身安全和乘坐舒适性。
技术研发人员:
徐凯 董莹莹 涂永超 吴仕勋 张淼
受保护的技术使用者:
重庆交通大学
技术研发日:
2022.04.26
技术公布日:
2022/8/5