一种垃圾回收无人艇的自主避障方法、装置及相关设备

阅读: 评论:0



1.本发明涉及无人艇自主避障技术领域,尤其涉及一种垃圾回收无人艇的自主避障方法、装置及相关设备。


背景技术:



2.水面无人艇是能在无人干预的情况下在各种复杂未知的水面环境下执行任务的新型载体,其具有体型小、智能化、自主化等优点。但目前国内的自主航行无人艇系统还不够完善,尤其是水面无人艇的避障技术上面仍未取得显著突破,因此,研究水面无人艇自主避障关键技术,对于提高水面无人艇自主智能化水平,具有重大意义。
3.现有的无人艇自主避障是无人艇完成各种水上任务的不可或缺的环节,也是无人艇实现智能化的关键。国内在水面无人艇避障规划技术领域的工作开展较晚,有采用人工势场法实现水面无人艇的全局避障规划,但因为容易陷入局部最优解,而有可能导致路径规划失败。还有其他船舶避碰算法,例如遗传算法、粒子算法以及蚁算法等,但都存在实时性差的问题。因为无法预先从样本数据中建立模型,所以在应用过程中需要重复进行路径优化搜索过程,造成大量无用的计算,且其依赖的评价函数较简单,在不同水域应用环境下的鲁棒性较差,避障效果不佳,适用范围小。


技术实现要素:



4.针对以上相关技术的不足,本发明提出一种定位效果好、路径规划合理、避障方便、准确性高的垃圾回收无人艇的自主避障方法、装置及相关设备。
5.为了解决上述技术问题,第一方面,本发明实施例提供了一种垃圾回收无人艇的自主避障方法,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,所述自主避障方法包括以下步骤:
6.通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;
7.通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;
8.所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;
9.通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。
10.优选的,所述通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果具体包括以下子步骤:
11.通过ransac算法在迭代过程消除数据中的相差值;
12.利用pca法进行平面拟合;
13.获得厘米级的定位结果。
14.优选的,所述ransac算法具体包括以下子步骤:
15.预设艇载传感器检测到的三维坐标数据集为ω;
16.从所述数据集中选取符合条件的最小样本子集,计算所述最小子集的模型参数作为初始参数;
17.计算所述ω与所述初始参数之间的差值;
18.将所述差值与预设的阈值相比较,获得对比结果,并根据所述对比结果为判断条件筛选出不符合条件的点并将其删除;
19.再重复以上过程,不断迭代,最终获得一个数学模型参数。
20.优选的,所述ransac算法得出的结果有用的概率为p,所述p的表达式(1)如下:
21.p=1-[1-ωn]k…
(1);
[0022]
其中,ω为数据在样本点集中的概率,n为模型拟合一次所需的坐标点的个数,k为实际的迭代次数,所述k的表达式(2)如下:
[0023][0024]
通过ransac算法预处理后得到点集,利用pca法计算平面的法向量和所有采样点到目标平面的距离d,所述d的表达式(3)如下:
[0025][0026]
其中xi,yi,zi为采样点坐标,n为采样点个数,该xi,yi,zi分别的均值表达式(4)如下:
[0027][0028]
再求出di的标准差δ,所述标准差δ的表达式(5)如下:
[0029][0030]
当di《2δ时,保留该点,通过不断迭代得到最佳二维拟合方程;得到无人艇周边环境信息并进行以上处理之后,使用目标检测算法yolov4对水面的垃圾进行识别,再利用kcf算法对目标垃圾进行跟踪。
[0031]
优选的,所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息具体包括以下子步骤:
[0032]
获取毫米波雷达和单目摄像头所获取的环境信息,其中,所述环境信息包括所述毫米雷达的点云数据和所述单目摄像头的图像数据;
[0033]
对所述点云数据和所述图像数据进行预设时间同步处理;
[0034]
对所述点云数据和所述图像数据分别进行滤波和降噪处理;
[0035]
对降噪后的所述图像数据进行目标检测;
[0036]
将所述点云数据和所述图像数据进行投影变换,再进行数据融合定位,获得所述无人艇周围三维空间下的障碍物运动信息以及所对应的坐标值。
[0037]
优选的,所述通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障具体包括以下子步骤:
[0038]
根据所述自主决策建立预设的无人艇运行学模型;
[0039]
根据所述无人艇运行学模型将深度学习神经网络融合进dpg策略中,获得ddpg算法;
[0040]
根据所述无人艇上的艇载传感器采集的艇载数据;
[0041]
根据所述艇载数据采用速度障碍法进行处理;
[0042]
根据处理获取一组样本数据;
[0043]
将所述样本数据放入经验池中;
[0044]
选择策略动作和做出评价;
[0045]
根据所述策略动作和做出评价选择航向角度。
[0046]
优选的,所述自主避障方法还包括以下子步骤:
[0047]
所述ddpg算法做出错误选择;
[0048]
将所述ddpg算法退回为上个状态;
[0049]
ddpg网络输出动作值并提高噪声;
[0050]
根据所述动作值控制所述无人艇执行相应动作,并得到样本数据;
[0051]
根据所述样本数据进行ddpg网络更新。
[0052]
第二方面,本发明实施例还提供一种垃圾回收无人艇的自主避障装置,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,所述自主避障装置包括以下步骤:
[0053]
采集单元,用于通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;
[0054]
差分处理单元,用于通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;
[0055]
位置获得单元,用于所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;
[0056]
驱动单元,用于通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。
[0057]
第三方面,本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例任一项的垃圾回收无人艇的自主避障方法中的步骤。
[0058]
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例任意一项所述的垃圾回收无人艇的自主避障方法中的步骤。
[0059]
与相关技术相比,本发明通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;通过将所述卫星数据和接收到的所述数据
链进行实时载波相位差分处理,获得定位结果;所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。通过融合毫米波雷达的数据和相机获取到的图片信息,可以充分的感知周围环境,为无人艇提供准确高精度的目标信息以及障碍信息,然后通过规划模块实现路径的自主规划;通过所述路径规划模块进行自主决策,从大量经验数据中学习有效的避碰策略,保证在未知的水面环境下依然可以维持避碰策略的稳定性和准确性,同时引入速度障碍法对ddpg算法的训练进行指导,并在失败区域加入大噪声以提高算法训练的效率和准度,路径规划合理、避障方便、准确性高。
附图说明
[0060]
下面结合附图详细说明本发明。通过结合以下附图所作的详细描述,本发明的上述或其他方面的内容将变得更清楚和更容易理解。附图中:
[0061]
图1为本发明垃圾回收无人艇的自主避障方法的方法流程图;
[0062]
图2为本发明步骤s2具体的方法流程图;
[0063]
图3为本发明步骤s3具体的方法流程图;
[0064]
图4为本发明步骤s4具体的方法流程图;
[0065]
图5为本发明垃圾回收无人艇的自主避障方法的方法流程图;
[0066]
图6为本发明垃圾回收无人艇的自主避障系统框架的框架图;
[0067]
图7为本发明多传感器数据融合流程图;
[0068]
图8为本发明速度障碍法辅助训练ddpg算法的框架图;
[0069]
图9为本发明无人艇运动学模型;
[0070]
图10为本发明障碍物区域与无人艇的夹角示意图;
[0071]
图11为本发明ddpg算法网络流程图;
[0072]
图12为本发明速度障碍法辅助训练ddpg算法的框架;
[0073]
图13为本发明垃圾回收无人艇的自主避障装置的模块图;
[0074]
图14为本发明计算机设备的模块图。
具体实施方式
[0075]
下面结合附图详细说明本发明的具体实施方式。
[0076]
在此记载的具体实施方式/实施例为本发明的特定的具体实施方式,用于说明本发明的构思,均是解释性和示例性的,不应解释为对本发明实施方式及本发明范围的限制。除在此记载的实施例外,本领域技术人员还能够基于本技术权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括采用对在此记载的实施例的做出任何显而易见的替换和修改的技术方案,都在本发明的保护范围之内。
[0077]
请参考图1-图8所示,其中,图1为本发明垃圾回收无人艇的自主避障方法的方法流程图;图2为本发明步骤s2具体的方法流程图;图3为本发明步骤s3具体的方法流程图;图4为本发明步骤s4具体的方法流程图;图5为本发明垃圾回收无人艇的自主避障方法的方法流程图;图6为本发明垃圾回收无人艇的自主避障系统框架的框架图;图7为本发明多传感
器数据融合流程图;图8为本发明速度障碍法辅助训练ddpg算法的框架图。
[0078]
实施例一
[0079]
本发明提供一种垃圾回收无人艇的自主避障方法,用于自主避障系统,所述自主避障系统由艇载工控机和岸端上位机组成,艇载工控机和岸端上位机通过通信系统通信连接,岸端上位机用于输入控制量以及数学向上测量参数,其中艇载工控机由四个模块组成,分别为导航定位模块、环境感知模块、路径规划模块和驱动模块。
[0080]
所述自主避障方法包括以下步骤:
[0081]
s1、通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上。
[0082]
s2、通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果。
[0083]
s3、所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息。
[0084]
s4、通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。
[0085]
具体的,通过上述s1-s4的方法,导航定位模块通过rtk采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送给无人艇,然后通过对所采集到的卫星数据和接收到的数据链进行实时载波相位差分处理,得出厘米级的定位结果。环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,确定障碍物和无人艇目标点位的位置,再通过路径规划模块进行自主决策,使无人艇达到自动规划路径和自主避障的功能。通过融合毫米波雷达的数据和相机获取到的图片信息,可以充分的感知周围环境,为无人艇提供准确高精度的目标信息以及障碍信息,然后通过规划模块实现路径的自主规划;通过所述路径规划模块进行自主决策,从大量经验数据中学习有效的避碰策略,保证在未知的水面环境下依然可以维持避碰策略的稳定性和准确性,同时引入速度障碍法对ddpg算法的训练进行指导,并在失败区域加入大噪声以提高算法训练的效率和准度,路径规划合理、避障方便、准确性高。
[0086]
在本实施例中,步骤s2具体包括以下子步骤:
[0087]
s21、通过ransac算法在迭代过程消除数据中的相差值。
[0088]
s22、利用pca法进行平面拟合。
[0089]
s23、获得厘米级的定位结果。
[0090]
其中,ransac算法是一种采用迭代的方式从一组包含离的被观测数据中估算出数学模型的方法。ransac算法融合了筛选删除不合格数据的思想,因此在许多环境下,对于有部分错误数据的数据样本,能够更加准确的得到辨识结果。
[0091]
具体的,通过ransac算法在迭代过程消除数据中的粗差值,可以使得测量数据中的异常值大幅减少,再利用pca法进行平面拟合,以替代常用的最小二乘法拟合平面。获得厘米级的定位结果。因为最小二乘法虽然可以减小观测向量中的误差,但却忽略了系数矩阵中的误差,会导致拟合出的二维平面精度较差,进而影响接下来的路径规划步骤,甚至影响无人艇航行安全。
[0092]
更进一步地,所述ransac算法具体包括以下子步骤:
[0093]
预设艇载传感器检测到的三维坐标数据集为ω;从所述数据集中选取符合条件的最小样本子集,计算所述最小子集的模型参数作为初始参数;计算所述ω与所述初始参数之间的差值;将所述差值与预设的阈值相比较,获得对比结果,并根据所述对比结果为判断条件筛选出不符合条件的点并将其删除;再重复以上过程,不断迭代,最终获得一个数学模型参数。
[0094]
具体的,假设艇载传感器检测到的三维坐标数据集为ω,从中选取符合条件的最小样本子集,计算该最小子集的模型参数作为初始参数,然后计算ω与初始参数之间的差值,将差值与设定好的阈值相比较,以此为判断条件筛选出不符合条件的点并将其删除。再重复以上过程,不断迭代,最终估算出一个最佳数学模型参数。检测效果好,方便估算最佳数学模型参数,精确度高。
[0095]
更进一步地,所述ransac算法得出的结果有用的概率为p,所述p的表达式(1)如下:
[0096]
p=1-[1-ωn]k…
(1);
[0097]
其中,ω为数据在样本点集中的概率,事先不知道,但可以给树以下鲁棒的值。n为模型拟合一次所需的坐标点的个数,k为实际的迭代次数,所述k的表达式(2)如下:
[0098][0099]
通过ransac算法预处理后得到点集,利用pca法计算平面的法向量和所有采样点到目标平面的距离d,所述d的表达式(3)如下:
[0100][0101]
其中xi,yi,zi为采样点坐标,n为采样点个数,该xi,yi,zi分别的均值表达式(4)如下:
[0102][0103]
再求出di的标准差δ,所述标准差δ的表达式(5)如下:
[0104][0105]
当di《2δ时,保留该点,通过不断迭代得到最佳二维拟合方程;得到无人艇周边环境信息并进行以上处理之后,使用目标检测算法yolov4对水面的垃圾进行识别,再利用kcf算法对目标垃圾进行跟踪。
[0106]
其中,kcf算法全称是kernelized correlation filters,这个算法不论是在跟踪效果还是跟踪速度上都有十分亮眼的表现。该算法主要使用循环矩阵对样本进行采集,使用快速傅里叶变换对算法进行加速计算。
[0107]
具体的,通过上述的表达式(1)-(5),可以提高对水面垃圾识别效率,便于控制无人艇对目标垃圾进行实时追踪,垃圾识别精度高,追踪效果好。
[0108]
在本实施例中,步骤s3具体包括以下子步骤:
[0109]
s31、获取毫米波雷达和单目摄像头所获取的环境信息,其中,所述环境信息包括所述毫米雷达的点云数据和所述单目摄像头的图像数据。
[0110]
s32、对所述点云数据和所述图像数据进行预设时间同步处理。
[0111]
s33、对所述点云数据和所述图像数据分别进行滤波和降噪处理。
[0112]
s34、对降噪后的所述图像数据进行目标检测。
[0113]
s35、将所述点云数据和所述图像数据进行投影变换,再进行数据融合定位,获得所述无人艇周围三维空间下的障碍物运动信息以及所对应的坐标值。
[0114]
通过上述步骤s31-步骤s35的方法,在三维坐标系当中,不利于无人艇的路径规划,需要再将三维空间中的障碍物信息转至二维平面,以达到简化计算量,提高路径规划的实时率这一目的。通过融合毫米波雷达的数据和相机获取到的图片信息,可以充分的感知周围环境,为无人艇提供准确高精度的目标信息以及障碍信息,然后通过规划模块实现路径的自主规划。解决了单一传感器获取信息不足而导致路径规划不合理的问题。利用pca法替代最小二乘法拟合平面,并通过ransc法对传感器探测到的数据进行预处理,能提高拟合后的二维平面的精度,减小误差。
[0115]
在本实施例中,步骤s4具体包括以下子步骤:
[0116]
s41、根据所述自主决策建立预设的无人艇运行学模型。
[0117]
具体的,为了方便分析,将无人艇看作一个质点,使用航向角的角速度控制无人艇的运动过程,如图9所示。
[0118]
无人艇的运动方程可表示为:
[0119][0120]
其中,vu是无人艇在二维平面中的速度,α是无人艇的航向角,ω是无人艇的角速度。
[0121]
在水面航行的过程中,无人艇的航向角以及其角速度满足一下性能约束条件:
[0122][0123]
s42、根据所述无人艇运行学模型将深度学习神经网络融合进dpg策略中,获得ddpg算法。
[0124]
具体的,ddpg算法是是将深度学习神经网络融合进dpg的策略学习方法。在该算法中,无人艇通过试错的方式对水面不同情况下的最优路径选择进行学习。用这种方法学习的过程耗时较长,效率不高。因此,设计通过速度障碍法对无人艇的避障选择进行优化,以提高学习效率。
[0125]
假设传感器检测到的障碍为圆形,半径为ro,无人艇半径为rs,则可以通过膨胀障碍圆至r=rs+ro,将无人艇简化为一个质点;如图10所示。
[0126]
s43、根据所述无人艇上的艇载传感器采集的艇载数据。
[0127]
s44、根据所述艇载数据采用速度障碍法进行处理。
[0128]
s45、根据处理获取一组样本数据。
[0129]
s46、将所述样本数据放入经验池中。
[0130]
s47、选择策略动作和做出评价。
[0131]
s48、根据所述策略动作和做出评价选择航向角度。
[0132]
具体的,通过无人艇上的毫米波雷达和摄像头,可以得到无人艇与障碍物之间的相对速度vuoi和无人艇对应的质点到膨胀后的障碍圆的切线与质点到障碍物圆心oi的夹角α
oi
。相对速度矢量与和无人艇与障碍物相对位置之间的夹角为αi。
[0133]
当αi≥α
oi
时,可知无人艇沿当前航行方向航行时,障碍物对无人艇不构成影响;当αi≤α
oi
时,无人艇沿当前航行方向航行,可能会与障碍物发生相撞,影响无人艇的航行安全。在速度障碍法中,根据αi和α
oi
的大小关系对无人艇是否要执行避障动作以及避障所需调整的航向角角度大小做出动作。
[0134]
ddpg算法是actor-critic和dqn算法的结合体,与dqn算法只能作用在离散空间不同,ddpg算法作用在连续空间,所以可以通过神经网络输出连续的调整量,适当修改无人艇航向角,达到避障的目的。ddpg网络结构由现实actor网络、目标actor网络、现实critic网络、目标critic网络这四个网络组成。actor网络执行策略动作,其网络权重参数为θ,输入状态为st,输出动作为at;critic网络给出做出动作的评分q,使得做出最优选择时的q值最大,其中网络权重参数为ω,输入状态st和动作at,输出为评价值q。
[0135]
actor网络更新采用梯度下降法,如下式所示:
[0136][0137]
m为样本数据的采样个数。critic网络通过均方误差损失函数进行参数更新。
[0138][0139]
γ为奖励折扣因子。如图11所示。
[0140]
其中状态s由艇载传感器获得,输入到现实actor得到动作a,对无人艇施加动作a,无人艇与环境交互返回下一时刻的状态s’和奖励r’,从而得到一组样本数据(s,a,r,s’),把其放入经验池中。把(s,a,r,s’)中的s和a输入到现实critic中,得到现实q(s,a)值,令q=q(s,a)。然后把(s,a,r,s’)中的s’输入到目标actor中,得到动作a’。并把s’和a’一起输入到目标critic中,得到q(s’,a’)于是目标q值为q’=r+γ
×
q(s’,a’)值。再把q’看成标签,更新现实critic使得输出q尽量接近标签q’,再更新现实actor,因为现实actor输出的动作,在现实critic里给出了q值,更新现实actor使得q值输出最大,循环更新采样,以达到贴近最优选择的操作。
[0141]
通过速度障碍法辅助训练ddpg算法的框架如图12所示。在ddpg算法进行避障训练时,会在目标actor网络输出动作时添加高斯白噪声将该网络执行的确定值动作变为随机值动作,以提高ddpg算法的探索能力。
[0142]at’=a
t
+en

(10);
[0143]
式中:a
t
为原actor网络输出动作;en为符合高斯分布的随机探索因子;a
t’为加入探索因子后具备随机探索能力的输出动作。采用的探索噪声如下式:
[0144]
en~n(μ=0,δ=0.5)

(11)。
[0145]
更优的,所述自主避障方法还包括以下子步骤:
[0146]
s5、所述ddpg算法做出错误选择。
[0147]
s6、将所述ddpg算法退回为上个状态。
[0148]
s7、ddpg网络输出动作值并提高噪声。
[0149]
s8、根据所述动作值控制所述无人艇执行相应动作,并得到样本数据。
[0150]
s9、根据所述样本数据进行ddpg网络更新。
[0151]
具体的,在许多实验中,ddpg算法会在探索失败区域反复触发训练失败条件,学习效率较差。本设计通过在失败区域提高探索随机性,以提高算法的学习效率。提高方法如下式所示:
[0152]
en~0.5(n(-1,0.5)+n(1,0.5))

(12);
[0153]
与算法中的原噪声相比,在失败区域将探索幅度从[-0.5,0.5]之间向两侧偏移至[-1.5,0.5]和[0.5,1.5]的区间,提高了随机探索的幅度,以提高到正确航行方向的速度。在跳出失败区域后,再继续对失败区域进行反复多次的训练,以积累大量的样本数据,提高算法选择航向角的准确率。
[0154]
具体的,通过利用ddpg算法的多维度特征提取能力,从大量经验数据中学习有效的避碰策略,保证在未知的水面环境下依然可以维持避碰策略的稳定性和准确性,同时引入速度障碍法对ddpg算法的训练进行指导,并在失败区域加入大噪声以提高算法训练的效率和准度,有效的克服了ddpg算法训练收敛速度慢,样本数据利用率低的问题。
[0155]
实施例二
[0156]
请参阅附图13所示,图13为本发明垃圾回收无人艇的自主避障装置的模块图。本发明实施例还提供一种垃圾回收无人艇的自主避障装置200,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,所述自主避障装置200包括以下步骤:
[0157]
采集单元201,用于通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;
[0158]
差分处理单元202,用于通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;
[0159]
位置获得单元203,用于所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;
[0160]
驱动单元204,用于通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。
[0161]
具体的,通过采集单元201用于通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;差分处理单元202用于通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;位置获得单元203用于所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物
和无人艇目标点位的位置信息;驱动单元204用于通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。通过融合毫米波雷达的数据和相机获取到的图片信息,可以充分的感知周围环境,为无人艇提供准确高精度的目标信息以及障碍信息,然后通过规划模块实现路径的自主规划;通过所述路径规划模块进行自主决策,从大量经验数据中学习有效的避碰策略,保证在未知的水面环境下依然可以维持避碰策略的稳定性和准确性,同时引入速度障碍法对ddpg算法的训练进行指导,并在失败区域加入大噪声以提高算法训练的效率和准度,路径规划合理、避障方便、准确性高。
[0162]
实施例三
[0163]
请参考图14所示,图14为本发明计算机设备的模块图。本发明实施例还提供一种计算机设备,包括存储器301、处理器302及存储在所述存储器301上并可在所述处理器302上运行的计算机程序,所述处理器302执行所述计算机程序时实现上述实施例一的垃圾回收无人艇的自主避障方法中的步骤。
[0164]
实施例四
[0165]
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例一的垃圾回收无人艇的自主避障方法中的步骤。
[0166]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何纂改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

技术特征:


1.一种垃圾回收无人艇的自主避障方法,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,其特征在于,所述自主避障方法包括以下步骤:通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。2.如权利要求1所述的垃圾回收无人艇的自主避障方法,其特征在于,所述通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果具体包括以下子步骤:通过ransac算法在迭代过程消除数据中的相差值;利用pca法进行平面拟合;获得厘米级的定位结果。3.如权利要求2所述的垃圾回收无人艇的自主避障方法,其特征在于,所述ransac算法具体包括以下子步骤:预设艇载传感器检测到的三维坐标数据集为ω;从所述数据集中选取符合条件的最小样本子集,计算所述最小子集的模型参数作为初始参数;计算所述ω与所述初始参数之间的差值;将所述差值与预设的阈值相比较,获得对比结果,并根据所述对比结果为判断条件筛选出不符合条件的点并将其删除;再重复以上过程,不断迭代,最终获得一个数学模型参数。4.如权利要求3所述的垃圾回收无人艇的自主避障方法,其特征在于,所述ransac算法得出的结果有用的概率为p,所述p的表达式(1)如下:p=1-[1-ω
n
]
k

(1);其中,ω为数据在样本点集中的概率,n为模型拟合一次所需的坐标点的个数,k为实际的迭代次数,所述k的表达式(2)如下:通过ransac算法预处理后得到点集,利用pca法计算平面的法向量和所有采样点到目标平面的距离d,所述d的表达式(3)如下:
其中x
i
,y
i
,z
i
为采样点坐标,n为采样点个数,该x
i
,y
i
,z
i
分别的均值表达式(4)如下:再求出d
i
的标准差δ,所述标准差δ的表达式(5)如下:当d
i
<2δ时,保留该点,通过不断迭代得到最佳二维拟合方程;得到无人艇周边环境信息并进行以上处理之后,使用目标检测算法yolov4对水面的垃圾进行识别,再利用kcf算法对目标垃圾进行跟踪。5.如权利要求1所述的垃圾回收无人艇的自主避障方法,其特征在于,所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息具体包括以下子步骤:获取毫米波雷达和单目摄像头所获取的环境信息,其中,所述环境信息包括所述毫米雷达的点云数据和所述单目摄像头的图像数据;对所述点云数据和所述图像数据进行预设时间同步处理;对所述点云数据和所述图像数据分别进行滤波和降噪处理;对降噪后的所述图像数据进行目标检测;将所述点云数据和所述图像数据进行投影变换,再进行数据融合定位,获得所述无人艇周围三维空间下的障碍物运动信息以及所对应的坐标值。6.如权利要求1所述的垃圾回收无人艇的自主避障方法,其特征在于,所述通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障具体包括以下子步骤:根据所述自主决策建立预设的无人艇运行学模型;根据所述无人艇运行学模型将深度学习神经网络融合进dpg策略中,获得ddpg算法;根据所述无人艇上的艇载传感器采集的艇载数据;根据所述艇载数据采用速度障碍法进行处理;根据处理获取一组样本数据;将所述样本数据放入经验池中;选择策略动作和做出评价;根据所述策略动作和做出评价选择航向角度。7.如权利要求6所述的垃圾回收无人艇的自主避障方法,其特征在于,所述自主避障方法还包括以下子步骤:所述ddpg算法做出错误选择;将所述ddpg算法退回为上个状态;ddpg网络输出动作值并提高噪声;根据所述动作值控制所述无人艇执行相应动作,并得到样本数据;
根据所述样本数据进行ddpg网络更新。8.一种垃圾回收无人艇的自主避障装置,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,其特征在于,所述自主避障装置包括以下步骤:采集单元,用于通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;差分处理单元,用于通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;位置获得单元,用于所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;驱动单元,用于通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的垃圾回收无人艇的自主避障方法中的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的垃圾回收无人艇的自主避障方法中的步骤。

技术总结


本发明提供了一种垃圾回收无人艇的自主避障方法、装置及相关设备,用于自主避障系统,所述自主避障系统包括导航定位模块、环境感知模块、路径规划模块和驱动模块,所述自主避障方法包括以下步骤:通过所述导航定位模块采集卫星数据,并通过数据链将其观测值和站点坐标信息一起传送到无人艇上;通过将所述卫星数据和接收到的所述数据链进行实时载波相位差分处理,获得定位结果;所述环境感知模块通过融合毫米波雷达与单目摄像头所测得的信息,获得障碍物和无人艇目标点位的位置信息;通过所述路径规划模块进行自主决策,通过所述驱动模块驱动所述无人艇达到自动规划路径和自主避障。本发明路径规划合理、避障方便、准确性高及适用范围广。用范围广。用范围广。


技术研发人员:

饶红霞 胡广林 徐雍 刘畅 黄增鸿 鲁仁全

受保护的技术使用者:

广东工业大学

技术研发日:

2022.07.15

技术公布日:

2022/11/22

本文发布于:2022-11-24 16:39:13,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/269.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   数据   自主   模块
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图