路径跟随控制方法、装置、飞行器、智能终端及存储介质与流程

阅读：评论：0

1.本发明涉及路径跟随技术领域，尤其涉及的是一种路径跟随控制方法、装置、飞行器、智能终端及存储介质。

背景技术：

2.随着科学技术的发展，路径规划技术和路径跟随(路径跟踪)技术也得到迅速发展和广泛应用。路径跟随过程中，需要控制跟随对象对被跟随对象进行跟踪，尽量保证两者处于相对静止的状态。
3.现有技术中，通常采用复杂的模型预测控制(mpc)进行预测跟踪，例如针对被跟随对象训练一个预测跟踪的模型，然后根据该模型控制跟随对象的运动，但模型训练和使用过程都较为复杂，需要较高的计算资源且计算过程耗时长，不利于提高路径跟随的效率。
4.因此，现有技术还有待改进和发展。

技术实现要素：

5.本发明的主要目的在于提供一种路径跟随控制方法、装置、飞行器、智能终端及存储介质，旨在解决现有技术中采用复杂的模型预测控制(mpc)进行预测跟踪时，模型训练和使用过程都较为复杂，需要较高的计算资源且计算过程耗时长，不利于提高路径跟随的效率的问题。
6.为了实现上述目的，本发明第一方面提供一种路径跟随控制方法，其中，上述方法包括：
7.获取预测步数以及被跟随对象的当前坐标；
8.获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量；
9.根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
10.可选的，上述被跟随对象和上述跟随对象分别为飞行器。
11.可选的，上述获取被跟随对象的当前坐标，包括：
12.通过上述跟随对象的传感器获取上述被跟随对象的当前坐标。
13.可选的，在一次迭代过程中上述跟随目标收益函数的函数值等于第一路程与第二路程的差值，其中，上述第一路程是各个上述预测跟随坐标与预设坐标原点之间对应的路程之和，上述第二路程是输入上述目标收益函数的上述被跟踪对象的各个坐标与上述预设坐标原点之间对应的路程之和。
14.可选的，在一次迭代过程中上述被跟随目标收益函数的函数值等于第三路程与第四路程的差值，其中，上述第三路程是各个上述预测被跟随坐标与上述预设坐标原点之间对应的路程之和，上述第四路程是输入上述被跟随目标收益函数的上述跟随对象的各个坐标与上述预设坐标原点之间对应的路程之和。
15.可选的，上述预设坐标原点是上述跟随对象运动的起始点。
16.可选的，上述跟随目标收益函数满足预设的跟随约束条件，上述跟随约束条件包括连续性约束子条件、距离约束子条件以及最大速度约束子条件；
17.上述连续性约束子条件用于限定当前的预测跟随坐标、上一步的预测跟随坐标以及上述跟随对象的速度之间的关系；
18.上述距离约束子条件用于限定上述当前的预测跟随坐标与其对应输入坐标之间的距离，其中，上述输入坐标是输入上述跟随目标收益函数的被跟随对象的坐标；
19.上述最大速度约束子条件用于限定上述跟随对象的速度。
20.可选的，上述根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标，包括：
21.将上述目标预测坐标向量输入上述跟随目标收益函数，并根据上述目标收益函数计算获取上述跟随对象对应的一个目标跟随向量；
22.将上述目标跟随向量中的第一个坐标作为上述跟随对象下一步对应的目标跟随坐标；
23.控制上述跟随对象移动到上述目标跟随坐标。
24.可选的，上述预测步数等于1。
25.本发明第二方面提供一种路径跟随控制装置，其中，上述装置包括：
26.数据获取模块，用于获取预测步数以及被跟随对象的当前坐标；
27.目标预测坐标向量计算模块，用于获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测
被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量；
28.跟随控制模块，用于根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
29.本发明第三方面提供一种飞行器，其中，上述飞行器作为跟随对象，且上述飞行器根据上述任意一种路径跟随控制方法对被跟随对象进行路径跟随。
30.本发明第四方面提供一种智能终端，其中，上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的路径跟随控制程序，上述路径跟随控制程序被上述处理器执行时实现上述任意一种路径跟随控制方法的步骤。
31.本发明第五方面提供一种计算机可读存储介质，上述计算机可读存储介质上存储有路径跟随控制程序，上述路径跟随控制程序被处理器执行时实现上述任意一种路径跟随控制方法的步骤。
32.由上可见，本发明方案中的路径跟随控制方法包括：获取预测步数以及被跟随对象的当前坐标；获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量；根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
33.与现有技术相比，本发明中，无需针对被跟随对象训练对应的模型，只需要根据跟随目标收益函数和被跟随目标收益函数迭代计算即可实现目标跟踪，因此可以有效降低对计算资源的要求，且不需要进行复杂的模型训练和使用过程，有利于降低计算过程的耗时，同时有利于提高路径跟随的效率。
附图说明
34.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述
中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。
35.图1是本发明实施例提供的一种路径跟随控制方法的流程示意图；
36.图2是本发明实施例图1中步骤s300的具体流程示意图；
37.图3是本发明实施例提供的一种进行路径跟随控制的具体流程示意图；
38.图4是本发明实施例提供的一种基于路径跟随控制方法进行路径跟随控制的效果示意图；
39.图5是本发明实施例提供的一种路径跟随控制装置的结构示意图；
40.图6是本发明实施例提供的一种智能终端的内部结构原理框图。
具体实施方式
41.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。
42.应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
43.还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。
44.还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。
45.如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当
…
时”或“一旦”或“响应于确定”或“响应于检测到”。类似的，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0046]
下面结合本发明实施例的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0047]
在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其它不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。
[0048]
随着科学技术的发展，路径规划技术和路径跟随(路径跟踪)技术也得到迅速发展和广泛应用。路径跟随过程中，需要控制跟随对象对被跟随对象进行跟踪，尽量保证两者处于相对静止的状态。例如，可以控制微型卫星对空间站进行路径跟随，以实现对空间站的监视与侦察。
[0049]
具体的，随着空间站的研究与发展，其长期在轨稳定运行离不开航天器的监视与侦察。微小卫星体积小，质量轻，成本低，在完成很多复杂的空间任务上发挥着越来越大的作用，例如对空间站的检测侦察、对其它故障航天飞行器修理等等。由于太空中的这些飞行器都不是处于静止状态，卫星要完成这些任务时，通常需要对任务目标进行轨迹跟随，使得卫星相较于这些飞行器处于相对静止的状态。
[0050]
现有技术中，通常采用复杂的模型预测控制(mpc)进行预测跟踪，例如针对被跟随对象训练一个预测跟踪的模型，然后根据该模型控制跟随对象的运动，但模型训练和使用过程都较为复杂，需要较高的计算资源且计算过程耗时长，不利于提高路径跟随的效率。具体的，目前的卫星编队所使用的预测跟踪方法也大多是mpc，其所需要的计算资源要求较高，因此对卫星的硬件要求也高。
[0051]
同时，使用模型预测控制进行预测跟踪时，通常需要分别针对每一个被跟随对象进行模型训练，即模型预测控制方案中的一个模型无法适用于不同的被跟随对象，该方案的适用性不高。且模型还依赖于对被跟随对象、跟随环境等采集的大量数据，难度较大。
[0052]
为了解决现有技术中的一个或多个问题，本发明提供一种路径跟随控制方法，实现基于博弈论的路径跟随，对于跟随对象，根据对方(被跟随对象)的位置作出自己的决策，用同样的算法根据自己的决策去预测被跟随对象的决策，如此反复迭代，收敛达到纳什均衡，即得到自己(跟随对象)的最优决策，从而实现目标跟随，且降低所需要的计算资源。
[0053]
具体的，上述路径跟随控制方法包括：获取预测步数以及被跟随对象的当前坐标；获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量；根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
[0054]
与现有技术相比，本发明中，无需针对被跟随对象训练对应的模型，只需要根据跟随目标收益函数和被跟随目标收益函数迭代计算即可实现目标跟踪，因此可以有效降低对计算资源的要求，且不需要进行复杂的模型训练和使用过程，有利于降低计算过程的耗时，同时有利于提高路径跟随的效率。
[0055]
示例性方法
[0056]
如图1所示，本发明实施例提供一种路径跟随控制方法，具体的，上述方法包括如
下步骤：
[0057]
步骤s100，获取预测步数以及被跟随对象的当前坐标。
[0058]
其中，上述预测步数是设置的用于限定每一次进行路径跟随控制的过程中要规划未来跟随对象移动的步数，例如，预测步数的值为3时，对应规划的步数就是3步，即规划跟随对象未来3步分别移动到哪一个坐标处。规划的步数越多，进行路径跟随过程中的规划时所需要的计算时间越长，计算过程越复杂，但最终获得的目标预测坐标向量也能够使得跟随效果更好，因此可以根据实际需求设置上述预测步数。
[0059]
需要说明的是，上述预测步数可以预先设置，也可以根据实际需求由用户实时输入和调整，在此不作具体限定。同时，本实施中，即使进行了多步的预测，即预测步数大于1，也仅采用规划后的第1步作为实际的移动目标。例如，规划了跟随对象未来3步的坐标，选择其中的第1步作为实际的移动目标，然后在进行1步移动之后，重新规划未来3步的坐标，以此类推。
[0060]
进一步的，本实施例中，以n代表上述预测步数，预测步数是大于0的整数。
[0061]
需要说明的是，本实施例中，上述被跟随对象和上述跟随对象分别为飞行器，具体的，被跟随对象可以是空间站或被跟踪卫星，跟随对象可以是一个微型卫星，如此可以实现通过微型卫星对空间站进行监测和侦察。其中，跟随对象是可以根据上述路径跟随控制方法进行控制的对象，而被跟随对象是不受控制的，也无法获取被跟随对象的下一时刻的策略，因此本实施例中假设被跟随对象与跟随对象的策略达到纳什均衡。其中，策略可以视为下一时刻要到达的位置(即坐标)。
[0062]
具体的，本实施例中，上述获取被跟随对象的当前坐标，包括：通过上述跟随对象的传感器获取上述被跟随对象的当前坐标。上述跟随对象上设置有多个传感器，可以根据跟随对象获取需要跟随的目标的当前坐标，并根据当前坐标进行路径跟随规划。
[0063]
步骤s200，获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量。
[0064]
其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量。
[0065]
本实施例中，上述跟随目标收益函数和被跟随目标收益函数是根据路径跟随控制的需求预先设置的，实际使用过程中，也可以由用户实时输入或根据实际需求进行调整，在此不作具体限定。
[0066]
在每一次迭代计算的过程中，上述跟随目标收益函数(或被跟随目标收益函数)的输入分别是一个包含n个坐标的向量(或数组)，根据输入的该向量以函数值最大为目标进行预测和计算，同时预测出未来n步对应的所有坐标，并组合成一个n个坐标的输出向量(或数组)。反复迭代直到获得的结果收敛，即达到纳什均衡。当n＝1时，上述各个向量中都只包括一个坐标。
[0067]
需要说明的是，在迭代计算的过程中，根据跟随目标收益函数计算并输出的预测跟随坐标向量作为被跟随目标收益函数的输入，然后根据被跟随目标收益函数计算并输出一个预测被跟随坐标向量，然后将获得的预测被跟随坐标向量又作为跟随目标收益函数的输入，如此实现反复迭代。
[0068]
进一步的，在第一次迭代(即初始的迭代)时，跟随目标收益函数对应的初始输入(即被跟随对象坐标向量)是根据被跟随对象的当前坐标生成的。当n等于1时，跟随目标收益函数的初始输入就是上述当前坐标。当n大于1时，跟随目标收益函数的初始输入中，第1个坐标是上述当前坐标，第2个到第n个坐标可以是预先设置的初始值，也可以是随机值，还可以都是上述当前坐标，在此不作具体限定。
[0069]
其中，上述迭代次数阈值是预先设置的最大迭代次数，用于防止无法达到收敛时反复迭代无法停止，造成程序异常。上述迭代次数阈值也可以根据实际需求进行设置和调整，在此不作具体限定。上述第二预设条件中需要计算向量的差值，且每一个向量中包括n个坐标，向量的差值可以是n个对应的坐标之间的距离之和。目标预测坐标向量是最终获得一个满足预设条件的被跟随对象坐标向量，目标预测坐标向量与前一次迭代时获得的被跟随对象坐标向量的差值小于预设的坐标差值阈值，上述坐标差值阈值可以预先设置也可以根据实际需求进行调整，在此不作具体限定。
[0070]
具体的，在一次迭代过程中上述跟随目标收益函数的函数值等于第一路程与第二路程的差值，其中，上述第一路程是各个上述预测跟随坐标与预设坐标原点之间对应的路程之和，上述第二路程是输入上述目标收益函数的上述被跟踪对象的各个坐标与上述预设坐标原点之间对应的路程之和。
[0071]
在一次迭代过程中上述被跟随目标收益函数的函数值等于第三路程与第四路程的差值，其中，上述第三路程是各个上述预测被跟随坐标与上述预设坐标原点之间对应的路程之和，上述第四路程是输入上述被跟随目标收益函数的上述跟随对象的各个坐标与上述预设坐标原点之间对应的路程之和。
[0072]
本实施例中，以与预设的坐标原点之间的距离作为对应的收益，也即跟随目标收益函数的函数值或者被跟随目标收益函数的函数值。
[0073]
其中，本实施例中的坐标是通过预先构建的坐标系确定的，坐标系的原点可以根据实际需求进行预先设定。本实施例中，上述坐标原点设置为上述跟随对象运动的起始点，以便简化计算过程，加快计算速度，从而提升路径跟随控制的效率。
[0074]
具体的，本实施例中，上述跟随目标收益函数满足预设的跟随约束条件，上述跟随约束条件包括连续性约束子条件、距离约束子条件以及最大速度约束子条件；
[0075]
上述连续性约束子条件用于限定当前的预测跟随坐标、上一步的预测跟随坐标以及上述跟随对象的速度之间的关系；
[0076]
上述距离约束子条件用于限定上述当前的预测跟随坐标与其对应输入坐标之间
的距离，其中，上述输入坐标是输入上述跟随目标收益函数的被跟随对象的坐标；
[0077]
上述最大速度约束子条件用于限定上述跟随对象的速度。
[0078]
需要说明的是，实际使用过程中，上述跟随约束条件还可以包括其它的组成部分，即其它子条件，在此不作具体限定。
[0079]
步骤s300，根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
[0080]
其中，上述目标预测坐标向量是根据跟随目标收益函数和被跟随目标收益函数，计算获得的跟随对象和被跟随对象博弈并达到纳什均衡的情况下，被跟随对象在接下来的n步将会移动到的位置。根据预测坐标向量，可以对跟随对象进行路径规划，具体的，本实施例中，在一次路径规划的过程中，只对跟随对象进行一步的控制，如图2所示，上述步骤s300具体包括如下步骤：
[0081]
步骤s301，将上述目标预测坐标向量输入上述跟随目标收益函数，并根据上述目标收益函数计算获取上述跟随对象对应的一个目标跟随向量。
[0082]
步骤s302，将上述目标跟随向量中的第一个坐标作为上述跟随对象下一步对应的目标跟随坐标。
[0083]
步骤s303，控制上述跟随对象移动到上述目标跟随坐标。
[0084]
在一种应用场景中，为了降低计算难度和计算所需要的时间，预先设置上述预测步数n等于1。
[0085]
本实施例中，还基于一种具体的应用场景对上述路径跟随控制方法进行具体说明，图3是本发明实施例提供的一种进行路径跟随控制的具体流程示意图，图3中，工作卫星即为跟随对象，用工作卫星对被跟踪卫星(即被跟随对象)进行跟踪。
[0086]
具体的，本实施例中，令工作卫星在一次博弈过程中的收益函数为si(pi)-sj(pj)，其中，pi代表工作卫星对应的坐标(或坐标向量)，pj代表被跟踪卫星对应的坐标(或坐标向量)，对应的，pi和pj也可以理解为策略，卫星的策略是下一时刻(即下一步)要到达的位置。si(pi)代表工作卫星的收益，也即工作卫星在pi处距离预设的坐标原点的路程长度，sj(pj)代表被跟踪卫星的收益，也即被跟踪卫星在pj处距离预设的坐标原点的路程长度，路程是对应的卫星运动的路程。本实施例中预设的坐标原点是工作卫星的运动起始点，如果被跟踪卫星没有经过该点，则可以将开始进行路径跟随的时刻被跟踪卫星与坐标原点之间的直线作为该段路程。需要说明的是，si(pi)、sj(pj)、pi和pj都是某一个时刻下的，每一个时刻都做一次优化运算然后得到一个解(策略)，然后根据这个解进行路径跟随控制，本实施例中以针对一个时刻的计算和控制为例进行说明，实际使用过程中，根据当前时刻的被跟随对象的当前坐标进行路径跟随控制之后，再下一个时刻根据相同的方式进行计算和控制，在此不再赘述。
[0087]
进一步的，max[si(pi)-sj(pj)]代表每个时刻工作卫星的收益减去被跟踪卫星的收益获得最大值，即最终获得的实际收益最大，也代表每一个时刻工作卫星尽量靠近被跟踪卫星。需要说明的是，本实施例中最终需要实现的是卫星的跟踪，工作卫星的速度实际上小于被跟踪卫星，收益获得最大值则代表每次决策工作卫星的路程尽量大。因为工作卫星一直朝着被跟踪卫星的方向运动，不可能超过被跟踪卫星，所以每次决策路程尽量大就意味着尽量靠近被跟踪卫星。且将每个时刻工作卫星的收益减去被跟踪卫星的收益可以实现
工作卫星和被跟踪卫星之间的交互。
[0088]
本实施例中的优化目标是工作卫星和被跟踪卫星对应的收益达到纳什均衡，但同时，根据上述路径跟随控制方法只能对工作卫星进行控制，不能对被跟踪卫星进行控制，因此也无法知道被跟踪卫星的下一时刻的策略，即无法准确计算获得sj(pj)。因此本实施例中，为了使工作卫星获得最优的实际效益，假设被跟踪卫星采取一种最优的策略，假定被跟踪卫星的收益为根据工作卫星的坐标pi计算获得的纳什均衡下的收益即代表根据工作卫星的坐标pi预测获得的被跟踪卫星的收益。其中，α是一个超参(预设参数)，α是一个可调的、根据实际经验、实验调整的大于或等于0的参数，在本实施例中，α一旦给定就不再变化。具体的，可以代表在对应的最优策略下(即工作卫星的策略pi)被跟踪卫星的下一时刻的路程。
[0089]
因此，可以获得本实施例中，工作卫星在一次博弈过程中的跟随目标收益函数本实施例中，对于进行进一步的展开和变换，以更方便的计算跟随目标收益函数的最大值。首先，以pi为自变量，对在上一次迭代解的邻域进行一阶泰勒展开可以得到如下公式(1)：
[0090][0091]
其中，中的是上一次迭代计算之后获得的坐标，其对应的收益也是确定的，即是一个常数，本实施例的目的是取得的最大值，而常数对此不会有影响，因此可以忽略
[0092]
具体的，本实施例中，上述跟随目标收益函数和被跟随目标收益函数都满足距离约束子条件，距离约束子条件用于避免工作卫星和被跟踪卫星发生碰撞，具体的，距离约束为其中，y是预设的距离阈值，可以根据实际需求进行设置和调整。将对应的距离约束表示为对应的，进行一阶泰勒展开后可以获得如下公式(2)：
[0093][0094]
其中，l代表迭代次数，l不大于l，l代表预设的迭代次数阈值。公式(2)中，也是一个常数，可以忽略，因此可以将转换为：又因为其中，
代表工作卫星的方向参数，其方向是由工作卫星指向被跟踪卫星的，则代表为对应的坐标添加方向，从而表示工作卫星是朝向被跟踪卫星的方向进行运动的，pi是工作卫星的坐标，pj是被跟踪卫星的坐标，上标l代表是第l次迭代计算获得的对应值，例如是第l次迭代计算获得的被跟踪卫星的坐标，以此类推，不再赘述。因此，忽略对应的常数之后，可以获得，获得，其中，k代表的是决策出来的第k步，k的取值为1到n之间的整数，是一个迭代超参，即一个在算法迭代过程中动态变化的参数，每一次迭代过程中，的具体是不同的，可以根据实际需求进行调整。上标k和l代表第l次迭代中决策的第k步对应的值，当n＝1时，k也可以忽略，即不需要考虑是第几步的决策，只需要考虑是第几次迭代即可。需要说明的是，本实施例的公式中，没有上标k的各个参数代表n＝1时k忽略的情况，也可以根据实际需求添加对应的上标k。的上标t代表矩阵的转置，代表第l次迭代过程中第k步对应的工作卫星的方向参数(即工作卫星的第k步朝向被跟踪卫星的方向)，由于pi是一个列向量，所以对应的β也是一个列向量，其中β是由所有组合成的列向量矩阵，为了得到一个数值并方便优化，本实施例中对β进行转置。
[0095]
又由于本实施例中需要求的是跟踪效果，而si(pi)是为了引出这个概念而添加的，实际在求解过程中也可以忽略，所以可以获得最终的目标函数如下公式(3)：
[0096][0097]
需要说明的是，在一种应用场景中，也可以忽略不影响求解最大值的部分，直接将上述公式(3)作为跟随对象的跟随目标收益函数。上述目标跟随收益函数对应的跟随约束条件如下公式(4)所示：
[0098][0099]
其中，公式(4)的第一项为连续性约束子条件，代表工作卫星在第k步的坐标，代表工作卫星在第k-1步的坐标，代表工作卫星第k步的速度，t代表单位时间(即每行走一步所花费的时间)，连续性约束子条件即用于保证工作卫星规划的一步与前一步的坐标之间的距离是与工作卫星单位时间内行走的时间长度相同的。公式(4)的第二项为距离约束子条件，用于限定第k步的工作卫星坐标与被跟踪卫星坐标之间的距离不小于预设的距离阈值y，防止两者碰撞。公式(4)的第三项为最大速度约束子条件，用于限定工
作卫星第k步的速度不超过工作卫星的最大速度阈值
[0100]
进一步的，本实施例中，假设达到纳什均衡，则被跟踪卫星(即被跟随对象)与工作卫星(即跟随对象)有相同的优化策略，因此，可以获得被跟随卫星的收益函数为max[sj(pj)-si(pi)]，或者进一步获得对应的被跟随对象的被跟随目标收益函数如下公式(5)所示：
[0101][0102]
其中，代表被跟随对象的迭代超参，代表第l次迭代过程中第k步对应的被跟随对象(即被跟踪卫星)的方向参数，代表被跟随对象第k步对应的坐标。
[0103]
进一步的，上述被跟随目标收益函数同样满足被跟随对象对应的跟随约束条件，上述跟随约束条件包括连续性约束子条件、距离约束子条件以及最大速度约束子条件，被跟随目标收益函数满足的约束如下公式(6)所示：
[0104][0105]
其中，公式(6)的第一项为连续性约束子条件，代表被跟踪卫星在第k步的坐标，代表被跟踪卫星在第k-1步的坐标，代表被跟踪卫星第k步的速度，t代表单位时间(即每行走一步所花费的时间)，连续性约束子条件即用于保证被跟踪卫星规划的一步与前一步的坐标之间的距离是与被跟踪卫星单位时间内行走的时间长度相同的。公式(6)的第二项为距离约束子条件，用于限定第k步的被跟踪卫星坐标与工作卫星坐标之间的距离不小于预设的距离阈值y，防止两者碰撞。公式(6)的第三项为最大速度约束子条件，用于限定被跟踪卫星第k步的速度不超过被跟踪卫星的最大速度阈值需要说明的是，本实施例中假设被跟踪卫星与工作卫星采取相同的优化策略，因此可以将被跟踪卫星的第k步的速度和最大速度阈值视为与工作卫星相同。
[0106]
具体的，获得上述跟随目标收益函数和上述被跟随目标收益函数之后，结合其对应的约束条件，通过如图3所示的流程迭代计算。图3中，初始化代表工作卫星通过各种传感器获取需要跟随目标的当前坐标，然后工作卫星可以根据深度摄像头获取到的被跟踪卫星的坐标进行初始化，也可以初始化工作卫星的初始坐标pj，选择合适的α和合适的然后，根据被跟踪对象的当前坐标生成对应的被跟随对象坐标向量，并通过预设的数学优化算法解跟随目标收益函数(此时将pj视为未知的)，获得对应的一个预测跟随坐标向量(即工作卫星对应的一个决策坐标向量)，将上述预测跟随坐标向量作为跟随目标收益函数的输入，通过预设的数学优化算法解被跟随目标收益函数(此时将pi视为未知的)，获得被跟踪卫星对应的一个预测被跟随坐标向量(即被跟踪卫星对应的一个决策坐标向量)。此时判
断迭代次数l是否大于迭代次数阈值l(即第一预设条件)或求解的值是否收敛(即第二预设条件)，如果都不满足，则迭代次数加一，并进入下一次迭代过程。反之，则迭代结束，将当前次迭代获得的预测被跟随坐标向量作为目标预测坐标向量。需要说明的是，对于被跟随对象的预测也是在跟随对象中进行的，只不过以被跟随对象的角度来优化对应的目标函数，即通过工作卫星来预测被跟踪卫星会作出怎样的决策。上述预设的数学优化算法可以是拉格朗日乘子法、牛顿迭代法等。经过反复迭代后，收敛(即达到纳什均衡，也即收敛到预设的精度)时获得被跟随对象的预测被跟随坐标向量并作为目标预测坐标向量。然后，将该目标预测坐标向量作为跟随目标收益函数的输入，解跟随目标收益函数，为跟随对象(即工作卫星)做出下一步的决策。具体的，解跟随目标收益函数获得的目标跟随向量中的第一个坐标作为工作卫星下一步对应的目标跟随坐标，控制其移动到该坐标，则当前时刻的跟随控制结束。
[0107]
图4是本发明实施例提供的一种基于路径跟随控制方法进行路径跟随控制的效果示意图，图4中，细的灰线条代表预先设定的被跟随对象的飞行轨迹范围，即实验过程中被跟随对象是在该轨迹内部飞行的。粗的浅灰(灰度较低)的线条是被跟随对象的实际飞行轨迹，粗的黑(灰度较高)的线条是跟随对象的实际飞行轨迹。需要说明的是，粗的黑线条的起点是图4右上角的点，两者的飞行方向是逆时针。被跟随对象的实际飞行轨迹与跟随对象的实际飞行轨迹的重合部分并不代表是碰撞，而是被跟随对象先走过对应的轨迹，跟随对象在下一个时刻或者下几个时刻到达对应的位置。根据图4可知，基于本实施例中的路径跟随控制方法，可以获得较好的路径跟随效果。
[0108]
由上可见，本发明实施例提供的路径跟随控制方法中，获取预测步数以及被跟随对象的当前坐标；获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量；根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
[0109]
与现有技术相比，本发明中，无需针对被跟随对象训练对应的模型，只需要根据跟随目标收益函数和被跟随目标收益函数迭代计算即可实现目标跟踪，因此可以有效降低对计算资源的要求，且不需要进行复杂的模型训练和使用过程，有利于降低计算过程的耗时，同时有利于提高路径跟随的效率。
[0110]
示例性装置
[0111]
如图5所示，对应于上述路径跟随控制方法，本发明实施例还提供一种路径跟随控制装置，上述路径跟随控制装置包括：
[0112]
数据获取模块410，用于获取预测步数以及被跟随对象的当前坐标。
[0113]
其中，上述预测步数是设置的用于限定每一次进行路径跟随控制的过程中要规划未来跟随对象移动的步数，例如，预测步数的值为3时，对应规划的步数就是3步，即规划跟随对象未来3步分别移动到哪一个坐标处。规划的步数越多，进行路径跟随过程中的规划时所需要的计算时间越长，计算过程越复杂，但最终获得的目标预测坐标向量也能够使得跟随效果更好，因此可以根据实际需求设置上述预测步数。
[0114]
目标预测坐标向量计算模块420，用于获取跟随对象的跟随目标收益函数和上述被跟随对象的被跟随目标收益函数，基于上述被跟随对象的当前坐标、上述跟随目标收益函数和上述被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量，其中，在上述迭代计算过程中，上述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取上述跟随对象对应的一个预测跟随坐标向量，上述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取上述被跟随对象对应的一个预测被跟随坐标向量，上述目标预测坐标向量满足第一预设条件或第二预设条件，上述第一预设条件为迭代次数大于预设的迭代次数阈值，上述第二预设条件为上述目标预测坐标向量与前一次迭代时获得的上述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，上述被跟随对象坐标向量和上述跟随对象坐标向量中分别包括预测步数个坐标，上述预测跟随坐标向量中包括预测步数个预测跟随坐标，上述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，上述跟随目标收益函数对应的上述被跟随对象坐标向量是根据上述被跟随对象的当前坐标生成的一个向量。
[0115]
跟随控制模块430，用于根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。
[0116]
其中，上述目标预测坐标向量是根据跟随目标收益函数和被跟随目标收益函数，计算获得的跟随对象和被跟随对象博弈并达到纳什均衡的情况下，被跟随对象在接下来的n步将会移动到的位置。根据预测坐标向量，可以对跟随对象进行路径规划，具体的，本实施例中，在一次路径规划的过程中，只对跟随对象进行一步的控制。
[0117]
基于上述实施例，本发明还提供了一种飞行器，上述飞行器作为跟随对象，且上述飞行器基于上述任意一种路径跟随控制方法对被跟随对象进行路径跟随。
[0118]
基于上述实施例，本发明还提供了一种智能终端，其原理框图可以如图6所示。上述智能终端包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中，该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和路径跟随控制程序。该内存储器为非易失性存储介质中的操作系统和路径跟随控制程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该路径跟随控制程序被处理器执行时实现上述任意一种路径跟随控制方法的步骤。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示
屏。
[0119]
本领域技术人员可以理解，图6中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的智能终端的限定，具体的智能终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0120]
本发明实施例还提供一种计算机可读存储介质，上述计算机可读存储介质上存储有路径跟随控制程序，上述路径跟随控制程序被处理器执行时实现本发明实施例提供的任一种路径跟随控制方法的步骤。
[0121]
应理解，上述实施例中各步骤的序号大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。
[0122]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0123]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0124]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各实例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0125]
在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以由另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。
[0126]
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，上述计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，上述计算机程序包括计算机程序代码，上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括：能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
[0127]
以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实
施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

技术特征：

1.一种路径跟随控制方法，其特征在于，所述方法包括：获取预测步数以及被跟随对象的当前坐标；获取跟随对象的跟随目标收益函数和所述被跟随对象的被跟随目标收益函数，基于所述被跟随对象的当前坐标、所述跟随目标收益函数和所述被跟随函数进行迭代计算，获取所述被跟随对象的一个目标预测坐标向量，其中，在所述迭代计算过程中，所述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取所述跟随对象对应的一个预测跟随坐标向量，所述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取所述被跟随对象对应的一个预测被跟随坐标向量，所述目标预测坐标向量满足第一预设条件或第二预设条件，所述第一预设条件为迭代次数大于预设的迭代次数阈值，所述第二预设条件为所述目标预测坐标向量与前一次迭代时获得的所述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，所述被跟随对象坐标向量和所述跟随对象坐标向量中分别包括预测步数个坐标，所述预测跟随坐标向量中包括预测步数个预测跟随坐标，所述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，所述跟随目标收益函数对应的所述被跟随对象坐标向量是根据所述被跟随对象的当前坐标生成的一个向量；根据所述目标预测坐标向量，通过所述跟随目标收益函数计算获取所述跟随对象下一步对应的目标跟随坐标，并控制所述跟随对象移动到所述目标跟随坐标。2.根据权利要求1所述的路径跟随控制方法，其特征在于，所述被跟随对象和所述跟随对象分别为飞行器。3.根据权利要求1所述的路径跟随控制方法，其特征在于，所述获取被跟随对象的当前坐标，包括：通过所述跟随对象的传感器获取所述被跟随对象的当前坐标。4.根据权利要求1所述的路径跟随控制方法，其特征在于，在一次迭代过程中所述跟随目标收益函数的函数值等于第一路程与第二路程的差值，其中，所述第一路程是各个所述预测跟随坐标与预设坐标原点之间对应的路程之和，所述第二路程是输入所述目标收益函数的所述被跟踪对象的各个坐标与所述预设坐标原点之间对应的路程之和。5.根据权利要求4所述的路径跟随控制方法，其特征在于，在一次迭代过程中所述被跟随目标收益函数的函数值等于第三路程与第四路程的差值，其中，所述第三路程是各个所述预测被跟随坐标与所述预设坐标原点之间对应的路程之和，所述第四路程是输入所述被跟随目标收益函数的所述跟随对象的各个坐标与所述预设坐标原点之间对应的路程之和。6.根据权利要求5所述的路径跟随控制方法，其特征在于，所述预设坐标原点是所述跟随对象运动的起始点。7.根据权利要求1所述的路径跟随控制方法，其特征在于，所述跟随目标收益函数满足预设的跟随约束条件，所述跟随约束条件包括连续性约束子条件、距离约束子条件以及最大速度约束子条件；所述连续性约束子条件用于限定当前的预测跟随坐标、上一步的预测跟随坐标以及所述跟随对象的速度之间的关系；所述距离约束子条件用于限定所述当前的预测跟随坐标与其对应输入坐标之间的距离，其中，所述输入坐标是输入所述跟随目标收益函数的被跟随对象的坐标；
所述最大速度约束子条件用于限定所述跟随对象的速度。8.根据权利要求1所述的路径跟随控制方法，其特征在于，所述根据所述目标预测坐标向量，通过所述跟随目标收益函数计算获取所述跟随对象下一步对应的目标跟随坐标，并控制所述跟随对象移动到所述目标跟随坐标，包括：将所述目标预测坐标向量输入所述跟随目标收益函数，并根据所述目标收益函数计算获取所述跟随对象对应的一个目标跟随向量；将所述目标跟随向量中的第一个坐标作为所述跟随对象下一步对应的目标跟随坐标；控制所述跟随对象移动到所述目标跟随坐标。9.根据权利要求1-8任意一项所述的路径跟随控制方法，其特征在于，所述预测步数等于1。10.一种路径跟随控制装置，其特征在于，所述装置包括：数据获取模块，用于获取预测步数以及被跟随对象的当前坐标；目标预测坐标向量计算模块，用于获取跟随对象的跟随目标收益函数和所述被跟随对象的被跟随目标收益函数，基于所述被跟随对象的当前坐标、所述跟随目标收益函数和所述被跟随函数进行迭代计算，获取所述被跟随对象的一个目标预测坐标向量，其中，在所述迭代计算过程中，所述跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个被跟随对象坐标向量计算获取所述跟随对象对应的一个预测跟随坐标向量，所述被跟随目标收益函数用于以取得其最大函数值为目标基于输入的一个跟随对象坐标向量计算获取所述被跟随对象对应的一个预测被跟随坐标向量，所述目标预测坐标向量满足第一预设条件或第二预设条件，所述第一预设条件为迭代次数大于预设的迭代次数阈值，所述第二预设条件为所述目标预测坐标向量与前一次迭代时获得的所述被跟随对象对应的预测被跟随坐标向量之间的差值小于预设的坐标差值阈值，所述被跟随对象坐标向量和所述跟随对象坐标向量中分别包括预测步数个坐标，所述预测跟随坐标向量中包括预测步数个预测跟随坐标，所述预测被跟随坐标向量中包括预测步数个预测被跟随坐标，在第一次迭代计算过程中，所述跟随目标收益函数对应的所述被跟随对象坐标向量是根据所述被跟随对象的当前坐标生成的一个向量；跟随控制模块，用于根据所述目标预测坐标向量，通过所述跟随目标收益函数计算获取所述跟随对象下一步对应的目标跟随坐标，并控制所述跟随对象移动到所述目标跟随坐标。11.一种飞行器，其特征在于，所述飞行器作为跟随对象，且所述飞行器基于权利要求1-9任意一项所述的路径跟随控制方法对被跟随对象进行路径跟随。12.一种智能终端，其特征在于，所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的路径跟随控制程序，所述路径跟随控制程序被所述处理器执行时实现如权利要求1-9任意一项所述路径跟随控制方法的步骤。13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有路径跟随控制程序，所述路径跟随控制程序被处理器执行时实现如权利要求1-9任意一项所述路径跟随控制方法的步骤。

技术总结

本发明公开了路径跟随控制方法、装置、飞行器、智能终端及存储介质，路径跟随控制方法包括：获取预测步数以及被跟随对象的当前坐标；获取跟随对象的跟随目标收益函数和被跟随对象的被跟随目标收益函数，基于被跟随对象的当前坐标、跟随目标收益函数和被跟随函数进行迭代计算，获取上述被跟随对象的一个目标预测坐标向量；根据上述目标预测坐标向量，通过上述跟随目标收益函数计算获取上述跟随对象下一步对应的目标跟随坐标，并控制上述跟随对象移动到上述目标跟随坐标。与现有技术相比，本发明方案可以有效降低对计算资源的要求，且不需要进行复杂的模型训练和使用过程，有利于降低计算过程的耗时，同时有利于提高路径跟随的效率。效率。效率。