1.本发明涉及异构多智能体系统的容错编队控制的技术领域,具体是涉及一种切换
拓扑下空-地异构编队系统的容错控制方法。
背景技术:
2.近年来,随着人工智能和控制科学的不断发展,智能体在环境适应性、自治性、控制的精确化及高效化等方面均获得了长足的发展。然而,随着工业化进程的加快,依靠单个智能体越来越难以实现预期的复杂控制任务,因此通过多个智能体相互协作构成的多智能体系统应运而生。当多智能体系统中存在一个或几个智能体的动态
模型与其他智能体不同时,这样的多智能体系统就被称为异构多智能体系统。由空中无人飞行器和地面无人车构成的多智能体编队系统是一种典型的异构多智能体系统,该系统具备多种有效载荷能力、任务配置能力、控制和数据采集能力,在空间探索、协同救援、资源勘探和路径规划等领域正得到广泛的应用。
3.然而,在空-地协同编队过程中,受无人器结构的高度复杂化、个体及其相互作用特性和机制约束等,使得异构多智能体系统易受到执行器故障的影响,故障通过交互拓扑网络传播和扩散,进一步影响整个编队系统的稳定性和安全性。因此,分布式交互网络架构的设计在提高整体协同性的同时,也给容错控制器的设计带来新的挑战。尤其是随着执行任务的多变、不可靠的信息传递链路及障碍物等环境因素的影响使得传感器的感应区域受限,这会导致拓扑网络结构的变化,进一步使得传统基于固定拓扑设计的容错编队控制策略无法使用。而且,传统的渐近响应和非连续的控制输入在面对空-地无人系统等关键技术系统时难以满足预期的控制需求。目前存在的空-地无人系统的编队控制策略只能单方面的解决上述存在的某一个问题,还无法同时解决编队系统的快速机动性、控制输入的连续性和切换拓扑网络下的容错控制等问题,因此,亟需研究可解决上述一系列问题的新的容错控制方案来进一步提高空-地异构多智能体编队系统对复杂任务的实现和对性能的保持能力。
技术实现要素:
4.发明目的:针对以上缺点,本发明公开了一种切换拓扑下空-地异构编队系统的容错控制方法,在切换拓扑网络下分别设计xy平面内、z轴运动空间的连续固定时间容错跟踪控制器,同时解决了空-地异构编队系统对切换拓扑网络的适应性、机动响应性、容错可靠性和控制量的连续性等多重需求,实现空-地异构编队系统在xyz三维空间内的容错编队控制目标。
5.技术方案:为解决上述问题,本发明提供一种切换拓扑下空-地异构编队系统的容错控制方法,具体包括以下步骤:
6.(1)针对空-地异构多智能体编队系统设计切换拓扑下分布式拓扑网络结构;在该结构下设计领导者-跟随者的编队策略,选取一无人车为领导者,其余无人车和/或
无人机为跟随者,确定描述领导者与跟随者之间通讯拓扑关系的拉普拉斯矩阵;
7.(2)考虑复杂不确定项的影响,根据无人机和无人车的运动学方程建立描述空-地异构多智能体编队系统动态特性的模型,包括:第一模型、第二模型、第三模型;第一模型为领导者无人车的动态模型,第二模型为无人机跟随者和无人车跟随者在xy平面内的动态模型,第三模型为无人机跟随者在z轴的动态模型;所述复杂不确定性包括执行器故障、模型不确定性以及外界干扰;
8.(3)基于固定时间理论分别设计固定观测器对第二模型的复杂不确定项、第三模型的复杂不确定项进行固定时间观测;
9.(4)根据第一观测值与步骤(1)中获取的拉普拉斯矩阵采用高阶滑模控制技术与反步法设计在连续固定时间收敛的xy轴的分布式编队容错控制器;所述的第一观测值为针对第二模型的复杂不确定项设计的固定观测器的观测值;根据第二观测值采用高阶滑模控制技术与反步法设计在连续固定时间收敛的z轴的轨迹容错跟踪控制器;所述的第二观测值为针对第三模型的复杂不确定项设计的固定观测器的观测值。
10.进一步的,(1.1)定义空-地异构多智能体编队系统中具有n+1个智能体,所述的智能体包括无人机和无人车;其中,无人车具有n1+1个,无人机具有n2个,n=n1+n2,n为跟随者的数量;领导者无人车标记为0,跟随者无人车标记为i=1,
…
,n1,跟随者无人机标记为i=n1+1,
…
,n1+n2;
11.(1.2)跟随者之间的通信拓扑网络无向图记为g=(s,e,a);s={s1,s2,
…
,sn}为n个跟随者的集合,为跟随者之间的通信连接集合,表示第i1个跟随者与第i2个跟随者的通信连接且连接成功,i1∈i、i2∈i;表示跟随者之间通信权值的连接矩阵,若则否则
12.跟随者i的入度矩阵为d=diag{deg
in
(s1),...,deg
in
(sn)},跟随者之间的拉普拉斯矩阵为l=d-a;
13.(1.3)领导者与跟随者之间的通信连接关系矩阵为b=diag{b1,...,bi,...,bn};bi表示第i个跟随者与领导者之间的通信连接;包含领导者和跟随者的整个编队系统的交互网络为其拉普拉斯矩阵为h=l+b;
14.(1.4)由于跟随者之间的通信拓扑关系是随时间而发生切换拓扑变化,建立包含所有拓扑结构的集合:θ表示存在的切换拓扑的数量,θ≥1;定义切换拓扑结构的信号为σ(t):[0,+∞)
→
={1,2,...,θ},切换时刻表示为0=t0<t1<...<t
p
=t,在时间区间[t
p
,t
p+1
)内的跟随者之间拓扑网络表示为有向固定拓扑网络其拉普拉斯矩阵定义为l
σ(t)
,整个编队系统的通信矩阵为h
σ(t)
=l
σ(t)
+b
σ(t)
。
[0015]
进一步的,步骤(2)具体包括:
[0016]
(2.1)第一模型的表达式为:
[0017]
[0018]
式中,为t时刻领导者在xy平面内的位置坐标的一阶
导数、v0(t)为t时刻领导者在xy平面内的位置速度,为的v0(t)一阶导数;u0(t)为t时刻领导者在xy平面内的位置的控制量输入;
[0019]
(2.2)第二模型的表达式为:
[0020][0021][0022]
式中,χi(t)=[xi,yi]
t
为第i跟随者在xy平面内的位置坐标,为χi(t)的二阶导数;u
ixy
(t)为第i跟随者在xy平面内的控制量输入;为第二模型的复杂不确定项;为第i个跟随者的加性故障参数;f
ixy
(t)为第i个跟随者包含模型不确定性的系统非线性部分的数值;为第i个跟随者受到的外界干扰;
[0023]
(2.3)第三模型的表达式为:
[0024][0025]
δ
iz
(t)=τ
iz
(t)+f
iz
(t)+d
iz
(t)-ρ
izuiz
(t)/m
i-g
[0026]
式中,zi(t)为第i无人机在z轴的位置坐标,为zi(t)的二阶导数;u
iz
(t)为第i无人机在z轴的控制量输入;δ
iz
(t)为第三模型的复杂不确定项;τ
iz
(t)为第i个无人机的加性故障参数;f
iz
(t)为第i个无人机包含模型不确定性的系统非线性部分的数值;d
iz
(t)为第i个无人机受到的外界干扰;ρ
iz
为第i个无人机执行效率损失故障参数;g为重力加速度;mi是第i个无人机的质量。
[0027]
进一步的,步骤(3)具体包括:
[0028]
(3.1)针对第二模型的复杂不确定项设计固定时间观测器,公式为:
[0029][0030]
式中,σ
i1
、σ
i2
为固定时间观测器的状态变量,为
i1
的一阶导数,为σ
i2
的一阶导数;m
i1
为正定常数;其中,
[0031][0032][0033][0034]
式中,o
i1
、o
i2
、o
i3
为固定时间观测器的参数;为第二模型的复杂不确定项的一阶导数;w1是复杂不确定项的上界;为第i跟随者在xy平面内的位置坐标的一阶导数;
[0035]
观测器的收敛时间t
1i
满足:
[0036][0037]
式中,ν
i1
为设定的正定常数,且当时,得到最小的收敛时间t
1i
;
[0038]
(3.2)针对第三模型的复杂不确定项设计固定时间观测器,公式为:
[0039][0040]
式中,σ
i3
、σ
i4
为固定时间观测器的状态变量,为σ
i3
的一阶导数,为σ
i4
的一阶导数;m
i2
为正定常数;其中
[0041][0042]oi5
>0,o
i6
>4w2[0043][0044]
式中,o
i4
、o
i5
、o
i6
为固定时间观测器的参数;为第三模型的复杂不确定项的一阶导数;w2是复杂不确定项的上界;为第i无人机在z轴的位置坐标一阶导数;
[0045]
观测器的收敛时间t
1iz
满足:
[0046][0047]
式中,ν
i2
为设定的正定常数,且当时,得到最小的收敛时间t
1iz
;
[0048]
进一步的,步骤(4)具体包括:
[0049]
(4.1)定义在xy平面内包含所有跟随者的预期编队向量为z轴所有无人机跟随者的预定轨迹为存在一不受限于系统初始状态的可设定时间常数t
max
,使得下式成立:
[0050][0051]
(4.2)根据观测值σ
i2
、领导者与跟随者之间通讯拓扑关系的拉普拉斯矩阵h
σ(t)
设计xy轴的分布式容错编队控制器,表达式为:
[0052][0053][0054]
虚拟控制律为:
[0055][0056][0057]
式中,χ1、δ1、χ2、δ2、χ3和δ3均为正定常数,c1、c2、c3均为控制参数,d1、d2、d3均为数值大于1的常数;ζ
i1
、ζ
i2
、ζ
i3
均为该控制器的三阶系统;为γ
i2
的一阶导数;为γ
i1
的一阶导数;为编队跟踪误差的一阶导数;
[0058]
(4.3)根据观测值σ
i4
设计z轴的轨迹容错跟踪控制器,表达式为:
[0059][0060][0061]
以及虚拟控制量设计为:
[0062][0063][0064]
其中,μ1、ω1、μ2、ω2、μ3和ω3是人为设定的正定常数,n1、n2、n3均为控制参数,m1、m2、m3均为数值大于1的常数;均为该控制器的三阶系统;为的一阶导数;为的一阶导数;为z轴的轨迹跟踪误差的一阶导数。
[0065]
进一步的,步骤(4.2)具体包括:
[0066]
(4.2.1)基于跟踪误差设计固定时间积分滑模面:
[0067][0068]
式中,ei=[e
ix
,e
iy
]
t
,sig
l
(ei)=[|e
ix
|
l
sgn(e
ix
),|e
iy
|
l
sgn(e
iy
)]
t
,α、β均为正定常数且满足0<α<1和β>1,b1、b2均为常数;e
ix
为x轴的编队跟踪误差,e
iy
为y轴的编队跟踪误差;
[0069]
对滑模面取一阶导数和二阶导数,获取:
[0070][0071]
[0072]
式中,λ
i1
=diag{αb1|e
ix
|
α-1
,αb1|e
iy
|
α-1
}λ
i2
=diag{βb2|e
ix
|
β-1
,βb2|e
iy
|
β-1
};
[0073]
获取积分滑模面的三阶系统:
[0074][0075][0076][0077]
(4.2.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:
[0078]
ζ
i1
=s
i1
[0079]
ζ
i2
=s
i2-γ
i1
[0080]
ζ
i3
=s
i3-γ
i2
[0081]
(4.2.3)基于上述建立的新的三阶系统在切换拓扑网络下设计在xy平面内的分布式容错编队控制器,该分布式容错编队控制器实现固定时间收敛。
[0082]
进一步的,步骤(4.3)具体包括:
[0083]
(4.3.1)基于跟踪误差设计固定时间积分滑模面:
[0084][0085]
式中,αz和βz均为正定常数;b
1z
>0,b
2z
>0均为人为设定常数;
[0086]
对滑模面取一阶导数和二阶导数,最终获取积分滑模面的三阶系统:
[0087][0088][0089][0090]
式中,
[0091]
(4.3.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:
[0092][0093][0094][0095]
(4.3.3)基于上述建立的新的三阶系统在切换拓扑网络下设计在z轴的的轨迹容错跟踪控制器,该的轨迹容错跟踪控制器实现固定时间收敛。
[0096]
此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一所述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述方法的步骤。
[0097]
有益效果:本发明提供的一种切换拓扑下空-地异构编队系统的容错控制方法相对于现有技术而言,其优点在于:1、针对空-地异构编队系统中无人机和无人车模型差异的情况,分别建立了xy轴所有跟随者的二维动态模型和z轴无人机的动态模型,并针对建立的两组模型分别建立固定时间观测器实现对复杂不确定项的有效估计,在xy平面内利用观测
值和邻居交互信息,设计了切换拓扑网络下的分布式连续固定时间容错控制器,该控制器的设计融合了高阶滑模技术和反步法,不但实现对收敛时间的人为设定,而且保证了控制器的输出是连续的,有效提高编队系统的容错性和鲁棒性的同时,还极大提高了所设计控制器在实际应用中的泛化性;2、在z轴利用局部跟踪误差、固定时间理论、高阶滑模控制技术和反步法设计了基于观测器的轨迹容错跟踪控制器,保证无人机跟随者在垂直高度上对预期轨迹的安全、快速的跟踪。
附图说明
[0098]
图1所示为本发明的流程图;
[0099]
图2所示为本发明所述空-地异构编队系统的整体框图;
[0100]
图3所示为空-地异构编队系统的切换拓扑结构图;图3(a)、图3(b)、图3(c)、图3(d)均为一种拓扑结构图;
[0101]
图4所示为本发明所述xy空间空-地异构编队系统的编队效果图;
[0102]
图5所示为本发明所述xy轴的空-地异构编队系统的编队误差收敛图;图5(a)为跟随者在x轴的编队误差图,图5(b)为跟随者在y轴的编队误差图;
[0103]
图6所示为本发明所述z轴的空-地异构编队系统的跟踪误差收敛图;
[0104]
图7所示为本发明所述xy轴的空-地异构编队系统的连续控制量输出图;
[0105]
图7(a)为跟随者在x轴的控制量输出图,图7(b)为跟随者在y轴的控制量输出图;
[0106]
图8所示为本发明所述z轴的空-地异构编队系统的连续控制量输出图;
具体实施方式
[0107]
下面结合附图对本发明的技术方案进一步说明。
[0108]
如图1所述,本发明提供一种切换拓扑下空-地异构编队系统的容错控制方法,具体包括以下步骤:
[0109]
步骤一、针对空-地异构多智能体编队系统设计切换拓扑下分布式拓扑网络结构;在该结构下设计领导者-跟随者的编队策略,选取一无人车为领导者,其余无人车或无人机为跟随者,确定描述领导者与跟随者之间通讯拓扑关系的拉普拉斯矩阵;
[0110]
(1)定义空-地异构多智能体编队系统中具有n+1个智能体(包括无人机和无人车);其中,n1+1个无人车,n2个无人机;领导者无人车标记为0,跟随者无人车标记为i=1,
…
,n1,跟随者无人机标记为i=n1+1,
…
,n1+n2;n=n1+n2,n为跟随者的数量;
[0111]
(1.2)跟随者之间的通信拓扑网络无向图记为g=(s,e,a);s={s1,s2,
…
,sn}为n个跟随者的集合,为跟随者之间的通信连接集合,表示第i1个跟随者与第i2个跟随者的通信连接且连接成功,i1∈i、i2∈i;表示跟随者之间通信权值的连接矩阵,若则否则
[0112]
跟随者i的入度矩阵为d=diag{deg
in
(s1),...,deg
in
(sn)},跟随
者之间的拉普拉斯矩阵为l=d-a;
[0113]
(3)领导者与跟随者之间的通信连接关系用对角矩阵表示为:b=diag{b1,...,bi,...,bn};其中,bi表示第i个跟随者与领导者之间的通信,若bi>0表示第i个跟随者可以获得来自领导者的信息,否则i个跟随者与领导者之间无法进行通信。
[0114]
包含领导者和跟随者的整个编队系统的交互网络为其拉普拉斯矩阵为h=l+b;即h描述整个编队系统拓扑网络的通信连接矩阵,且h所描述的通信网络中领导者至少存在一条可以抵达任何跟随体的路径。
[0115]
(4)对于跟随者之间的通信拓扑关系是随时间而发生切换拓扑变化的情况,则需要建立包含所有拓扑结构的集合及切换拓扑的表达形式。
[0116]
定义所有有向图的集合为θ表示存在的切换拓扑的数量;定义切换拓扑结构的信号为σ(t):[0,+∞)
→
={1,2,...,θ},切换时刻表示为0=t0<t1<...<t
p
=t,t
p
为具体的切换时刻,p为切换次序,即在t
p
时刻发生第p次切换,p为总的切换次数。在时间区间[t
p
,t
p+1
),(p≤p)内的跟随者之间拓扑网络表示为有向固定拓扑网络其拉普拉斯矩阵定义为l
σ(t)
,整个编队系统的通信矩阵为h
σ(t)
=l
σ(t)
+b
σ(t)
。
[0117]
如图2所示,本实施例共有5个智能体,3个无人车,2个无人机;以一个无人车(i=0)为领导者,另外选取两个无人车(i=1,2)、两个无人机(i=3,4)为跟随者,领导者和跟随者共同构成空-地异构多智能体编队系统。
[0118]
针对该空-地异构多智能体编队系统设计具体的切换拓扑下分布式拓扑网络结构如图3所示,每个切换拓扑结构维持5秒时间,即编队系统在0s~5s的通信拓扑结构如图3(a),这段时间里在5s~10s的通信拓扑结构如图3(b),这段时间里在10s~15s的通信拓扑结构如图3(c),这段时间里在15s~20s的通信拓扑结构如图3(d),这段时间里
[0119]
步骤二、根据无人机和无人车的运动学方程建立描述空-地异构多智能体编队系统动态特性的模型;
[0120]
(1)定义领导者无人车的动态模型为第一模型,第一模型的表达式为:
[0121][0122]
式中,x0∈r2为领导者在xy平面内的位置坐标、v0∈r2为领导者在xy平面内的位置速度,u0∈r2为领导者在xy平面内的位置的控制量输入;r表示的实数域。
[0123]
本实施例中领导者的初始位置为x0(0)=[0,0]
t
,跟随者的初始状态为x1(0)=[-0.1,0.2]
t
,x2(0)=[0.5,-0.3]
t
,x3(0)=[-0.4,0]
t
和x4(0)=[0,0.6]
t
,领导者的输入为u0=[0.02,0.02]
t
。
[0124]
(2)充分考虑智能体执行器故障、模型不确定性和外界干扰的影响,然后在xy平面内建立无人机和无人车统一的二维动态模型,该模型定义为第二模型。具体的,将第i个跟随者(i∈(1,...,n1+n2))在xy平面内的模型简化为以下所示的模型表达式:
[0125][0126]
其中,χi(t)=[xi,yi]
t
∈r2和分别表示第i个跟随者在xy平面内的位置坐标和控制量输入,表示第i个跟随者的执行器效率损失因子,表示第i个跟随者的加性故障参数,f
ixy
(t)∈r2表示第i个跟随者包含模型不确定性的系统非线性部分,表示第i个跟随者受到的外界干扰,当第i个跟随者是无人车时,即i∈(1,...,n1),那么ai=i2,i2为两维单位矩阵。反之,当第i个跟随者是无人机时,即i∈(n1+1,...,n1+n2),那么ai=diag{1/mi,1/mi},其中mi是第i个无人机的质量。
[0127]
为了便于控制器的设计,现通过设计包含执行器故障、模型不确定性和外界干扰的复杂不确定项,进一步简化第二模型表达式为以下形式:
[0128][0129][0130]
式中,为第二模型的复杂不确定项。
[0131]
(3)同理,充分考虑智能体执行器故障、模型不确定性和外界干扰的影响,无人机在z轴的动态模型,该模型为第三模型,第三模型表达式为:
[0132][0133]
其中,zi∈r和u
iz
(t)∈r分别是第i个无人机在z轴的位置坐标和控制输入量,ρ
iz
∈r和τ
iz
(t)∈r分别是第i个无人机执行效率损失故障参数和加性故障参数,f
iz
(t)∈r和d
iz
(t)∈r分别是第i个无人机的模型非线性部分和受到的外界干扰,g表示重力加速度。
[0134]
为了便于控制器的设计,现通过设计包含执行器故障、模型不确定性和外界干扰的复杂不确定项,进一步简化第二模型表达式为以下形式:
[0135][0136]
δ
iz
(t)=τ
iz
(t)+f
iz
(t)+d
iz
(t)-ρ
izuiz
(t)/m
i-g
[0137]
式中,δ
iz
(t)为第三模型的复杂不确定项。
[0138]
本实施例中,执行效率损失模块设定为:
[0139][0140][0141][0142][0143]
以及如下所示的加性故障模块:
[0144]
τ1=[-0.2cos(t),-sin(0.5t)]
t
,τ2=[-0.15sin(1.2t),-0.45sin(2t)]
t
,
[0145]
每个跟随者受到的外界干扰设计为:
[0146]
d1=[0.1sin(t),-0.3cos(0.7t)]
t
,d2=[0.45cos(t),0.7sin(2t)]
t
,
[0147]
d3=[-0.3cos(0.5t),-0.2sin(1.5t),0.27sin(2t)]
t
,
[0148]
d4=[0.5sin(0.25t),0.55cos(1.5t),0.3sin(2t)]
t
。
[0149]
此外,考虑每个无人机跟随者受到模型不确定性的影响,设计模型参数中带有20%幅值的不确定性变化。
[0150]
步骤三、基于固定时间理论分别设计固定观测器对δ
iz
(t)进行固定时间观测,且观测误差的收敛时间不受限于系统的初始状态;
[0151]
(1)设计固定时间观测器对进行固定时间观测,表达式为:
[0152][0153]
式中,σ
i1
、σ
i2
均为固定时间观测器的状态变量。
[0154]
其中,m
i1
是人为设定的正定常数,满足:m
i1
>1,观测器参数o
i1
、o
i2
、o
i3
满足:
[0155]oi2
>0,o
i3
>4w1[0156]
式中,w1是复杂不确定项的导数上界,即满足
[0157]
复杂不确定项可分别被σ
i2
在固定时间内估计出来。以下将以为例进行固定时间收敛的证明。
[0158]
通过对s1求微分可以得到:
[0159][0160]
令:然后对其微分可以得到:
[0161][0162]
至此,复杂不确定项的观测误差系统可以表示为:
[0163][0164]
上述误差系统可以在固定时间内完成其收敛过程,即σ
i2
可以实现在固定时间内对复杂不确定项的有效观测,且观测器的收敛时间t
1i
满足:
[0165][0166]
其中,ν
i1
>0,而且当时,可以得到最小的收敛时间t
1i
。
[0167]
(2)设计固定时间观测器对δ
iz
(t)进行固定时间观测,表达式为:
[0168][0169]
式中,σ
i3
、σ
i4
均为固定时间观测器的状态变量。
[0170]
其中,m
i2
>1,观测器参数o
i4
、o
i5
和o
i6
满足:
[0171]oi5
>0,o
i6
>4w2[0172]
式中,w2是复杂不确定项δ
iz
(t)的导数上界,即满足那么,复杂不确定项δ
iz
(t)可分别被σ
i4
在固定时间内估计出来。利用步骤(3.1)类似的证明可以得到z轴空间的复杂不确定项δ
iz
(t)也可以在固定时间t
1iz
内实现精确估计,且t
1iz
满足:
[0173][0174]
其中,ν
i2
>0,而且当时,可以得到最小的收敛时间t
1iz
。
[0175]
本实施例中,各个参数设定为:o
i1
=o
i4
=5,o
i2
=o
i5
=2,o
i3
=o
i6
=4。
[0176]
步骤四、在实现对复杂不确定性的固定时间观测后,基于观测值并利用高阶滑模控制技术和反步法设计容错编队控制器,控制器的设计分为xy轴分布式容错编队控制和z轴的分散式轨迹容错跟踪控制两部分。
[0177]
(1)定义在xy平面内包含所有跟随者智能体的预期编队向量z轴所有无人机跟随者的预定轨迹在xyz三维空间中,预期的编队任务就是在空-地异构编队系统在受到执行器故障、模型不确定性和外界干扰的情况下,存在一可不受限于系统初始状态的可设定时间常数t
max
,使得下式成立:
[0178][0179]
本实施例中,各个跟随者期望的编队队形为时变向量,具体为:以及
[0180]
(2)在xy轴利用编队跟踪误差、在z轴轨迹跟踪误差设计固定时间积分滑模面保证抵达滑模面后的跟踪误差可实现固定时间收敛;然后利用固定时间滑模面构造一新的三阶误差系统以便于所设计的控制器实现连续输出;再利用反步法和智能体之间的交互信息设计xy轴的分布式编队容错控制器。
[0181]
(2.1)设计xy轴的分布式容错控制器:
[0182]
(2.1.1)首先,基于跟踪误差设计如下的固定时间积分滑模面:
[0183][0184]
其中,ei=[e
ix
,e
iy
]
t
,sig
l
(ei)=[|e
ix
|
l
sgn(e
ix
),|e
iy
|
l
sgn(e
iy
)]
t
,α和β是正定常数,且满足0<α<1和β>1。此外,b1>0,b2>0均为人为设定常数。e
ix
为x轴的编队跟踪误差,e
iy
为y轴的编队跟踪误差,ei作为编队误差定义为:
[0185][0186]
以下给出滑模面的固定时间收敛性证明,当抵达滑模面后,设计如下李雅普诺夫函数:
[0187]
[0188]
对其求导,可以得到:
[0189][0190]
其中,m是ei的状态维数,由此可以得到,所设计的积分滑模面可以实现在抵达滑模面后的全局编队误差的固定时间收敛,且收敛时间的上界满足:
[0191][0192]
(2.2.2)对滑模面取其一阶导数和二阶导数,得到:
[0193][0194][0195]
其中,λ
i1
=diag{αb1|e
ix
|
α-1
,αb1|e
iy
|
α-1
}以及λ
i2
=diag{βb2|e
ix
|
β-1
,βb2|e
iy
|
β-1
}。
[0196]
至此,可以得到以下关于积分滑模面的三阶系统:
[0197][0198][0199][0200]
(2.2.3)基于反步法对上述三阶系统做以下变换:
[0201]
ζ
i1
=s
i1
[0202]
ζ
i2
=s
i2-γ
i1
[0203]
ζ
i3
=s
i3-γ
i2
[0204]
其中,γ
i1
和γ
i2
是待设计的虚拟控制量。
[0205]
(2.2.4)基于上述建立的新的三阶系统,在切换拓扑网络下设计以下xy平面内的分布式容错编队控制器,实现编队误差在固定时间内的收敛。该控制器的表达式为:
[0206][0207][0208]
虚拟控制律为:
[0209][0210]
[0211]
其中,χ1、δ1、χ2、δ2、χ3和δ3是人为设定的正定常数,控制参数c1、c2、c3∈(0,1),以及d1,d2,d3>1。
[0212]
本实施例中:b1=1,b2=1.1,α=0.5,β=1.1,c1=c2=c3=0.5,d1=d2=d3=1.4,χ1=11,δ1=10,χ2=1,δ2=0.8,χ3=1,δ3=2。
[0213]
以下给出该设计的控制器其固定时间收敛的证明过程:
[0214]
首先,设计如下李雅普诺夫函数:
[0215][0216]
对其求导并带入控制律,可以得到:
[0217][0218]
当固定时间观测器完成对复杂不确定项的观测后,可以得到:
[0219][0220]
因此,当时间t≥t1时,其中t1=max{t
11
,t
12
,...,t
1n
},ζ
i3
可以实现固定时间收敛,且可以得到收敛时间上界为t1+t3,其中:
[0221][0222]
然后,进一步设计如下李雅普诺夫函数:
[0223][0224]
基于前面构造的三阶系统,可以得到下式:
[0225][0226]
又由于,当t≥t1+t3时,有以及ζ
i3
=0,此时,对v3求导可以有:
[0227][0228]
因此,可以得到,当t>t1+t3+t4时,ζ
i2
收敛至零,并且其中:
[0229][0230]
然后,设计如下李雅普诺夫函数:
[0231][0232]
在t>t1+t3+t4时,对其求导,可以得到:
[0233][0234]
其中,λ
min
(h
σ(t)
)是h
σ(t)
的最小特征值,λ
max
(h
σ(t)
)是h
σ(t)
的最大特征值。基于上述分析可以得到,ζ1是固定时间收敛的,即对第i(i∈(1,...,n1+n2))个智能体来说,所设计的xy平面的固定时间容错控制器在t≥t1+t3+t4+t5时可以抵达滑模面s
i1
。又由于滑模面可以在t>t2后实现编队误差的收敛,因此可以得到,当t>t
max
=t1+t2+t3+t4+t5时,预期的编队任务可以实现。
[0235]
(2.2)设计z轴的轨迹容错跟踪控制器:
[0236]
与xy平面内的分布式容错编队控制器设计的方式类似,首先,基于跟踪误差构造固定时间滑模面,然后利用滑模面构造三阶系统,并设计虚拟控制量形成新的误差系统,再基于反步法证明误差系统在所设计的基于观测器的容错控制器的控制下实现固定时间收敛。
[0237]
(2.2.1)首先,基于z轴的跟踪误差设计如下的固定时间积分滑模面:
[0238][0239]
其中,αz和βz是正定常数,且满足0<αz<1和βz>1。此外,b
1z
>0,b
2z
>0均为人为设定常数。
[0240]
关于z轴积分滑模面的三阶系统可整理为:
[0241][0242][0243][0244]
其中,以及
[0245]
(2.2.2)进而对三阶系统做以下变换:
[0246][0247][0248][0249]
其中,和是待设计的虚拟控制量。
[0250]
(2.2.3)设计的z轴的轨迹容错跟踪控制器表达式如下:
[0251][0252][0253]
以及虚拟控制量设计为:
[0254][0255][0256]
其中,μ1、ω1、μ2、ω2、μ3和ω3是人为设定的正定常数,控制参数n1,n2,n3∈(0,1),以及m1,m2,m3>1。该设计的控制器其固定时间收敛的证明过程与上述控制器的证明过程类似。
[0257]
基于上述实施例中的参数设定,应用matlab中的simulink模块进行仿真验证。如图4所示,其二维的编队过程图说明所设计的控制器可以使空-地编队系统在切换拓扑网络下完成预定的容错编队控制任务。如图5和图6所示,分别呈现了本发明所设计容错控制器在xy轴和z轴编队误差收敛过程,即使在受到执行器故障、模型不确定性和外界干扰的影响情况下,所设计的控制器仍然可以在规定时间内快速可靠的完成收敛过程,保证编队系统在切换拓扑网络中对几何编队构型在固定时间内的形成和保持性能,因此通过对复杂不确
定项的有快速估计和有效补偿,可明显提高整个编队系统的鲁棒性和容错性。如图7和图8所示,分别呈现了本发明所设计的控制器在xy轴和z轴的控制量,可以发现控制器实现了稳定连续的控制输出,且能够对执行器故障的突然出现自发的调整控制量的幅值,所设计的控制器具有较为强大的自适应能力和故障补偿能力。
技术特征:
1.一种切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,具体包括以下步骤:(1)针对空-地异构多智能体编队系统设计切换拓扑下分布式拓扑网络结构;在该结构下设计领导者-跟随者的编队策略,选取一无人车为领导者,其余无人车和/或无人机为跟随者,确定描述领导者与跟随者之间通讯拓扑关系的拉普拉斯矩阵;(2)考虑复杂不确定项的影响,根据空-地异构多智能体编队系统中无人机和无人车的运动学方程建立描述空-地异构多智能体编队系统动态特性的模型,包括:第一模型、第二模型、第三模型;第一模型为领导者无人车的动态模型,第二模型为无人机跟随者和无人车跟随者在xy平面内的动态模型,第三模型为无人机跟随者在z轴的动态模型;所述复杂不确定性包括执行器故障、模型不确定性以及外界干扰;(3)基于固定时间理论分别设计固定观测器对第二模型的复杂不确定项、第三模型的复杂不确定项进行固定时间观测;(4)根据第一观测值与步骤(1)中获取的拉普拉斯矩阵采用高阶滑模控制技术与反步法设计在连续固定时间收敛的xy轴的分布式编队容错控制器;所述的第一观测值为针对第二模型的复杂不确定项设计的固定观测器的观测值;根据第二观测值采用高阶滑模控制技术与反步法设计在连续固定时间收敛的z轴的轨迹容错跟踪控制器;所述的第二观测值为针对第三模型的复杂不确定项设计的固定观测器的观测值。2.根据权利要求1所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,步骤(1)具体包括:(1.1)定义空-地异构多智能体编队系统中具有n+1个智能体,所述的智能体包括无人机和无人车;其中,无人车具有n1+1个,无人机具有n2个,n=n1+n2,n为跟随者的数量;领导者无人车标记为0,跟随者无人车标记为i=1,
…
,n1,跟随者无人机标记为i=n1+1,
…
,n1+n2;(1.2)跟随者之间的通信拓扑网络无向图记为g=(s,e,a);s={s1,s2,
…
,s
n
}为n个跟随者的集合,为跟随者之间的通信连接集合,表示第i1个跟随者与第i2个跟随者的通信连接且连接成功,i1∈i、i2∈i;表示跟随者之间通信权值的连接矩阵,若则否则跟随者i的入度矩阵为d=diag{deg
in
(s1),...,deg
in
(s
n
)},跟随者之间的拉普拉斯矩阵为l=d-a;(1.3)领导者与跟随者之间的通信连接关系矩阵为b=diag{b1,...,b
i
,...,b
n
},b
i
表示第i个跟随者与领导者之间的通信连接;包含领导者和跟随者的整个编队系统的交互网络为其拉普拉斯矩阵为h=l+b;(1.4)由于跟随者之间的通信拓扑关系是随时间而发生切换拓扑变化,建立包含所有拓扑结构的集合:θ表示存在的切换拓扑的数量,θ≥1;定义切换拓扑结构的信号为σ(t):[0,+∞)
→
={1,2,...,θ},切换时刻表示为0=t0<t1<...<t
p
=t,
在时间区间[t
p
,t
p+1
)内的跟随者之间拓扑网络表示为有向固定拓扑网络其拉普拉斯矩阵定义为l
σ(t)
;整个编队系统的通信矩阵为h
σ(t)
=l
σ(t)
+b
σ(t)
。3.根据权利要求2所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,步骤(2)具体包括:(2.1)第一模型的表达式为:式中,为t时刻领导者在xy平面内的位置坐标的一阶导数、v0(t)为t时刻领导者在xy平面内的位置速度,为的v0(t)一阶导数;u0(t)为t时刻领导者在xy平面内的位置的控制量输入;(2.2)第二模型的表达式为:(2.2)第二模型的表达式为:式中,χi(t)=[x
i
,y
i
]
t
为第i跟随者在xy平面内的位置坐标,为χ
i
(t)的二阶导数;u
ixy
(t)为第i跟随者在xy平面内的控制量输入;为第二模型的复杂不确定项;为第i个跟随者的加性故障参数;f
ixy
(t)为第i个跟随者包含模型不确定性的系统非线性部分的数值;为第i个跟随者受到的外界干扰;(2.3)第三模型的表达式为:δ
iz
(t)=τ
iz
(t)+f
iz
(t)+d
iz
(t)-ρ
iz
u
iz
(t)/m
i-g式中,z
i
(t)为第i无人机在z轴的位置坐标,为z
i
(t)的二阶导数;u
iz
(t)为第i无人机在z轴的控制量输入;δ
iz
(t)为第三模型的复杂不确定项;τ
iz
(t)为第i个无人机的加性故障参数;f
iz
(t)为第i个无人机包含模型不确定性的系统非线性部分的数值;d
iz
(t)为第i个无人机受到的外界干扰;ρ
iz
为第i个无人机执行效率损失故障参数;g为重力加速度;m
i
是第i个无人机的质量。4.根据权利要求3所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,步骤(3)具体包括:(3.1)针对第二模型的复杂不确定项设计固定时间观测器,公式为:式中,σ
i1
、σ
i2
为固定时间观测器的状态变量,为σ
i1
的一阶导数,为σ
i2
的一阶导数;m
i1
为正定常数;其中,
式中,o
i1
、o
i2
、o
i3
为固定时间观测器的参数;为第二模型的复杂不确定项的一阶导数;w1是复杂不确定项的上界;为第i跟随者在xy平面内的位置坐标的一阶导数;观测器的收敛时间t
1i
满足:式中,ν
i1
为设定的正定常数,且当时,得到最小的收敛时间t
1i
;(3.2)针对第三模型的复杂不确定项设计固定时间观测器,公式为:式中,σ
i3
、σ
i4
为固定时间观测器的状态变量,为σ
i3
的一阶导数,为σ
i4
的一阶导数;m
i2
为正定常数;其中正定常数;其中正定常数;其中式中,o
i4
、o
i5
、o
i6
为固定时间观测器的参数;为第三模型的复杂不确定项的一阶导数;w2是复杂不确定项的上界;为第i无人机在z轴的位置坐标一阶导数;观测器的收敛时间t
1iz
满足:式中,ν
i2
为设定的正定常数,且当时,得到最小的收敛时间t
1iz
。5.根据权利要求1所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在
于,步骤(4)具体包括:(4.1)定义在xy平面内包含所有跟随者的预期编队向量为z轴所有无人机跟随者的预定轨迹为存在一不受限于系统初始状态的可设定时间常数t
max
,使得下式成立:(4.2)根据观测值σ
i2
、领导者与跟随者之间通讯拓扑关系的拉普拉斯矩阵h
σ(t)
设计xy轴的分布式容错编队控制器,表达式为:轴的分布式容错编队控制器,表达式为:虚拟控制律为:虚拟控制律为:式中,χ1、δ1、χ2、δ2、χ3和δ3均为正定常数,c1、c2、c3均为控制参数,d1、d2、d3均为数值大于1的常数;ζ
i1
、ζ
i2
、ζ
i3
均为该控制器的三阶系统;为领导者在xy平面内的位置坐标的二阶导数;为γ
i2
的一阶导数;为γ
i1
的一阶导数;为编队跟踪误差的一阶导数;(4.3)根据观测值σ
i4
设计z轴的轨迹容错跟踪控制器,表达式为:设计z轴的轨迹容错跟踪控制器,表达式为:以及虚拟控制量设计为:以及虚拟控制量设计为:其中,μ1、ω1、μ2、ω2、μ3和ω3是人为设定的正定常数,n1、n2、n3均为控制参数,m1、m2、m3均为数值大于1的常数;均为该控制器的三阶系统;为的一阶导数;为的一阶导数;为z轴的轨迹跟踪误差的一阶导数。6.根据权利要求5所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,步骤(4.2)具体包括:(4.2.1)基于跟踪误差设计固定时间积分滑模面:式中,e
i
=[e
ix
,e
iy
]
t
,sig
l
(e
i
)=[|e
ix
|
l
sgn(e
ix
),|e
iy
|
l
sgn(e
iy
)]
t
,α、β均为正定常数且
满足0<α<1和β>1,b1、b2均为常数;e
ix
为x轴的编队跟踪误差,e
iy
为y轴的编队跟踪误差;对滑模面取一阶导数和二阶导数,获取:对滑模面取一阶导数和二阶导数,获取:式中,λ
i1
=diag{αb1|e
ix
|
α-1
,αb1|e
iy
|
α-1
}λ
i2
=diag{βb2|e
ix
|
β-1
,βb2|e
iy
|
β-1
};获取积分滑模面的三阶系统:获取积分滑模面的三阶系统:获取积分滑模面的三阶系统:(4.2.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:ζ
i1
=s
i1
ζ
i2
=s
i2-γ
i1
ζ
i3
=s
i3-γ
i2
(4.2.3)基于上述建立的新的三阶系统在切换拓扑网络下设计在xy平面内的分布式容错编队控制器,该分布式容错编队控制器实现固定时间收敛。7.根据权利要求5所述的切换拓扑下空-地异构编队系统的容错控制方法,其特征在于,步骤(4.3)具体包括:(4.3.1)基于跟踪误差设计固定时间积分滑模面:式中,α
z
和β
z
均为正定常数;b
1z
>0,b
2z
>0均为人为设定常数;对滑模面取一阶导数和二阶导数,最终获取积分滑模面的三阶系统:对滑模面取一阶导数和二阶导数,最终获取积分滑模面的三阶系统:对滑模面取一阶导数和二阶导数,最终获取积分滑模面的三阶系统:式中,(4.3.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:(4.3.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:(4.3.2)基于反步法的容错控制器设计方案,对上述三阶系统做以下变换:(4.3.3)基于上述建立的新的三阶系统在切换拓扑网络下设计在z轴的的轨迹容错跟踪控制器,该的轨迹容错跟踪控制器实现固定时间收敛。8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至权利要求7任一所述方法的
步骤。9.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至权利要求7任一所述方法的步骤。
技术总结
本发明公开了一种切换拓扑下空-地异构编队系统的容错控制方法,包括:(1)设计切换拓扑下分布式拓扑网络结构,在该结构下设计领导者-跟随者的编队策略,确定通讯拓扑关系的拉普拉斯矩阵;(2)考虑复杂不确定项的影响,建立描述空-地异构多智能体编队系统动态特性的模型;(3)基于固定时间理论分别设计固定观测器对第二模型的复杂不确定项、第三模型的复杂不确定项进行固定时间观测;(4)根据观测值与拉普拉斯矩阵采用高阶滑模控制技术与反步法设计在固定时间收敛的XY轴的分布式编队容错控制器、Z轴的轨迹容错跟踪控制器。本发明解决了空-地异构编队系统对切换拓扑网络的适应性、机动响应性、容错可靠性和控制量的连续性等多重需求。重需求。重需求。
技术研发人员:
姜斌 成旺磊 张柯
受保护的技术使用者:
南京航空航天大学
技术研发日:
2022.07.13
技术公布日:
2022/10/20