1.1 研究背景
多智能体系统是指多个具有感知和处理信息能力的个体通过某种信息交互渠道组成的系统。每个个体感知信息的能力和处理信息的能力都是有限的,但是这些能力又能够在这样的过程中不断学习、不断增强。所以,智能体具有自主性、自适应性、分布性和协调性。现实生活中这样的系统存在很多,比如集体迁徙的鸟群,躲避天敌的鱼群,共同觅食的蚁群,相互协作的人类和现代生活必不可少的计算机系统。单个智能体的视野和获取信息的能力有限,因而不适合用于现代的分布式人工智能,多智能体系统以其独特的协作性和较强的鲁棒性成功吸引了众多学者的注意。
一致性问题作为多智能体系统协调控制的基本问题,也是最为重要的问题,引发了一股新的研究热潮。所谓一致性,是指智能体就自身的某些状态量随着时间的推移,最终趋于一致的现象。自21世纪初以来,有关一致性的研究成果数不胜数,并且已经广泛应用于复杂网络的同步、传感器网络的信息估计和融合、资源的分配调度与负载均衡等问题中,而多个体的聚集、移动小车和无人航行器的编队、网络时钟的同步等问题也可以借鉴或者转化成一致性问题来解决[1]。
到目前为止,大多数的研究成果都集中于渐近一致的研究,这意着系统无法在有限时间内达到一致,只有当时间趋向于无穷时,系统才能够趋向于平衡点。然而,在实际的系统中,有限时间一致是必要的,尤其是在精密仪器的控制中,我们不可能等无穷的时间让它达到我们想要的状态,我们希望的是系统越快达到指定状态越好。因此,收敛性能是一致性问题的重要指标。有限时间一致性是指系统的状态量在有限时间内趋于一致,这个有限时间的具体值则可以根据系统的性能要求和采用的控制协议来求得,当然可以通过改变控制算法的部分来获得更好的收敛性能。在实际问题中,系统总是会存在扰动的。在这种情况下,有限时间一致性算法体现出了很好的抗干扰性和不确定因素的鲁棒性,相较于其他算法而言,有着更为重要的研究意义。
早期的研究主要集中于无领导者的系统,考虑到在现实生活中一个系统可能存在一个或多个领导者,对于领导-跟随多智能体系统的一致性问题也被广泛研究。但是大多数现有的成果都集中于很简单的情况,也就是多智能体系统是一阶动态模型。最近,也有一些研究学者提出了一些控制协议来研究二阶多智能体系统的有限时间一致性问题,但是这些一致性协议依赖系统的全局信息反馈,很少有研究成果解决当系统的相对速度信息不可测量情况下的一致性问题。当智能体不配备速度传感器或者相对速度信息不能够直接测量时就会出现这种问题。而且,由于存在物理限制,执行器会出现饱和现象,因此设计一个控制协议来解决输入饱和也是一个很有意义的课题。例如,每个机器人根据获得的期望的队形信息来调整自身的位置的能力是有限的。
另外,在通信拓扑方面也是值得讨论的。目前发表的文献中大多对于智能体的交互网络的处理都是无向的,但是在实际生活中,有向的通信拓扑更为常见。甚至,由于外在因素的影响,通信拓扑也会变化,智能体之间的连接可能消失也可能增加,所以,拓扑是可变的,我们称这样的情况为切换拓扑。切换拓扑对于系统一致性的影响也是值得探讨的问题。
1.2 研究现状
2 预备知识
2.1 图论知识
在处理一致性问题中,将多智能体之间的通信拓扑转化成图的形式,运用图论知识解决此类问题是非常普遍并且有效的做法。这种做法就是将智能体对应成图上的点,两个智能体之间的通信连接路径转化成图上的边。接下来介绍相关的图论知识。