进化稳定策略都是完全理性博弈的纳什均衡(Nash Equilibrium),是纳什均衡中对有限理 性有稳健性的一部分。因此,进化稳定策略可以看作是对纳什均衡的一种选择精练。

1。4 动物的博弈 秋天,落基山脉的低温降临,雄性的麋鹿进入发情期,一只雄鹿要花费相当长的时间去

吸引雌性。这期间,雄鹿之间会产生冲突。有时候,失败者可能会在冲突中受伤。长期来看, 即便是赢家的雄鹿也可能会有一定程度上的损失,使它在冬天到来之时,在不利条件下变得  虚弱。

其实,动物的冲突不光出现在异性的抢夺中,还会出现在争抢食物、资源的过程中。比 如,一群抢食一头死亡的羚羊的狮子,彼此之间会为分食而相互争夺。此时,相互争夺的是 食物,而不是异性的生物个体,但是,争夺的本质还是相同的。

由此看来,似乎可以通过确定成本和收益以求解最优策略的优化模型,来解决动物之间 的这些冲突,但是又有着一些局限性,因为其中每个个体的最优策略都要依赖于群体之间对 手的行为来确定。

因此,可以利用进化博弈论来讨论此类情形。

2。 进化博弈的研究现状

2。1 历史背景:

2。3 国内研究现状 2。4 发展趋势

3。 懦夫博弈

懦夫博弈(Chicken Game),又被称为胆小鬼博弈,鹰鸽博弈。原理是当两个参与者都不 屈服,那么可能最坏的结果会发生。懦夫博弈是一个离散对称的博弈模型。假设现在有两个 人,以一定的钱数打赌,每人驾驶自己的汽车,面对面相向行驶。此时,有两个策略,懦夫 (Coward)会在最后时刻改变方向以避免两者相撞,但是,这会使他输掉这个赌局,而非懦夫 (Non-coward)的那一方将采取不转弯的方式前行,如果对方也不转弯那么会与对方相撞。

每一个参与者的回报依赖于对手将要执行的策略。为了计算对局的回报,我们需要知道 以下内容:①奖励或资源的价值;②获胜的成本;③获胜的概率;④失败的成本;⑤失败的 概率。

当对手采用策略 N 时,策略 C 的回报为:

E(C, N )  (C战胜N的概率) (资源的价值 - 取胜的成本)-

(C输给N的概率)(失败的成本)

表 3-1 在懦夫博弈中参与者 1 的回报矩阵

参与者 1 参与者 2

C N

C

N E(C, C) E(C, N )

E(N , C) E(N , N )

值得注意的是,E(C, N )  E(N , C) ,因为第一个是参与者 1 采取策略 C 对于策略 N 的

回报值,而第二个是他采取策略 N 对于策略 C 的回报值,这里可以认为他们俩回报值不相 等。

这个对弈当中,有两个纯策略,一个是总是执行懦夫策略,另一个是执行非懦夫策略。 然而,现实中会有人采用混合策略,即懦夫策略和非懦夫策略的结合,最后的决定可能会取 决于对方的背景或其他客观原因。表 1 中给的回报值是纯对策的回报值。文献综述

我们可以计算混合矩阵的回报值。假设 A 表示一个混合策略,概率 p 为采用懦夫策略 的概率,概率 (1p) 表示采用非懦夫策略的概率。那么,第一个混合策略可以表示为:

A pC (1p)N

同样的,用 B 表示第二个混合策略,表达式为:

B qC (1q)N

假设参与者的策略选择是独立的,那么懦夫策略将以 pq 的概率与懦夫策略相遇,懦夫 与非懦夫策略的相遇概率为 p(1q) ,非懦夫与懦夫策略的相遇概率为 (1p)q ,非懦夫与

上一篇:数形结合中学数学中的应用
下一篇:初中数学制题研究针对新课标下初中部分题目编选

基于决策树算法的篮球联赛预测

基于t分布对还黄金期货的投资风险分析

基于长时间序列MODIS数据的...

基于小学生视角的数学作业批改现状的调查

基于高分影像的钱塘江主要污染区域遥感监测

基于logit模型的大学生金融投资理财行为研究

基于程序化交易证券买卖点的界定

老年2型糖尿病患者运动疗...

互联网教育”变革路径研究进展【7972字】

ASP.net+sqlserver企业设备管理系统设计与开发

网络语言“XX体”研究

张洁小说《无字》中的女性意识

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

新課改下小學语文洧效阅...

麦秸秆还田和沼液灌溉对...

安康汉江网讯