博弈论与纳什均衡理论
一 、 何为博弈论 、纳什均衡
娜啦嘟麟娜如麟科脚幽翩娜嗽嘛偏娜
对于一些非数学专业和经济学专业的人们来说 ,
博弈论可能是一个极为陌生的概念 。 因为国内学者把
博弈论运用于经济学研究不过是近几年的事 , 也不普
遍 , 而且它本身的
也博大精深 。 但在国外 , 博弈论
已成为占据主流的
工具 , 真正懂得经济学的专家
学者一定精晓博弈论 。 博弈论的提法可能太过于学
术化 , 容易让人们退避三舍 。其实它有一个非常通俗的
名字 —游戏理论 博弈论 的英文名字 叫做
“ 田刀
” , 如果直译 , 就是 “ 游戏理论 ” 。 博弈论在我国
还有一个名字 , 叫对策论 。 博弈字面意思就是赌博 、下
棋 。赌博和下棋的时候常常要千方百计地应付对手 , 当
然必须要讲究对策 。
如果我们要进行一场游戏 , 首先肯定要有参加游
戏的人 , 否则游戏就无法进行下去 , 游戏活动的参与人
有一个学术名称叫“ 局中人 ” 。其次 , 每一个“ 局中人 ”都
有 自己的 “ 行动 ” , 或者叫做“ 策略 ” 、“ 对策 ” , 如果行动
不是单一的 , 那么这个局中人所有的行动构成一个集
合 , 称行动组合或策略组合 另外 , 还应该约定输家要
付出什么代价 , 燕家可获得什么利益 , 这在术语上叫做
“ 支付 ” 或 “报酬 ” 。 当然 , 一场游戏肯定结果不是唯一
的 , 各个参与人分散决策采取不同的行动 , 会造成不同
的结果 。但是纳什证明出 , 在有限个局中人参加的有限
行为对策中 , 至少存在一个所有参与人的最优战略的
组合 , 这叫做“ 纳什均衡 ” 。 处于纳什均衡状态下 , 每个
人都不能通过改变策略来得到更大的收益 , 所以谁也
不存在改变现状的动力 。
二 、 博弈论与纳什均衡理论的最初发展
漱翩曰侧翻南篇濡威甲肠然胭侧翻脚
博弈论主要是 由冯
·
诺依曼 一 刀创所立
的 。 他是一位出生于匈牙利的天才的数学家 。 他不仅
创立 了经济博弈论 , 而且发明了计算机 。 早在 世纪
初 , 塞梅鲁 、鲍罗仍。 和冯
·
诺伊曼 已经开
始研究博弈的准确的数学表达 , 直到 年 , 冯
·
诺依
曼遇到经济学家奥斯卡
·
摩根斯特恩 。
, 并与其合作才使博弈论进人经济学的广 阔领
域 。
年冯
·
诺依曼与奥斯卡
· 摩根斯特恩合著的
巨作 博弈论与经济行为 》出版 ,
着现代系统博弈
理论的初步形成 。 尽管对具有博弈性质的问题的研究
可 以 追 溯到 世纪甚 至 更早 , 例 如 , 年古诺
。 简单双寡头垄断博弈 年伯特兰 和
年艾奇沃奇思研究 了两个寡头 的产量与价格垄断
多年前中国著名军事家孙武的后代孙殡利用博
弈论方法帮助 田忌赛马取胜等等都属于早期博弈论的
萌芽 , 其特点是零星 的 、片断的研究 , 带有很大的偶然
性 , 很不系统 。冯
·
诺依受和摩根斯特恩的《博弈论与经
济行为 》一
中提出的标准型 、扩展型和合作型博弈模
型解的概念和分析方法 , 奠定了这门学科的理论基础 。
合作型博弈在 世纪 年代达到了斌峰期 。然而 , 诺
依曼的博弈论的局限性也 日益暴露出来 , 由于它过于
抽象 , 使应用范围受到很大限制 , 在很长时间里 , 人们
对博弈论的研究知之甚少 , 只是少数数学家的专利 , 影
响力有限 。 正是在这个时候 , 非合作博弈 —
“ 纳什均
衡 ”应运而生了 , 它标志着博弈论的新时代的开始
纳什在上大学时就开始从事纯数学的博弈论研
究 , 年进人普林斯顿大学后更是如鱼得水 。 岁
出头已成为闻名世界的数学家 。 特别是在经济博弈论
领域 , 他做出了划时代的贡献 , 是继冯
·
诺依曼之后最
伟大的博弈论大师之一 。 纳什不是一个循规蹈矩的学
生 , 他经常旷课 。 据他的同学们回忆 , 他们根本想不起
来曾经什么时候和纳什一起完完整整地上过一门必修
课 。 然而 , 纳什毕竟是一位英才天纵的非凡人物 , 他广
一 一
泛涉猎数学王 国的每一个分支 , 如拓扑学
、
代数几何
学 、逻辑学 、博弈论等等 , 并深深地为之着迷 。纳什经常
显示 出他与众不同的 自信和 自负 。 年整个夏天纳
什都忙于应付紧张的考试 , 他的博弈论研究工作被迫
中断 , 他感到这是莫大的浪费 。 殊不知这种暂时的“ 放
弃 ” , 使原来模糊
、杂乱和无绪的若干念头 , 在潜意识的
持续思考下 , 逐步形成一条清晰的脉络 , 而突然来 了灵
感 。 这一年的 月 , 他骤感才思潮涌 , 梦笔生花 。 其中
一个最报眼的亮点就是 日后被称之为“ 纳什均衡 ”的非
合作博弈均衡的概念 。 纳什的主要学术贡献体现在
年和 年的两篇
之中 包括一篇博士论
文 。 年他才把 自己 的研究成果写成题为《非合作
博弈 》的长篇博士论文 , 年 月 刊登在美国全国
科学院每月公报上 , 立即引起轰动 。
纳什的 “ 非合作搏弈的均衡 ” 即 “ 纳什均衡 ” 理
论确立并非一帆风顺 。 纳什的研究奠定 了现代非合作
博弈论的基石 , 后来的博弈论研究基本上都沿着这条
主线展开 。 然而 , 当初纳什天才的发现却遭到冯
·
诺依
曼的断然否定 , 在此之前他还受到爱因斯坦的冷遇 。就
在遭到冯
·
诺依曼贬低几天之后 , 他遇到盖尔 , 告诉他
自己 已经将冯
·
诺依曼的“ 最小最大原理 ’, 兹山几斌
推到非合作博弈领域 , 找到 了普遍化的方法和
均衡点 。盖尔听得很认真 , 他终于意识到纳什的思路比
冯 ·诺伊曼的合作博弈的理论更能反映现实的情况 , 而
对其严密优美的数学证明极为赞叹 。 盖尔建议他马上
整理出来发表 , 以免被别人捷足先登 。纳什这个初出茅
庐的小子 , 根本不知道竞争的激烈 , 从未想过要这么
做 。结果还是盖尔充当了他的“ 经纪人 ” , 代为起草致科
学院的短信 , 系主任列夫谢茨则亲 自将文稿递交给科
学院 , 使得这位骨子里挑战权威 、 藐视权威本性的纳
什 , 终成一代大师 。纳什提出的著名的纳什均衡的概念
在非合作博弈理论中起着核心的作用 。 后续的研究者
对博弈论的贡献 , 都是建立在这一概念之上的 。 由于纳
什均衡的提出和不断完善为博弈论广泛应 用 于经济
学 、管理学
、社会学 、政治学 、军事科学等领域奠定了坚
实的理论基础 。
三 、 深奥理论中的简单故事
撰麟洲姗触娜姗翻娜麒麟翻她脚姗麟
博弈论是运筹学的一个分支 , 虽然其应用和运算
少不 了一大堆数学公式 , 但其所涉及讨论的却是 日常
经济生 活问题 。 博弈论研究者看经济社会问题犹如棋
局 , 常常寓深刻道理于游戏之中 。 所以 , 多从我们的 日
一 一
常生活中的凡人小事人手 , 以身边的故事为例 , 就容易
对深奥的博弈论和纳什均衡进行理解且又不乏味 。
说有一天 , 一位富翁在家中被杀 , 财物被盗 。 警方
在此案的侦破过程中 , 抓到两个犯罪嫌疑人 , 斯卡尔菲
丝和那库尔斯 , 并从他们的住处搜出被害人家中丢失
的财物 。 但是 , 他们矢 口否认曾杀过人 , 辩称是先发现
富翁被杀 , 然后只是顺手牵羊偷了点儿东西 。于是普方
将两人隔离 , 分别关在不同的房间进行审讯 。 由地方检
察官分别和每个人单独谈话 。 检察官说 , “ 由于你们的
偷盗罪 已有确凿的证据 , 所以可 以判你们 年刑期 。但
是 , 我可 以和你做个交易 。 如果你单独坦白杀人的罪
行 , 我只判你 个月的监禁 , 但你的同伙要被判 年
刑 。 如果你拒不坦白 , 而被同伙检举 , 那么你就将被判
年刑 , 他只判 个月的监禁 。 但是 , 如果你们两人都
坦白交代 , 那么 , 你们都要被判 年刑 。 ”斯卡尔菲丝和
那库尔斯该怎么办呢 他们面临着两难的选择 —坦白或抵赖 。显然最好的策略是双方都抵赖 , 结果是大家
都只被判 年 。 但是由于两人处于隔离的情况下无法
串供 , 所以 , 按照亚当
·
斯密的理论 , 每一个人都是从利
己的 目的出发 , 他们选择坦白交代是最佳策略 。因为坦
白交代可 以期望得到很短的监禁 — 个月
, 但前提
是同伙抵赖 , 显然要 比 自己抵赖要坐 年牢好 。 这种
策略是损人利己的策略 。不仅如此 , 坦白还有更多的好
处 。 如果对方坦白了而 自己抵赖 了 , 那 自己就得坐
年牢 。 太不划算了 因此 , 在这种情况下还是应该选择
坦 白交代 , 即使两人同时坦白 , 至多也只判 年 , 总 比
被判 年好 。所以 , 两人合理的选择是坦白 , 原本对双
方都有利的策略 抵赖 和结局 被判 年刑 就不会 出
现 。 这样两人都选择坦白的策略以及因此被判 年的
结局被称为 “ 纳什均衡 ” , 也叫非合作均衡 。 因为 , 每一
方在选择策略时都没有 “ 共谋 ” 申供 , 他们只是选择
对 自己最有利的策略 , 而不考虑社会福利或任何其他
对手的利益 。 也就是说 , 这种策略组合由所有局中人
也称当事人 、参与者 的最佳策略组合构成 。 没有人会
主动改变 自己的策略以便使自己获得更大利益 。 “ 囚徒
的两难选择 ”有着广泛而深刻的意义 。个人理性与集体
理性的冲突 , 各人追求利己行为而导致的最终结局是
一个 “ 纳什均衡 ” , 也是对所有人都不利的结局 。他们两
人都是在坦白与抵赖策略上首先想到 自己 , 这样他们
必然要延长的刑期 。只有当他们都首先替对方着想时 ,
或者相互合谋 申供 时 , 才可以 得到最短时间的监禁
的结果 。 “ 纳什均衡 ”首先对亚当
·
斯密的“ 看不见的手 ”
嘴翔监妙翻旧
的原理提出挑战 。 按照斯密的理论 , 在市场经济中 , 每
一个人都从利己 的 目的出发 , 而最终全社会达到利他
的效果 。亚当
·
斯密在《国富论 》中有名名言 “通过追求
个人的 自身利益 , 他常常会 比其实际上想做 的那样
更有效地促进社会利益 。 ”但从 “ 纳什均衡 ”引出了“ 看
不见的手 ”的原理的一个悖论 从利己 目的出发 , 结果
损人不利己 , 既不利己也不利他 。两个囚徒的命运就是
如此 。从这个意义上说 , “ 纳什均衡 ”提出的悖论似乎动
摇了西方经济学的基石 。 因此 , 从“ 纳什均衡 ”中我们还
可以悟出一条真理 合作是有利的“ 利己策略 ” 。但它必
须符合以下的黄金定律 按照你愿意别人对你的方式
来对别人 , 但只有他们也按同样方式行事才行 。 其次 ,
“ 纳什均衡 ”是一种非合作博弈均衡 , 在现实中非合作
的情况要 比合作情况普遍 。所以 “ 纳什均衡 ”是对冯
·
诺
依曼和摩根斯特恩的合作博弈理论的重大发展 , 甚至
可以说是一场革命 。
从 “ 纳什均衡 ”的普遍意义 中我们可 以深刻领悟
司空见惯的经济 、社会 、政治 、 国防 、管理和 日常生活中
的博弈现象 。我们可以列举出许多类似于 “ 囚徒的两难
处境 ” 这样的例子 。 一般的博弈问题由 个要素所构
成 即局 中人印场 又称当事人 、参与者
、策略等等的
集合 , 策略 集合以及每一对局中人所做的选
择和底得中 。网集合 。 其中所谓赢得是指如果一个特
定的策略关系被选择 , 每一局中人所得到的效用 。所有
的博弈间题都会遇到这三个要素 。
四 、 社会经济中的几个例子
翻姗暇朋麟溯翻城溯麟翔翔翻撇嘿跪
价格战博弈 。
现在我们经常会遇到各种各样的家电价格大战 ,
彩电大战 、 冰箱大战 、空调大战 、微波炉大战 ⋯ ⋯这些
大战的受益者首先是消费者 。 每当看到一种家电产品
的价格大战 , 百姓都会 “ 没事儿偷着乐 ” 。 在这里 , 我们
可 以解释厂家价格大战的结局也是一个 “ 纳什均衡 ” ,
而且价格战的结果是谁都没钱赚 。 因为博弈双方的利
润正好是零 。 竞争的结果是稳定的 , 即是一个 “ 纳什均
衡 ” 。 这个结果可能对消费者是有利的 , 但对厂商而言
是灾难性的 。 所以 , 价格战对厂商而言意味着 自杀 。 从
这个案例中我们可 以引伸出两个问题 , 一是竞争削价
的结果或“ 纳什均衡 ”可能导致一个有效率的零利润结
局 。 二是如果不采取价格战 , 作为一种敌对博弈论恤
吐四 , 其结果会如何呢 每一个企业 , 都会考虑采
取正常价格策略 , 还是采取高价格策略形成垄断价格 ,
并尽力获取垄断利润 。如果垄断可 以形成 , 则博弈双方
的共同利润最大 。这种情况就是垄断经营所做的 , 通常
会抬高价格 。另一个极端的情况是厂商用正常的价格 ,
双方都可 以获得利润 。从这一点 , 我们又引出一条基本
准则 “把你 自己的战略建立在假定对手会按其最佳利
益行动的基础上 ” 。事实上 , 完全竞争的均衡就是 “ 纳什
均衡 ”或 “ 非合作博弈均衡 ” 。 在这种状态下 , 每一个厂
商或消费者都是按照所有的别人已定的价格来进行决
策 。 在这种均衡中 , 每一企业要使利润最大化 , 消费者
要使效用最大化 , 结果导致了零利润 , 也就是说价格等
于边际成本 。在完全竞争的情况下 , 非合作行为导致了
社会所期望的经济效率状态 。 如果厂商采取合作行动
并决定转向垄断价格 , 那么社会的经济效率就会遭到
破坏 。 这就是为什么 和各国政府要加强反垄断
的意义所在 。
贸易 自由与壁垒的博弈 。
这个问题对于刚刚加人 的中国而言尤为
重要 。 任何一个国家在国际贸易中都面临着保持贸易
自由与实行贸易保护主义的两难选择 。 贸易 自由与壁
垒问题 , 也是一个 “ 纳什均衡 ” , 这个均衡是贸易双方采
取不合作博弈的策略 , 结果使双方因贸易战受到损害 。
国试图对 国进行进 口 贸易限制 , 比如提高关税 ,
则 国必然会进行反击 , 也提高关税 , 结果谁也没有
捞到好处 。反之 , 如 和 能达成合作性均衡 , 即从互
惠互利的原则出发 , 双方都减少关税限制 , 结果大家都
从贸易 自由中获得 了最大利益 , 而且全球贸易的总收
益也增加 了 。
在现实社会经济活动中 , 几乎不存在完全垄断或
完全竞争的情况 。 企业在市场中 , 既有一定 的垄断势
力 , 又面临很大的竞争压力 。企业之间具有相关性和依
存性 。 因此 , 可以用博弈论的方法解释和说明企业的竞
争行为和策略 。
博弈论都是一个强有力 的分析工具 。 现在 , 它不
仅在经济学领域得到广泛应用 , 在军事 、政治
、
商业征
战 、 社会科学领域以及生物学等 自然科学领域都有非
常重大的影响 , 工程学中如控制论工程也少不了它 。 以
上所举例子 , 只是想对精深的数学理论作一个通俗的阐
述 , 对博弈论和纳什均衡的基本概念作一个简明的介
绍 。 现在与它紧密联系的经济学分支是信息经济学 。 信
号游戏 、拍卖形式 、激励机制 、委托人一代理人理论和公
共财政学是博弈论和信息经济学研究的重要课题 。
作者单位 上海石化企业管理协会
一 一