为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 基于进化博弈论的煤矿安全监管的研究(可编辑)

基于进化博弈论的煤矿安全监管的研究(可编辑)

2017-12-20 50页 doc 82KB 30阅读

用户头像

is_841159

暂无简介

举报
基于进化博弈论的煤矿安全监管的研究(可编辑)基于进化博弈论的煤矿安全监管的研究(可编辑) 基于进化博弈论的煤矿安全监管的研究 西安科技大学 硕士学位论文 基于进化博弈论的煤矿安全监管研究 姓名:毕中毅 申请学位级别:硕士 专业:安全技术及工程 指导教师:田水承 2011 论文题目:基于进化博弈论的煤矿安全监管研究 专 业:安全技术及工程 硕 士 生:毕中毅 (签名) 指导教师:田水承 (签名) 摘 要 安全是煤矿生产的生命线。近年来,我国的煤矿生产事故发生率逐年下降,但总体 安全形势依旧严峻。安全监管效能低是造成煤矿生产事故频发的重要...
基于进化博弈论的煤矿安全监管的研究(可编辑)
基于进化博弈论的煤矿安全监管的研究(可编辑) 基于进化博弈论的煤矿安全监管的研究 西安科技大学 硕士学位论文 基于进化博弈论的煤矿安全监管研究 姓名:毕中毅 申请学位级别:硕士 专业:安全技术及工程 指导教师:田水承 2011 论文目:基于进化博弈论的煤矿安全监管研究 专 业:安全技术及工程 硕 士 生:毕中毅 (签名) 指导教师:田水承 (签名) 摘 要 安全是煤矿生产的生命线。近年来,我国的煤矿生产事故发生率逐年下降,但总体 安全形势依旧严峻。安全监管效能低是造成煤矿生产事故频发的重要原因之一。本文基 于进化博弈理论针对煤矿安全监管问题进行研究,旨在挖掘造成低效安全监管的深层次 原因,为提高煤矿安全监管效能提供建议对策。 本文首先剖析了目前煤矿安全监管存在的问题,对问题的成 因及具体表现形式进行 了详细的阐述。问题主要集中在 5 个方面:机构设置引发的重复监管;安全监管投入不 足,忽视对职业病的监管;未能充分发挥大众媒体的监管作用;煤矿安全监管机构自身 存在问题。监管理念不够科学、监管责任不够明确、地方政府对安全监管的干涉、片面 追求短期的经济利益等四个方面的原因造成了安全监管低效问题。 在此基础上,本文通过进化博弈论与经典博弈论的比较分析,提出了进化博弈论分 析煤矿安全监管的可行性。根据煤矿安全监管存在的问题,依照安全监管利益相关者之 间的相互关系确定了政府与煤矿、煤矿与矿工、煤矿与煤矿之间、煤矿与新闻媒体、煤 矿安监机构自身等 5 种博弈关系,分别构建得益矩阵,求解稳定策略 (ESS )和复制动 态方程,并结合煤矿安全监管的实际情况在不同假设条件下对模型计算结果进行了讨论 分析。 通过对 3 个典型案例:山西省煤矿兼并重组、新闻媒体对王家岭透水事故的追踪报 道、山西忻州煤监局受贿案的分析,阐明了本文针对煤矿与煤矿之间的合作竞争、监管 成本和违规成本的进化博弈分析结论的合理性。最后,以提高煤矿安全监管效能为目标, 提出了转变政府职能、加大安全监管投资、加强安全体系建设、强化小煤矿安全监管、 重视职业病危害、强化社会监督及加强安监队伍自身建设的建议 对策。 关 键 词:煤矿安全;安全监管;进化博弈;安全利益;监管 效能 研究类型:应用研究 Subject :Research on Coalmine Safety Supervision Based on Evolutionary Game Theory Specialty :Safety Technology and Engineering Name :Bi Zhongyi Signature Instructor :Tian Shuicheng Signature ABSTRACT Safety is the lifeline of the coalmine production. In recent years, in our country, the overall safety situation is still severe, although the production accident rate has been declining. The one of the fatal reasons of frequent coalmine accidents is the lower Safety supervision efficiency. So, in this paper, based on the evolutionary game theory, the problem of coalmine safety supervision has been researched, in order to dig the deep reason of lower Safety supervision efficiency, and provide advice countermeasures for the improvement of the safety supervision efficiency. In this paper, the current problems of coalmine safety supervision analyzed. The cause of the problem and the concrete forms has been declared in detail. Five reasons of the lower safety supervision efficiency have been provided. There are, institutional setup trigger repetition of supervision; the inadequate investment for safety supervision, neglecting to occupational disease; failed to give full play to the supervision role of the mass media; coalmine safety instrument has own existence problem. Base on the above research, in this paper, the comparative analysis between evolutionary game theory and classical game theory has been provided, then the feasibility of evolutionary game theory was verified. Base on the problems of coal mine safety supervision, according to the relationship with safety regulators stakeholders, the five Game of Govemment and coalmine, coalmine and miners, coalmine and coalmine, coalmine and media and themselves of coalmine safety supervision were determined, the five payoff matrixes established and solved its stable strategy ESS and copy dynamic equation, and discussed the model result which combined with the actual situation of safety supervision under the different assumptions. Three typical cases were chosen, about Shanxi coal mine enterprise integration and the report of permeable accident in Wang jailing and the bribery case of Xinzhou, Shanxi Coal Bureau Supervisor. Verified the conclusions by evolutionary game about the cooperation between the coal enterprise in competition, regulatory costs and violation costs. Last, in order to improve coalmine safety supervision efficiency, seven policy recommendations have been given. There are, transformation of government functions, improve the investment of safety supervision, strengthening the safety system construction, strengthen small coalmine safety supervision, attention occupational hazards, strengthen social supervision, and strengthen the construction of safety supervision instrument. Keywords :Coalmine safety Safety supervision Evolutionary Game Theory Safety interests Effectiveness of supervision Thesis : Application Research 学位论文 独创性说明 本人郑重声明:所呈交的学位论文是我个人在导师指导下进 行的研究工作及 其取得研究成果。尽我所知,除了文中加以标注和致谢的地方外, 论文中不包含 其他人或集体已经公开发表或撰写过的研究成果,也不包含为获 得西安科技大学 或其他教育机构的学位或证书所使用过的材料。与我一同工作的 同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 学位论文作者签名: 日期: 学位论文 知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期间 论文工作的知识产权单位属于西安科技大学。学校有权保留并向国家有关部门或 机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学 位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存和汇编本学位论文。同时本人保证,毕业后结合 学位论文研究课 题再撰写的文章一律注明作者单位为西安科技大学。 保密论文待解密后适用本声明。 学位论文作者签名: 指导教师签名: 年 月 日 1 绪论 1 绪论 1.1 选题背景和研究意义 1.1.1 选题背景 伴随着我国国民经济和工业生产的迅猛发展,能源的需求量越来越大。煤炭是我国 能源开采和消耗的主体,煤炭在能源生产和消费中的比例一直在 70% 以上,而且这种格 局短期内不会得到根本改变;据有关专家预测,到 2050 年,我国煤炭在能源消耗中的 比例仍占50% 以上。 我国不但是个用煤大国,更是一个产煤大国,根据第三次全国煤田预测资料,除台 湾省外,我国垂深在 2000 米的煤炭资源总量为 55697.49 亿吨,其中探明保有资源量 10176.45 亿吨,预测资源量 45521.04 亿吨。在探明保有资源量中,生产、在建井占用资 源量 1916.04 亿吨,尚未利用资源量 8260.41 亿吨。然而虽然煤的储量相当可观,但根 据中国煤矿瓦斯地质图编图组及相关单位对 25 个省区 1799 对大、中、小型矿井资料的 统计,高沼气矿井 486 对,占27% ;煤与瓦斯突出矿井 249 对,占 14%;高沼气矿井和 煤与瓦斯突出矿井 735 对,占统计矿井的41% ,可见我国高、突矿井之多、比重如此之 大,给煤矿的安全生产带来了极大的困难,而我国煤矿频繁发生的生产事故更造成了巨 大的经济损失,制约了经济的可持续发展。因此,煤矿的生产安全是我国经济发展的战 略保障,是安全监管的头等大事。 虽然我国在狠抓安全工作后卓有成效,但煤矿安全形势依然不用乐观 (见表 1.1 2006-2009 年我国煤矿重大安全事故),从国家安全生产监督总局的报告中就能看出,据 报告中显示 2009 年上半年,全国共发生各类事故 186775 起,死亡 36370 人,其中煤矿 发生 749 起,死亡 1175 人,重大安全事故 30 起中光煤矿就发生了 6 起,死亡 82 人, 特别重大事故均为煤矿安全生产事故 2 起,死亡 108 人。经济的快速发展离不开能源的 支撑,而大量的能源开采决不能以牺牲生命为代价,如何能够保证经济健康、快速并可 持续的发展,又要降低原煤开采过程中的事故发生率,是我国政府和产煤企业共同关注 的问题。煤矿的生产事故发生的原因是多方面的,安全监管效能低是重要原因之一,面 对来自生产和安全两方面的压力,作为安全监管主体的政府针对煤矿安全问题连续出台 了一系列政策和措施,而这些均属于安全监管活动的范畴,加大 监管力度、提高监管效 率是在一定程度上遏制煤矿安全恶性事故的有效办法之一。对煤矿事故的预防、煤矿的 安全管理、构建煤矿企业安全生产长效机制,实现煤矿企业科学的、可持续发展有着重 要意义。 1 西安科技大学硕士学位论文 表1.1 2006-2009 年我国煤矿重大事故 年 份 重大事故 2006 年 3 月 13 日,内蒙古鄂尔多斯市荣盛煤矿发生瓦斯爆炸事故,当班井下有 34 人作业, 2006 经抢救,有 13 人生还,21 人死亡,该矿属乡镇煤矿,高瓦斯矿井,未取得安全生产许可 证。 2007 年 3 月 10 日20 时 44 分,辽宁抚顺矿业集团公司老虎台煤矿发生特大透水事故,造 2007 成 22 人死亡、7 人下落不明。 2007 年 3 月 18 日,山西省晋城市城西区西上庄苗匠联办煤矿发生一起特大瓦斯爆炸事故。 2007 事故发生后,造成 21 人全部遇难,该矿隐瞒不报,破坏现场,主要负责人员逃匿。 2008 年 8 月 18 日8 时 50 分,辽宁省沈阳市法库县柏家沟煤矿二水平 301 采煤工作面发生 2008 一起瓦斯爆炸事故。事故当班下井 81 人,事故区域 37 人,经全力抢救,先后抢救出 14 人 (其中 2 人经医院抢救无效死亡)。 2008 年 9 月4 日,阜新市清河门区河西镇第八煤矿北八路斜下探查道二平巷掘进工作面右 2008 前方的一平巷六上山采空区发生一起重大瓦斯爆炸事故,造成 27 人死亡、 2 人重伤、4 人 轻伤,直接经济损失 887.4 万元。 2009 年 2 月22 日2 时20 分, 山西焦煤集团西山煤电公司屯兰煤矿南四采区发生特别重大瓦 2009 斯爆炸事故。当班下井436 人,其中 358 人生还,事故造成 78 人死亡、114 人受伤 (其中 重伤 5 人)。 2009 年黑龙江鹤岗 11 月27 日16 时左右,黑龙江省鹤岗市新兴煤矿“ 1??21”特大瓦斯爆炸事 2009 故最后一位遇难者遗体已经找到,最终确定该事故共造成 108 人死亡。 1.1.2 研究意义 改革开放以来,我国确定了 “国家监察、地方监管、企业负责”的煤矿安全监管格 局。这个基本格局主要涉及中央政府、地方政府、矿主、矿工等,以及媒体、非政府组 织等群体,这些相互独立的不同利益群体相互之间呈现出复杂的利益关系。各个利益群 体无法在国家主导下通过协商和相互妥协达成利益平衡,因此导致煤矿安全监管效率低 下。目前国内运用经典博弈论对煤矿安全监管分析的较多,虽然有指导作用,但不能充 分反映真实情况。进化博弈理论是从有限理性的个体出发,以群体为研究对象,认为现 实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过 程来实现的,从而克服经典博弈理论的局限性,得出更为合理的结论。 为此,针对我国煤矿安全监管的实际,本文选择了较经典博弈理论更能符合煤炭生 产实际情况的进化博弈论方法来研究我国煤矿的安全监管,旨在深刻揭示煤矿安全监管 的本质特征和微观机理,为设计更为有效的煤矿安全监管制度提供科学依据。 2 1 绪论 1.2 国内外研究现状 1.2.1 国外研究现状 (1)国外对于安全监管问题的研究起步较早,本文选取了近几年来具有代表性的 研究观点如下: Viscusi 对与安全监管的研究指出:监管效果不佳的原因除了政府监管机构的责任 [1] 外,企业的安全管理体制也有责任 。 Gray 和 Scholz 通过研究发现监管机构的罚款是实现安全生产的重要举措,若将罚 [2] 款数额减少会导致生产企业 22% 的事故增加 。 Boal. William M, John Pencavel 对矿工和煤矿安全 监管的研究认为:煤矿工人的自 [3] 身素质同煤矿安全管理水平有着密切的关系 。 William P (Curinton 通过研究指出:降低事故发生率不 等于降低了事故所造成的伤 [4] 害的严重性,提高政府安全监管效能是一项十分复杂的系统工 程 。Paul Lanoie 使用了 更能说明一般性问题的博弈模型,分析了企业的策略选择对安全 监管效能的影响,并将 [5] 员工作为一个因素考虑其中 。 Boal William M 通过研究得出:解决煤矿安全生产问题不是单方面调整的问题,而 [6] 是通过多方面综合调整努力的结果 。 W (Kip Viscusi 、John M (Vernon 和 Joseph E (Harrington 在其著作中阐述了提高 [7] 安全监管效能关键的措施是制定更好的政策 。Wright, Tim 还对我国小煤矿的用工制度 研究中指出:我国农村剩余劳动力为了生存保障,在小型私营煤矿未经安全培训即上岗 [8] 的现象造成了严重的安全隐患,使得煤矿企业的用工情况变得极为复杂 。Kniesner 和 Leeth 通过相关数据研究发现:随着政府监管成本的不断增加,监管机构监督检查的次 [9] 数会减少 。Bowles 和 Gintis 认为:尽管人与人之间的遗传相关度很低,但却能在工作 中高度合作。通过利用博弈论分析,为了实现合作而实行的利他主义惩罚,即使这种惩 罚也需要经济成本[10] 。 (2 )国外关于博弈论的研究早在上世纪20 年代就开始了,对博弈论产生和发展起 了重要作用的研究观点如下: 在博弈论的概念正式提出之前,法国数学家 Borel 在 20 世纪 20 年代就运用数学理 论描述博弈问题,并创造性的提出了“策略”的概念[11] 。作为博弈论的创始人之一的冯??诺 依曼在 1928 年发表的一篇论文中证明了博弈论中的基本定理 (博弈矩阵要由博弈方的 混合策略决定),此定理的证明标志着博弈论的诞生。 1944 年冯??诺依曼在和摩根斯坦合作正式论证并给出了合作博弈的模型,至此现代 博弈理论已经初步形成。他们在书中还定义了其他研究博弈论的概念[12] 。 3 西安科技大学硕士学位论文 1950 年,A W Tucker 提出了著名的博弈模型 “囚徒困境”[13] 。同年,美国普林斯 [14] 顿大学的约翰??福布斯??纳什提出了著名 “纳什均衡” 理论以及证明过程,1951 年纳什 又对合作和非合作博弈[15] 的概念做出了明确的区分。 1965 年,德国经济学家莱因哈德??泽尔腾在做动态博弈的研究中引入了 “纳什均衡” 的概念,成功提出了子博弈精炼纳什均衡理论。 约翰??海萨尼[16]在 1967 至 1968 年期间,将不完全信息概念引入了博弈论研究中, 最终提出了贝叶斯均衡,后来他还将博弈论与经济学知识推广至政治和道德哲学研究范 畴中,特别是对功利主义伦理学的应用。 1982 年,戴维??克瑞普斯和威尔逊合作创作了不完全信息动态博弈中的克瑞普斯-威 尔逊序贯均衡。 (3 )自科学家Veblen 将生物进化理论引入经济学领域以来,国外对于进化博弈论 的研究已经较为成熟了,具有代表性的研究观点如下: Alchian A 的研究是进化论引入经济学领域的里程碑,指出进化理论会有助于企业 对外部市场变化情况做出及时有效的反应[17] 。 Lewontin R C 和 Hamilton W D 在构建生物进化模型过程中,使用了博弈论中的部 分概念,开辟了生物学和经济学研究合作的新领域[18] 。 Maynard Smith J, Price G R 作为生物学家,在研究过程中修正了经济学博弈论中的 相关部分的定义,稳定策略和复制动态方程的概念提出就始于此。进化理论同博弈论的 接合进一步得到了加强[19] 。Maynard Smith 和 Price 在研究种群中个体适应性时发现个体 的策略选择是在种群共同环境中决定的,并提出了稳定策略的概念,其基本思想是:当 一个选择不同策略的小群体要进入的到一个选择了共同策略的大群体时,小群体在这个 混合群体中的支付大于大群体的支付时,小群体就能够侵入到大群体中。 Selten 将博弈方限制行为引入非对称博弈,并提出了非对称博弈的进化稳定策略[20] 。 Selten 在进一步的研究中把种群分为单个群体与多个群体。由于多个群体中会有不 同的博弈策略,在博弈过程中若单个群体要侵入多个群体要涉及到均衡稳定性的问题, 但是多个群体中的稳定均衡都是严格的纳什均衡。在生物学研究领域中,生物种群会本 能的抵抗原有领土上入侵的外来种群,同理在经济学中成为市场阻入博弈[21] 。 Blume L,Easley D 与 Boylan R、 Bresnahan TF, Reiss PC 、Daniel Friedman 分别在 系统阐述了一个完整的进化博弈模型应该具备的策略假设:(1)稳定策略会取代不稳 定策略;(2 )博弈群体中的策略选择会相互模仿;(3 )种群间的策略影响体现在复制 策略上[22-24] 。 Christian Schmidt 、Crawford V、Cressman R 对进化博弈理论与经济学的研究标志着 进化博弈理论真正应用到了经济学研究的领域[25-26] 。 Brown D 介绍了最早把生物进化理论引入经济学领域是科学家 Veblen 。他还对组织 4 1 绪论 演化和企业制度变迁进行了深入研究,并建立了一个基于因果累积的企业经济制度演化 范式[27] 。 E Ahmed, A S. Hegazi 将 Sato Crutchfield 模型应用在了博弈论中“囚徒困境”、“鹰― 鸽”博弈。两人在研究发现:该模型没有改变博弈过程中的进化 稳定策略的选择[28] 。 Hofbauer J, Sigmund K、Nowak M A, Sigmund K 在研究进化博弈论中种群稳定策略 研究中均指出:若在一个博弈种群中策略选择的变化是随着策略微分方程变化而变化 的,策略微分方程能够表达出这种变化[29-30] 。 H Fort, E Sicardi 实现了 2×2 空间中进化博弈过程的计算机仿真模拟[31] ,为今后更为 复杂的博弈分析计算机仿真研究提供了基础。 1.2.2 国内研究现状 (1)国内关于煤矿安全监管方面的研究: 西安科技大学田水承,李红霞教授在 1998 年安全科学技术国际会议的一篇文章详 细的分析和阐述了煤矿事故频发的原因并提出了相应的对策,该篇文章是国内系统研究 煤矿生产事故原因的代表作,其提出的对策时至今日都对实际生产有指导作用。对本文 在加强安全监管方面所提出的建议对策具有指导意义[32] 。 田水承,李红霞早年就曾对煤矿安全经济效益问题做了相关研究,将煤矿安全提高 到煤矿经营的战略位置来研究并就煤矿安全问题与煤矿的经济效益和社会效益的关系 进行了详细的分析。安全监管效能提高的最直接体现是煤矿安全经济效益的提高,安全 经济效益又关系到煤矿的安全投入与产出,关系到煤矿总体经济效益。煤矿安全监管和 煤矿安全经济效益问题应作为一个整体进行研究[33] 。 西安科技大学田水承,税永波从经济学的角度揭示了安全与经济的关系,在给出安 全经济学研究方法的基础上,重点阐述了安全投资对与安全管理的重要性[34] 。 西安科技大学田水承,钱新明,李红霞与北京理工大学冯长根合作就制约我国煤炭 企业发展的突出问题进行了研究。在安全管理中激励机制的科学、合理与否与安全生产 水平息息相关,对事故防御和安全监管有了更深层次的理解,对煤矿提高安全生产管理 水平做出了积极贡献[35] 。 西安科技大学徐磊,田水承结合我国企业社会责任现状,从安全观的视角进行了探 讨,对于企业的社会责任进行了定义并构建了社会责任层次模型。最终得出若企业承担 适度社会责任是能够为企业带来经济利益的。提高企业的社会责任也有利于提高安全监 管效能[36] 。 中煤国际工程设计研究总院蒋占华、邵祥理在根据弗鲁姆的期望理论,重点分析了 现有制度环境下煤炭生产各相关利益主体的不同经济动机、心理动机和管理意图[37] 。 山东工商学院于秀琴通过详细分析我国煤矿安全监察体制存在严重弊端,最终得出 5 西安科技大学硕士学位论文 体制弊端直接导致了对煤矿生产安全监察的不力和事故的失控[38] 。 清华大学钟开斌在考察了改革开放以来中国煤矿安全的状况后,分析了不同利益群 体之间复杂的互动关系对中国煤矿安全监管质量的影响,最后提出了改善中国煤矿安全 监管的政策建议[39] 。 (2 )关于运用经典博弈理论对煤矿安全监管分析的研究: 西安科技大学田水承,李红霞运用经济学和安全经济的理论观点就与企业安全利益 相关的政府、产业协会、竞争者、消费者、股东、社区、员工、媒体八类密切关系体间 的关系进行了分析,认为企业要生存和发展,必须处理好企业与上述八个相关部门、机构 之间的关系。对本文在博弈方的选取方面的指导意义很大[40] 。 西安科技大学李红霞,田水承与北京理工大学冯长根应用委 托―代理理论对煤炭安 全管理问题进行探讨,分析了安全投入与安全水平、安全投入与安全报酬、事故赔偿与 安全水平等之间的关系,提出了煤炭企业改善安全现状的管理对策及建议。他们认为事 故赔偿金过低,不足以对企业形成足够的压力,不利于企业主动提高安全水平,应加大 惩罚力度提高惩罚成本和惩处率[41] 。 西安科技大学李红霞,田水承,常心坦基于我国经济高速发展的背景及安全工作的 现状,从经济学的角度将安全视为 “公共产品”进行了分析,对如何加强安全管理和改 善安全现状提供了科学的建议和对策[42] 。 西安科技大学颜会芳,田水承,李红霞就企业与员工建立博 弈模型,计算混合策略 纳什均衡解,就员工激励机制提出见解。对本文企业与员工间的进化博弈分析有指导作 用[43] 。 西安科技大学颜会芳,田水承,李红霞,王莉在回顾安全投资理论发展历程的基础 上,归纳了相关文献给出了安全投资战略期权博弈分析的解决思路,将博弈论引入了安 全投资的研究领域,使安全投资项目的管理柔性价值和战略价值得到了准确的衡量[44] 。 清华大学与河南中鸿实业集团的胡文国,刘凌云共同合作运用博弈论方法分析了煤 矿生产相关利益者在生产与监管中的博弈行为。本文的不足在于提高监管效能的关键应 该是调整安全生产利益的再分配[45] 。 中国矿业大学郑爱华在通过博弈模型的构建剖析了影响企业安全欠账的因素,明确 了政府监管的主要对象和监管举措,最后为政府制定各种监管政策提供了建议[46] 。 中国矿业大学彭红军以煤矿安全监管部门和煤矿为博弈双方,研究在政府不断加强 安全管理情况下,煤矿事故仍然屡禁不止的深层次原因[47] 。 中国矿业大学姜福川重点就政府监督管理部门和煤矿投机两者之间的博弈展开了 分析,提出了相应的投资管理对策[48] 。 中国矿业大学周敏,肖忠海针对煤炭安全生产监管效率低下情况,应用经济博弈论 构建了两阶段博弈模型,最后得出对监管者与操作者的处罚与安 全效益公平分配相结合 6 1 绪论 能够实现违章作业零概率,彻底杜绝违章行为[49] 。 中国矿业大学孙永波,白萍,张晓天对煤炭生产企业与安全生产监管部门进行了博 弈分析,得出在安全监管政策上宜从消除煤矿超额利润、加大违法生产事故成本等方面 加以选择。本文的局限在于结论分析部分不够全面[50] 。 中国地质大学李小三,崔文彩,赵云胜利用了职业安全卫生费用模型接合博弈论原 理,对企业安全投资背后的利益冲突与协调问题进行了分析。本文的重要结论在于分析 了劳动者在利益博弈中处于弱势地位而导致了安全事故频繁发生现状的原因[51] 。 黑龙江科技学院的孙永波,耿千淇就中央政府与地方政府、地方政府与煤矿企业、 煤矿企业与煤矿工人、中央政府与煤矿工人这四组博弈方进行了详细的博弈分析。本文 优点在于博弈策略的描述详尽,但结论略显简单[52] 。 四川大学的王金炳系统阐述了博弈论的发展历史和博弈论中的基本要素,对本文撰 写博弈论方法有一定的借鉴作用[53] 。 中国矿业大学的谭玲玲,宁云才分析了煤矿生产安全管理过程中存在的“囚徒困境” 以及制度缺陷,阐述了从政府安全监管、安全生产责任划分等方面提出新的制度安排[54] 。 广东省安全科学技术研究所的范银华从分析囚徒困境模型入手,以政府、企业、员 工作为局中人进行了博弈分析。本文的分析缺乏数据运算,但结论部分对本文有一定的 指导作用[55] 。 北京印刷学院陈黎敏,蔡惠平在分析了国家、地方管理部门和企业三者的相互关系 基础上,建立博弈数学模型,并分析了如何保证企业安全生产和如何防止地方管理部门 与企业合谋。本文的不足在于没有将生产企业的员工作为一个因素来考虑[56] 。 东北财经大学解微微的在硕士论文中运用经典博弈论接合我国私营小煤矿的现状, 分析了导致事故多发的深层此原因。本文的不足在于没有将政府、企业和工人的三方合 作博弈加以研究[57] 。 四川师范大学的刘照鹏在充分研究我国煤矿安全生产现状的基础上,建立了防治煤 矿灾害事故的博弈模型,并计算了混合策略纳什均衡的求解,提出了煤矿防灾的对策建 议。本文的不足在与没有案例分析[58] 。 东北财经大学煤于浩通过建立三个博弈模型:中央政府与地方政府、政府与煤矿企 业、煤矿企业与矿工,在模型分析的基础上提出了改善煤矿安全监管的若干政策建议, 完善制度安排[59] 。 武汉大学煤矿刘穷志用博弈分析理论方法就现行的煤矿安全管制体制的局限性和 地方政府利益保护和管制官员与矿主的合谋,导致安全事故频繁发生的原因[60] 。 重庆大学的周庆行,邹小勤通过非对称信息动态博弈模型的分析,分析了在“政企 不分”和“政企分开”生产机制下,我国煤矿安全监管的变化情况。“政企分离”对本文总 结安全监管效能的提升有参考作用[61] 。 7 西安科技大学硕士学位论文 江西财经大学陶长琪、刘劲松通过建立博弈模型,分析了煤矿生产中煤矿工人、煤 矿经营者、地方政府和中央政府监管部门四方博弈主体在矿难发生与否、官煤合谋与否 等情况下的期望收益,在利益关系上开展完全信息静态博弈分析 [62] 。 湖南科技大学的禹金云与湖南财政经济学院罗一新合作以企业内部监督和企业员 工、企业外部监督和企业自身本别作为博弈方进行了分析,最后绘制了博弈混合策略选 择图[63] 。 (3 )关于运用进化博弈理论对煤矿安全监管分析的研究现状: 复旦大学的谢识予教授在我国博弈论研究领域出版了很多专著,在研究进化博弈论 方面也有建树。在进化博弈论综述类文章中,主要就进化博弈论的思想、方法、意义和 发展前景进行了阐述,关于进化博弈论的介绍十分的详尽,尤其是对稳定策略和复制动 态方程的介绍对本文有很大的指导作用[64] 。 吉林广播电视大学的张新燕就进化博弈论的发展历史、组成要素及发展方向进行了 介绍,但是反映出我国的进化博弈论研究目前只限于应用层面 [65] 。 中山大学的张良桥以理性和有限理性为线索,介绍了进化博弈理论与经典博弈理论 的区别和联系。该文献就本文介绍进化博弈论的可行性和实用性有理论指导作用。在另 一篇文献中详细介绍了进化稳定策略概念的提出及其发展,文中还利用了一些具体例子 简要地介绍了进化稳定均衡,最后还介绍了了科学家们的进一步研究成果。在对进化博 弈稳定策略的应用研究中以突变与选择两大机制为主线,系统的论述了进化稳定策略与 模仿动态,并就进化博弈论的最新研究成果做了介绍[66-68] 。 西南交通大学的付茂林博士在其博士论文中,利用进化博弈理论对煤矿安全监察行 为了详细的分析,并将监察机构的腐败行为也做为一项重要因素进行了分析[69] 。 湖南科技大学的张红波针对完善创新机制下的政府与企业的进化博弈研究,改篇文 献的重点在于进化稳定策略和复制动态方程的计算,并接合实际情况对不同假设条件下 [70] 的计算结果做了分析 。 华中科技大学的王冰对传统博弈论即经典博弈理论的局限性进行了分析,以鹰―鸽 博弈模型为例介绍了稳定策略和复制动态方程的理论,最后对经济体制的演进进行了博 弈分析。改篇文献的缺陷在于没有对经济体制的演进进行数学模型的分析[71] 。 北京理工大学的晋琳琳,侯光明以鹰―鸽博弈模型为例,以进化博弈为理论基础, 针对企业产品质量采用进化算法研究企业产品质量博弈稳定均衡的求解问题[72] 。 武汉大学的刘伟兵,王先甲对稳定策略和复制动态方程都进行了详尽的描述,还介 绍了国外研究的前沿理论[73] 。 1.2.3 存在的问题和本研究的出发点 综上所述,国外对于进化博弈论的研究无论从理论研究层面与应用层面都已趋于成 8 1 绪论 熟。国内对于进化博弈论的研究刚起步,主要侧重与方法应用层面。在煤矿安全监管的 进化博弈方面,主要集中与政府与煤矿企业,没有根据安全经济利益相关者进行全面的 总结和分析,特别是对于对煤矿企业和新闻媒体之间的博弈关系分析讨论。 本文在分析我国现行煤矿安全监管问题的基础上,运用进化博弈论对安全监管中的 五大类博弈关系进行分析,并根据所得结论提出提高煤矿安全监管效能的建议对策。 1.3 论文研究目标、内容、技术路线 1.3.1 论文研究目标 本文研究目标有三个:(1)对我国现行煤矿安全监管进行研究分析,找出存在的问 题。(2 )运用进化博弈论就 5 种博弈关系进行分析。(3 )根据进化博弈论的分析结果, 提出提高我国安全监管效能的建议对策。 1.3.2 论文研究内容 本课研究主要内容如下: (1)进化博弈论与经典博弈论的比较分析 通过对参与人的理性假设、分析方法和研究对象、动态分析、均衡及其求解等方面 的比较分析,阐述选择进化博弈论的原因。 (2 )对我国现行安全监管体系进行研究 详细阐述目前安全监管体系中的重复监管、安全投入不足、忽视对职业病危害的监 管以及未能充分发挥矿工、工会和新闻媒体的合法监督作用、煤矿安监机构自身腐败五 类问题。 (3 )进化博弈论分析 对政府与煤矿、煤矿与矿工、煤矿与煤矿、煤矿与媒体、煤矿安监机构自身 5 种博 弈关系进行博弈论分析,求解进化稳定策略和复制动态方程。 (4 )案例分析 通过案例分析说明进化博弈分析结论的合理性。 1.3.3 论文的技术路线 (1)技术路线 本文具体技术路线如图 1.1 所示: 9 西安科技大学硕士学位论文 查找资料,提出问题 我国目前煤矿安全监管 存在的低效问题 经典博弈论与进化博弈论的 比较分析 确定博弈关系进 行分析 政府与煤矿 煤矿与矿工 煤矿与煤矿 煤矿与媒体 安监机构 分别计算稳定策略和复制动态方程,根据假设分 析计算结果 案例分析并提出提高安全监管效 能建议对策 图 1.1 基于进化博弈论的我国煤矿安全监管研 究的技术路线 10 2 煤矿安全监管存在的问题及原因分 析 2 煤矿安全监管存在的问题及原因分析 2.1 煤矿安全监管格局 2.1.1 我国煤矿安全监管发展历史 (1)初创阶段:1949 年 10 月,当时的燃料工业部之下建立了安全监察处,成为新 中国第一个负责煤矿安全问题的机构[74] 。当年 11 月召开了第一次全国煤矿工作会议, 正式提出 “煤矿生产,安全第一”的口号。 1952 年第二次全国劳动保护工作会议明确要求坚持 “安全第一”方针和 “管生产必 须管安全”的原则。1954 年新中国制定的第一部宪法,把加强劳动保护、改善劳动条件 作为国家的基本政策确定下来。但由于 “大跃进”时期片面追求经济指标,废除了当时 全国 10 个产煤区和 27 个矿区建立的监察机构,导致事故上升。直至 1983 年我国颁布 了 《煤矿安全监察条例》,规定了部一级的监察部门、省一级的安全监察局、国有矿山 安全监察处和县一级的安全监察科共同承担安全责任,这一监管体系结构一直延续到 1999 年。 (2 )改革发展阶段:1999 年,我国颁布了 《国务院办公厅关于印发煤矿安全监察 管理体制改革实施的通知》(下文简称 《通知》),标志着煤矿安全监管体制的改革。 2000 年初,在国家煤炭工业局之外设立国家煤矿安全监察局,标志着我国第一次建 立了独立的煤矿安全检查机构。2002 年 11 月 《安全生产法》 正式出台,安全生产开始 纳入法制建设的轨道。2004 年国务院颁发 《关于进一步加强安全生产工作的决定》,同 年 11 月国务院调整并补充了部分省级煤矿监察机构,将煤矿安全监察办事处改为监察 分局。2005 年初,国家安全生产监督管理局升格为总局。截止至同年 11 月,我国 26 个产煤省份全部设置了垂直管理的煤矿安全监察机构。2006 年初,成立了国家安全生产 应急救援指挥中心。至此,我国 “国家监察、地方监管、企业负责”的煤矿安全监管格 局正式确立。 2.1.2 煤矿安全监管格局特征 (1)安全监管机构实现了独立性 国家煤矿安全监察局的成立标志着煤矿安全监察机构不再像以前机构那样,从属于 相应级别的负责煤矿生产的行政管理组织,它不再管理煤炭生产的问题,其唯一的职责 是规范和保证中国煤矿的安全和职业健康,从机构设置上保证了该机构的独立性。国家 煤矿安全监察局及其分支机构与其负责监管的煤矿之间没有任何经济或体制上的联系, 11 西安科技大学硕士学位论文 使得它们成为了独立的第三方监管人。 (2 )现行煤矿安全监管呈垂直型体系 煤矿安全监管体系经过改革之后,所有的煤矿监察员,不 论在哪里工作,都是由国 家煤矿安全监察局总部直接任命,所有的省局和地方办公室的财政支持也都来自总局。 此种情况下国家的监察人员能够有效抵御地方政府的干涉,忠于职守。 2.2 煤矿安全监管低效问题 2.2.1 煤矿安全监管机构的重复监管 随着经济体制改革的不断深入,经济体制改革也深入到了煤炭行业,投资主体由原 来经济体制下的国家单一投资、单一经营、单一监管变为 目前市场经济体制下的独 资、合资等独立法人实体经营,形成了以国有经济为主体等多种形式的投资经营模式。 同时,煤矿安全监管权也下放至地方政府和煤矿本身,目前,我 国煤矿行业管理机构可 划分为 3 类[75] (如图 3.1 所示)。 煤矿行业管理机构 直接管理机构 相关管理机构 相关机构部门 国家安全生产 国土资源部 国有资产监督 监督管理总局 国家发改委 管理委员会 国家工商行政 公安部监察部 图3.1 煤矿行业管理机构 组成图 这种机构设置状况导致了如下 3 个方面的问题: ?煤矿安全监管机构的设置出现了行政权利重叠,导致监管重复,安全监管成本增 加,事故责任互相推诿。管理机构体系虽然层次清晰,但不同监管机构之间责任划分不 明确,给解决安全问题平添了障碍,降低了安全监管的效能。 ?地方政府煤矿安全监管机构从属于中央政府领导,但作为利益相关者之一的地方 政府能够从煤炭生产中获得巨大的经济利益,为了获得更大的收益地方政府往往会对地 方煤矿提供庇护,给安全监管制造了障碍,增加了安全监管的成本,降低了安全监管的 效能。 12 2 煤矿安全监管存在的问题及原因分析 ?由于煤矿安全监管体系中的各个机构所追求的最终目标不一致,各个机构各自为 政无法形成合力,例如:当国家下发新的文件规定时,各管理机构部门会相继给所监管 的煤矿下发执行文件,煤矿不但要一一回复,还要做好应付多个部门重复检查,给煤矿 造成了负担、浪费监管资源,导致了监管成效的降低。 2.2.2 监管基础薄弱,安全投入不足 虽然我国的煤矿安全监管体系已形成规模,仍存在监管基础薄弱、安全投入不足, 监管人员队伍建设也跟不上煤矿发展的速度的问题。目前,我国对安全的投入占国家 GDP 的比重仅为 1%左右,相比发达国家 3.3% 的比例,投入明显不足。安全投入决定着 安全效益,安全效益是煤矿核心竞争力的主要组成部分[75] 。安全效益的下降使煤矿形成 了安全效益与安全投入的恶性循环,从而安全监管的效能必然降低。 安全人才培养方面据统计 1998 年之后全国煤矿高校相继将原来的采掘工程、通风 安全、矿山机电等专业进行裁撤或改造。据对其中 9 所原煤炭院校统计,1999,2002 年共毕业学生 38000 人中到煤炭行业就业仅占 9.3 ,,平均每年不到 900 人。而我国从 事安全科学技术研究的专业技术人员也不过 5000 名。 2.2.3 忽视对煤矿职业病危害的监管 我国煤矿 95%都属于井下开采,据国家煤矿安全监察局、中华全国总工会、中国职 业安全健康协会一项调研显示,多数煤矿井下粉尘浓度严重超标,自1983 年至 2008 年, 煤尘最高浓度范围 198,3420 毫克/立方米,超过国家 49.5,855 倍,每年有大量职 工患上尘肺病。煤矿有责任为矿工提供安全健康的生产环境,然而为了追求更大的经济 利益,煤矿往往不注重矿工的职业健康需求,造成了煤矿与矿工之间的矛盾。 在我国的安全监管体系中,矿工虽然是煤矿生产的重要组成部分,但是与政府监管 部门和煤矿比较而言,矿工的竞争力是最有限的,因此矿工维护自身权益也是最难的, 所以矿工属于社会弱势群体,应该得到国家和社会更广泛的关 注。 2.2.4 未能充分发挥矿工、工会和新闻媒体的合法监督作用 矿工是煤矿安全监管最重要的一环,也是最能体现监管效能的一环。随着国有煤矿 在用工机制上的改革,大部分矿工特别是短期工为生活所迫,对自身和工作环境的 安全往往采取 “沉默”,不敢向安全监管机构反映煤矿的违规情况。 工会的实际情况仅仅是一个行政部门,主要负责人由煤矿领导任命。一些私营小煤 矿工会的作用更是微乎其微,变成了发放福利,组织活动的机构。工会对煤矿生产的安 全监督作用没有得到很好的发挥。 随着新闻媒体近几年的快速发展,捕捉社会热点的能力也大 大提高。20 世纪 90 年 13 西安科技大学硕士学位论文 代,我国政府开始允许新闻媒体做矿难的报道,不少事故背后的腐败和事故处理的结果 都能受到社会的监督。但新闻媒体的监督作用仍然受限,安全监管部门应该利用新闻媒 体的监督和教育职能,提高安全监管效能。 2.2.5 煤矿安全监管机构的自身腐败问题 随着我国经济的快速发展,煤炭产业成了刺激地方政府经济发展的重要因素。以山 西省为例,2004 年山西省煤炭行业的财政税收占全省总收入的 60%之多。像山西省这 样以煤炭行业作为经济增长支柱产业的省份还有很多,地方政府官员考虑的更多是地方 经济的发展问题、就业问题及社会稳定等。 巨大的经济利益催生了地方保护主义的形成,煤矿为了获取更多的利益,减少安全 投资,在煤矿安全监管机构检查时就通过贿赂部分安监机构的人员而逃避检查。尤其在 对地方小煤矿的安全监管过程中,行贿受贿的现象更为严重。 部分煤矿安监机构的腐败行为造成了极其恶劣的社会影响,使得安全检查成了走过 场,安全监管效能降低。煤矿安监机构的腐败已经成为煤矿事故频发的重要原因之一。 2.3 煤矿安全监管低效问题产生的原因 2.3.1 监管理念缺乏科学性 一直以来,我国煤炭开采行业及其监管都是以经济利益为主要考量标准。在这种理 念的指导下,从政府监管部门到煤矿以及矿工都以经济利益为主要目标,以致安全问题 未得到应有的重视,导致了安全监管的低效问题。 随着我国近年来经济的高速发展,能源的需求量和缺口越来越大,这一形势对我国 政府的煤矿安全监管产生了深远的影响。在能源需求量和缺口越来越大的情况下,政府 为了保证经济的正常运行和增长,就会给煤炭生产企业不断提高产量指标,以尽可能的 满足市场需求。对于政府而言,一方面一直政府及领导人的考核主要以当地经济增长为 标准,另一方面随着能源需求量的扩大,能源价格的不断攀升, 从而可能为政府带来更 多的财政收入。在此情况下,地方政府就会尽可能的促进本地能源产能的扩大,并与煤 矿结成利益共同体,甚至在必要的情况下为煤矿提供庇护。在这样的监管理念下,一些 监管人员思想麻痹,执法不严,甚至失职读职,把安全监管的权力当作生财之道,充当 一些违法生产经营者的保护伞。 2.3.2 监管职权划分不够清晰,责任落实不到位 我国煤矿实行垂直安全监管体制,导致了中央和地方监管部门权益和责任的不对 等。在垂直安全监管体制下,地方煤矿安全监管从属于中央政府的领导,国家整体利益 14 2 煤矿安全监管存在的问题及原因分析 成为了煤矿安全监管的出发点,尽管煤矿所在地政府也负有一定的监管职责,但只对特 大安全事故负有领导责任。监管职权划分的不清晰直接导致了责任落实不到位,一旦发 生煤矿生产事故,中央和地方监管部门便会发生互相推诿的现象。在权益大于责任的情 况下,特别是当监管所要求的安全技术标准会抑制煤矿目前生产水平时,地方政府的行 为就存在削弱垂直监管力度的可能,从而加大了监管机构的监管成本,这是实行垂直管 理体制的一个必然结果。 2.3.3 地方政府对煤矿安全监管的干涉 地方政府的利益包括两个基本方面,一是区域内的经济发展方面的需要,二是地方 政府官员追求政绩的需要。从经济学角度来分析,地方政府作为利益主体追求自身的利 益具有其合理性,但是正是地方政府为了获取更多的利益,为安全监管带来了各种消极 影响,使其对煤矿安全监管的配合大打折扣,有时甚至成为了阻力,降低了煤矿安全监 管应有的效用。 煤矿不仅创造了就业机会,还创造了地方税收,很多产煤地区的财政收入的直线增 长与煤矿价格的攀升成正比,这样所带来的后果是地方官员更多地考虑的是地方经济的 发展和财政收入来源或就业的问题,认为这有助于繁荣地方经济 和维护社会稳定,特别 是一些以煤炭为支柱产业的地区,煤矿税收甚至是当地政府收入的唯一的主要来源。因 此,工作和税收的重要性就超过了安全的考虑。不重视煤矿安全生产,对不具备基本安 全生产条件的煤矿既不提出整改也不予以关闭,甚至对上级部门下令关闭的煤矿的死灰 复燃或支持或默认。 煤矿安全监管过程中所做出的矿井关闭、停产整顿、行政处分、改善安全管理等决 定都需要当地政府的配合实施并监督。但由于观念、政绩和税收等一些因素的驱动,致 使地方政府部门的配合消极,有些处理决定难以落到实处。煤矿安全监管的目的是预防 和纠正煤矿违法行为,保护煤矿职工人身安全,实现煤矿安全状况好转。然而,随着国 家煤炭宏观政策的实施,关井压产、总量控制和煤矿专项整治的不断深化,各产煤地的 煤矿数量锐减,对当地的经济带来一定冲击,导致部分地方政府部门对煤矿安全监管执 法行为产生了抵触情绪。前任国家安监总局局长李毅中曾在接受中央电视台采访时曾讲 到:“国家安监总局在查封一个小煤矿之后,在当地政府的支持下,这个盖着安监总局 红印的封条随后就被撕掉。” 2.3.4 煤矿片面追求短期经济利益 我国规定自然资源国有化,煤矿所有权属于国家所有。煤矿的开采权经由政府以一 定的期限承包给各种国营开采企业和私人开采企业,矿主拥有煤矿的暂时控制权。乡镇 小煤矿的许多投资办矿者只是出资,缺乏必要的煤矿生产知识储备,而且煤矿经营权被 15 西安科技大学硕士学位论文 频繁转包给新的矿主。此种情况下,无论国有还是乡镇煤矿,追求的都是短期利益。 个别政府官员、国营煤矿的管理人员为了追求政绩,追求短期的经济利益最大化对 所管理的煤矿资源进行掠夺式的开采,造成了煤矿资源开发对当地的生态环境和恶化, 煤矿回采率偏低造成了资源浪费。据 2009 年国家发改委公布的数据显示,我国目前各 类煤矿 2.8 万个,其中国有煤矿 2000 多个,矿井回采率平均只有 45%左右;乡镇和个 体煤矿 2.6 万个,矿井回采率平均约 15%-20% 。 2.4 本章小结 (1)介绍了我国煤矿安全监管的发展历史,并总结了目前煤矿安全监管格局的特 点。 (2 )分析了我国 目前煤矿安全监管的低效问题,问题集中 5 个方面:煤矿安监机 构的重复监管、安全投入不足、忽视对职业病的监管、矿工与工会及新闻媒体的合法监 督作用没有充分发挥、煤矿安监机构的自身腐败。 (3 )分析了煤矿安全监管低效问题产生的原因:监管理念不够科学、监管责任不 够明确、地方政府对安全监管的干涉、煤矿片面追求短期的经济利益。 16 3 煤矿安全监管的进化博弈分析 3 煤矿安全监管的进化博弈分析 3.1 进化博弈论与经典博弈论的比较分析 3.1.1 经典博弈论的局限性分析 博弈论经过了近半个世纪的发展已经形成了完整的理论体系,对于在进化博弈论之 前的博弈论研究,经济学界通常称之为 “经典博弈理论”。经典博弈理论在分析经济问 题时有其局限性,体现在如下三个方面[76] : 首先,在经典博弈理论中的博弈方(参与人)均要假设为完全理性(Entirely Rational ) (即行为人具备全面的知识和本领,所选择的策略是最优化的),而且要求参与人对其 博弈方的支付策略有完全的了解。例如:在求解子博弈精炼纳什均衡时,除完全理性外, 参与人的策略选择还必须是序贯理性 (即有时间先后的选择策略时,需一直是完全理 性)。这种假设只能出现在学术研究中,不符合现实情况 其次,对于不完全信息的假设条件,经典博弈理论的计算方法是:(1)参与人虽然 掌握整个模型结构,但不知道详细的策略参数 (即不完全信息掌握)(2 )假设参与人知 道客观事件的发生概率,当在一定概率下出现新状况时,每个博弈方都可以对自己的策 略选择加以调整。这种处理方法的不合理指出在于:现实中的参与人不可能掌握所有可 能情况;参与人不可能完全获知客观事件的发生概率;现实中的参与人很可能不具备很 强的计算、推理能力,能够在解决问题之前还要解决复杂的数学问题。 第三,在完全理性的基础上,纳什均衡及其扩展理论还要求参与人要准确掌握其他 博弈方的策略选择,现实中这种情况几乎是不可能的。现实社会中,人并不是完全理性 的,研究表明:人在选择某种经济策略时经常会因为当时的历史背景、社会环境、自然 环境、个人性格、阅历经验、当时的情绪变化等原因而产生误差。大量的心里学研究还 指出:人的学习和认知能力是有差异的。人在对一件事情进行推理研究时要耗费体内的 大量能量,并且在最后决策时也会因某些特殊情况而无法时自身选择实现最优化。大多 数情况下,参与人只能依据现实状况选择或模仿,历史中相似情况的策略。 3.1.2 进化博弈论与经典博弈论的比较 进化博弈理论最早源于 Fisher ,Hamilton 等遗传生态学家对动物和植物的冲突与合 作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理 性假设的前提下用博弈论方法来解释。但直到 Smith and Price 1973 在他们发表的创造 性论文中首次提出进化稳定策略概念以后,才标志着进化博弈理论的正式诞生。 17 西安科技大学硕士学位论文 进化博弈论较经典博弈论的优势即选择进化博弈论的原因体现在以下几个方面: 第一,参与人的理性假设条件不同。经典博弈理论假设参与人完全理性,即参与人 根据外部条件的任何情况均做出最优策略选择,这种假设在现实情况中很难实现。进化 博弈理论假设参与人是有限理性,即参与人只知道部分博弈状态信息,不知道博弈状态 按概率发生变化时改变自己的策略选择。 有限理性本身就意味着,参与人往往不能在完全理性的条件下做出最优化选择,而 选择的策略基本上是学习和调整的结果,学习或模仿的对象往往是已经发生过的,类似 情况下发生的博弈事件中所包含的相关策略。 经典博弈理论中的最优化策略是建立在严密的推理分析基础上的,在充分预见未来 发生状况的条件下一次性做出选择,这种方式对于有限理性的参与人是不适用的。进化 博弈论的分析过程能够充分反映出参与人的学习过程,清晰反映出策略的动态稳定性。 第二,分析方法与研究对象不同。经典博弈理论虽然认为参与人之间在选择策略时 会相互影响,但是这种影响是建立在其他参与人的支付行为不变的假设情况下的。尽管 在非对称信息动态博弈分析中,拥有优势信息的参与人可以根据对方支付选择而调整自 己的策略以达到最优化,但只需要预测到达到纳什均衡的结果,而无需研究达到均衡的 整个过程。 进化博弈论是以参与人所在的假设群体为研究对象,在有限理性的基础上各个群体 及群体中的个体的策略选择会相互影响,而且不同群体中的个体还会出现重复博弈。个 体参与人在局部信息的条件下不一定会做出最优化的选择,达到均衡的过程实质上是在 群体中互相模仿、互相学习并不断做出调整。因此,进化博弈论的分析方法是一种动态 的过程分析,个体的支付行为受群体的影响较大,最终会在群体行为的影响下形成稳定 策略选择,能够更加真实的反映实际经济状况中的博弈行为。 第三,虽然两种博弈理论中都涉及动态分析,但动态在概念上有所不同。经典博弈 理论中提及的动态博弈过程需要假设参与人拥有所针对的博弈方 (即对手),对手需要 以选择策略时间的先后顺序和所传递的支付信息为根据。在博弈分析的过程中,后做出 选择的参与人 (拥有信息量多的一方不一定是后行动的一方)可以通过等待、观察另一 方先做出选择,最终调整自己的策略。显而易见的是,先做出选择的一方会传递相应的 状态信息给后者,后者很容易能够做出最优化的策略选择,这种动态过程具有明显的时 间性,也不会考虑外部干扰因素的存在。 进化博弈论中首先就假设参与人不会有针对的博弈方,其所 指的动态过程是参与人 为了与群体行为达到均衡而自我调整的过程。这种调整过程是一个系统,个体行为在调 整,群体行为也在不断调整,这种调整会因各种外部条件的影响而发生变化。参与人关 注的不是自身的行为会影响对方,考虑更多的是如何在侵入群体时改变群体策略选择为 或适应群体策略行为。 18 3 煤矿安全监管的进化博弈分析 第四,两种博弈理论中的博弈行为最终会达到均衡,但首先均衡的概念不相同。纳 什均衡是经典博弈理论中最基本的预测策略结果的方理论方法,根本特征是在假设其余 参与人选择行为稳定的条件下,每一个博弈方均选择能够获得最大期望得益的行为策 略,由于均衡策略是基于每一方的期望得益推理出的,因此会成为每个参与人的最佳选 择,可以理解为几何学中的固定点。 进化博弈理论中将最终达到的均衡称之为稳定策略,即当某群体遭遇其他群体或个 体侵入时,侵入行为会让原有群体的外部条件发生突变,此时原有群体会调整自身的策 略行为,调整的最终结果就是形成新的稳定策略。通过这种过程反映的参与人行为更加 符合实际情况。 第五,均衡概念不同,求解的过程自然不同。经典博弈理论中的参与人是全能的, 即能够迅速适应系统变化,并相应的做出最优选择。因此经典博弈理论中的博弈系统能 够迅速的从一个均衡转化为另一个均衡。由于这种转化不需要时间,参与人的均衡是独 立推理计算出的,因此用经典博弈理论分析实际情况时,通常是完全信息下的静态分析。 当出现多个子博弈时,子博弈会形成多个纳什均衡,经典博弈理论才处理这种情况时, 会要求参与人满足一个更为苛刻的假设条件即序贯理性,才能计算出精炼纳什均衡。 第六,进化博弈论中的稳定策略选择与复制动态方程的求解 生态学家 Taylor and Jonker 1978 在考察生态进化现象时首次提出了进化博弈理论 的基本动态概念――模仿者动态 replicator dynamic ,这是进 化博弈理论的又一次突破性 发展。模仿者动态与进化稳定策略 RD&ESS 一起构成了进化博弈理论最核心的一对基 本概念,它们分别表征进化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS 概 念的拓展和动态化构成了进化博弈论发展的主要内容。进化博弈论在分析中的参与人均 为有限理性,遵循种群行为规则。进化博弈论还被应用到了对社会制度、习俗演化和行 业发展等研究上。 进化稳定策略 (Evolutionarily Stable Strategy),缩写为 ESS ,生物学中作为分析生 物的适应策略的一种方法,在分析群体选择产物的仪式斗争行为开始知道性别和互惠的 理他行为以及分散行为等进化问题时被广泛应用。是指占群体绝大多数的个体选择进化 稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下, 突变者要么改变策略而选择进化稳定策略,要么退出系统而在进化过程中消失。 从定义可以看出,当系统处于进化稳定状态时 (群体选择进化稳定策略时所处的状 态就是进化稳定状态),除非有来自外部强大的冲击,否则系统就不会偏离进化稳定状 态,即系统会 “锁定”于该状态。定义的直观意思就是,当一个系统处于进化稳定均衡 的吸引域范围之内时,它就能够抵抗来自外部的小冲击。显然,进化稳定策略是一个静 态概念,但它却可以描述出系统的局部即吸引域内的动态性质。 对某个体而言,最好的策略取决于大多数成员在做什么。由于种群的其他部分也是 19 西安科技大学硕士学位论文 由个体组成,它们都力图最大限度地、更多更有效地繁殖自己的后代,因而能够持续存 在的必然是这样一种策略:它一旦形成,任何举止异常个体的策略都不能与之比拟。在 环境的每次大变动之后,种群内可能出现一个短暂的不稳定期,但是一种 ESS 一旦确立, 就会稳定下来,偏离 ESS 的行为就会被自然选择所淘汰。 复制动态实质上是描述某一特定策略在一个种群中被采用的比例或频率的动态微 分方程,式中:x 为一个种群中博弈方采用策略s 的比例;U 为该博弈方采用策略s 的 s 期望得益;? U 为该博弈方采用其策略空间中所有策略的平均得益;d / d 为该
/
本文档为【基于进化博弈论的煤矿安全监管的研究(可编辑)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索