HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

博弈论方法集锦9篇

时间:2023-09-14 17:39:09

博弈论方法

博弈论方法范文1

关键词:博彝论公选课;教学内容与方法改革;措施

中图分类号:G420 文献标志码:A 文章编号:1002-0845(2012)01-0042-03

博弈论是当代西方经济学体系中最重要的理论课之一,其应用前景非常广泛。几乎所有社会科学领域中都活跃着与博弈论交叉的分支学科,为满足当代大学生对博弈论知识的需求,高校加强博弈论公选课建设迫在眉睫。鉴于此,笔者面向全校开设了“博弈论与诺贝尔经济学奖”和“博弈问题及其启示”两门通识选修课程。

一、博弈论公选课教学中存在的问题

由于博弈论与经济学、管理学和数学等学科有着十分密切的关系,所以国内本科院校的博弈论课程主要面向经济、金融、管理或数学专业开设,教学的对象通常是本专业或本学科相关专业的学生,很少面向全校开设公选课,这主要缘于以下两个方面的原因:第一,博弈理论的建立只有六七十年的历史。国内高校博弈论课程开设时间最长的也不到十年,上述情况导致了课程建设的经验不足、水平不一。第二,研究博弈理论往往需要借助数学的方法,所以,博弈论课程的讲授与学习离不开数学工具和经济学知识,课程内容不得不受制于较高的知识门槛。因而,国内博弈论公选课的建设尚处于起步阶段。

笔者在连续四个学期开设博弈论公选课后发现,该课程教学中存在的主要问题如下:

1 学生问的差异较大

由于博弈论公选课面对的本科生纵跨二、三、四三个年级。横跨本校全部学科的所有专业,导致学生的认知平台和知识面存在较大差异,学习目的和价值取向呈现出多元性,学生在学习态度、学习习惯和学习能力方也存在较大差别。

2 理论学习需要有一定的经济学基础和数学基础

博弈论是从经济学的角度提炼出个体最优决策问题后,利用数学模型对其进行描述,再运用数学工具对其理论进行研究。2007年的诺贝尔经济学奖得主罗杰・迈尔森(Roger B.Myerson)认为,“博弈论是对理人或决策者之间相互冲突及合作的数学模型进行的研究”。虽然博弈论具有广泛的应用范围和较强的解释能力。但它的标准表达是函数形式和集合论形式的,研究方法和分析过程依赖于数学工具。所以,学习博弈论既要有相关的经济学知识,又要有一定的数学基础。正因如此,学生在公选课中接触博弈论时会觉得比较抽象。

3 课程的知识容量受限

为了照顾学生差异,笔者在教学过程中会尽可能详细地为学生进行讲解,因而不得不压缩知识的容量,这导致了一部分经济学和数学基础较好的学生“吃不饱”的问题。笔者尝试通过布置课后练习的办法来解决这一问题,但效果不是很明显。或许一个不可回避的重要原因是,有限的课余时间和较快的学习节奏限制了多数学生对公选课知识的进一步学习。

4 缺少合适的教材

缺少合适的教材也是博弈论公选课教学中存在的主要问题之一。笔者认为,博弈理论的应用性和公选课内容的时效性是激发学生学习兴趣的、切入点,教材的编写应将二者有机结合起来,方能发挥最大的功效,然而目前的教材往往只能体现前者却难以涵盖后者。

二、课程内容与教学方法改革的措施

1 抓住学生的共性

大学生具有强烈的关注现实问题的意愿,对社会热点问题表现出极高的兴趣,尤其在理解焦点问题时具有很强的可塑性和认知共性。因而应牢牢抓住这一共性,迎合学生在知识需求上的实用化和功利化的特点,从当前丰富的信息资源中寻找承载博弈论知识的现实问题,以期收到事半功倍的教学效果。在教学实践中,笔者把丰田汽车赔偿、西南五省大旱、相亲类节目“非诚勿扰”、2008股市大跌等现实热点都搬上了讲台。下面,笔者就通过教学实例进行说明。

在讲授2005年诺贝尔经济学奖得主托马斯・谢林(Thomas C.Schelling)的博弈承诺及其可信性概念时,笔者以制定《反国家分裂法》为典型案例进行分析。由于祖国统一问题是所有国人关心的国家大事,大学生也不例外,所以讲授过程非常顺利,以致学生在课后反馈中把这一案例列为讲授最成功的部分。接着,为了讲解如何应用可信承诺处理现实问题,笔者选择了电视连续剧《老大的幸福》第四集中的一个视频片段,进一步强化了知识点。实践证明,人物生动的形象在给课堂增添活跃气氛的同时,也很好地承载了传递知识的作用,以缩影的形式把可信承诺的概念和应用可信承诺策略的方法植入了学生的头脑中。最后,笔者以拆迁补偿合同签订中的一种可信承诺策略为例,对本节课进行了总结,并请学生加以点评。由于拆迁问题是当前社会的焦点问题,所以学生对点评表现出极大的兴趣。这样,通过抓住学生的认知共性,展示了可信承诺策略在焦点问题上能够将劣势变为优势的强大作用,成功地引导学生了解并掌握了博弈承诺及其可信性概念。

2 增强主题的典型性和知识模块的简洁性

以经典博弈问题为主题有利于组织素材、选择教学内容;简洁地安排知识模块、弱化知识的层次性有利于照顾各类学生在知识面、综合能力和认知水平上的差异;少而精地选择课程内容有利于突出重点;多角度地反复讲解有利于降低知识门槛,提高学习的效果。

例如,在主题选择上,笔者以多数学生熟知的“囚徒困境”作为第一主题;以试验性强、易于展开的“理性基础和有限理性”作为第二主题;以现实性突出的“重复动态博弈”作为第三主题。由于“囚徒困境”与经济学中的“理性人假设”密不可分,所以第一主题既能让学生感受到博弈问题的趣味性和深刻性,又能激发他们对该主题的进一步思考,使他们逐渐认识到“理性人假设”所具有的超越现实、过于理想的特性,从而部分地为第二和第三主题做好铺垫。另外,有大量关于“囚徒困境”和理性问题的课外资料易于获得,这为学生在课程初期进行兴趣驱动的导读创造了条件。

在知识模块设置上,笔者采取“自成模块、减少关联”的策略。例如,针对非常重要的“信息不对称”主题,我们选择了以二手车市场为核心,构建了包含药品市场、电脑市场和就业市场等典型主题的知识模块。一方面,这些市场为学生所熟知,易于接受;另一方面,这些市场中包含着非常典型的“信息不对称”因素,因而通过对市场现象的自然描述完全可以弱化学生对经济学市场知识的依赖。为了弱化知识的层次性,突出重点内容,笔者舍弃了理论体系中的某些知识模块,例如“海萨尼转换”、“斯宾塞信号传递模型”和“斯蒂格利茨信息甄别模型”等。

3 重视案例应用,尤其应重视与诺贝尔经济学奖得主有关的案例

博弈论有一个显著特点,那就是它“声名显赫”,并且与

诺贝尔经济学奖的关系密切。许多诺贝尔经济学奖得主都曾涉足博弈论领域,在博弈论的建立和发展中直接或间接做出过贡献。“名声在外”为博弈论公选课的开设提供了有利条件,也为课程的讲授提供了独特的视角和丰富的素材。正因如此,笔者才面向全校开设了博弈论与诺贝尔经济学奖公选课。下面,以1994年诺贝尔经济学奖得主约翰・福布斯・纳什(John Forbes Nash Jr.)为例,详细说明如何应用与诺贝尔经济学奖得主有关的案例以及这样做的优点。

纳什是博弈理论发展的划时代人物,纳什均衡是博弈论的核心概念,两者都是公选课中必须包含的内容。为此,笔者设计了以下三个环节:1)借助“囚徒困境”和“情侣博弈”讲授纳什均衡及其不唯一性;2)播放电影《美丽心灵》,并进行讨论和点评;3)布置以纳什为主题的案例设计作业,让同学在课堂上演讲。第一部分是讲解的重点,讲好纳什均衡意味着博弈论课程成功了一半。第二部分可以把人格培养和素质教育有效融合起来。《美丽心灵》不仅能让人体悟到学生心灵中因爱而生的温暖,还能给出人生原本就是一场博弈的警示,体现出“大人物小故事”的精髓。纵然纳什这样的天才也有无法摆脱的困境,何况他人?所以,在人生的博弈中,既要承认能力的差异,又要找寻属于自己的色彩。同时还应看到,纵然如纳什般为顽疾所缠都可以逐渐康复,何况其他挫折?所以,要以积极、乐观、健康的心态对待人生,要终身学习而不轻言放弃!第三部分是对学生的启发环节。该环节不仅要培养学生对本课程的兴趣,加深学生对知识的理解,还要通过为其提供上台演讲、展示成果的机会,锻炼他们的逻辑思维能力和表达能力。值得一提的是,很多学生在设计案例时自学了有名的“智猪博弈”和“恋爱博弈”等经典模型,巩固了纳什均衡概念,还有学生甚至对纳什曾经设计过的一种“六连棋”博弈游戏(笔者对此也知之甚少)进行了分析。

4 重视学科交叉,尤其应重视学科交叉视阙下的学术前沿成果

博弈论已逐渐成为一门为诸多学科提供思维方法和分析技巧的学问,可以说,所有与生命有关的学科都蕴藏着博弈论的应用空间。在公选课中,应重视从学科交叉的视角供给知识,广泛培养各专业学生对课程的兴趣。例如,笔者选择生物演化理论和博弈论交叉所产生的演化博弈论作为知识模块,以人类社会的同性恋演化作为典型主题,挑选最前沿的学术研究案例作为教学的主要内容为学生进行讲解,扩展了学生的知识面。

在演化博弈论的开创性著作《演化与博弈论》一书中,作者约翰・梅纳德・史密斯(JohnMaynardSmith)用精妙的语言、深入浅出的分析和丰富有趣的案例把博弈论的思想融入到生物演化中,推动了对“动物为什么如此”这一问题的深入研究,揭示了动物群体行为演变的动力学机制。笔者首先以“哺乳动物一雄多雌”案例作为引导,简单介绍演化博弈论在性选择和性别比问题上的研究视角以及逻辑结构,然后立刻引出了人类面临的一个有关性的问题――同性恋演化主题下的性问题:从进化论的角度来看,男男同性恋的存在完全没有任何意义,这是因为同性恋相比于异性恋而言成功繁殖后代的可能性太小,那么为什么同性恋的基因没有被淘汰?显然,这一问题接近现实热点,对学生极具诱惑力,而且还具有很强的学术延伸性。为了讲解同性恋基因延续的演化博弈机制,笔者借助2010年2月24日美国心理科学杂志上发表的关于萨摩亚岛上男男同性恋的最新研究成果,利用最前沿的学术案例详细分析了“亲族选择”假说下的演化博弈机制。教学实践表明,通过这样的内容设计,来自不同专业的学生的学习兴趣都被调动起来,加深了他们对博弈论的理解,顺利实现了教学的目标。

5 重视开放性,尤其应重视教学信息交流反馈的开放性

信息交流有利于帮助学生巩固所学内容,让有兴趣的学生通过查阅相关资料,获得知识上的感悟和能力上的提升,并逐步脱颖而出。信息反馈有助于教师突出教学的亮点,发现教学中存在的不足,以便在今后的教学中加以改进。

教学实践中,笔者让学生通过电予邮件的形式反馈“课堂心得”,并要求他们回答以下三个问题:

(1)这次课对你影响最深或最成功的是哪部分?

(2)最失败或可有可无的又是哪部分?

(3)对本次课你有什么意见和建议?

这三个问题一方面可以督促学生对课堂内容加以回顾、梳理,另一方面,又可以从中发现笔者在教学中存在的不足之处。事实上,在交流和反馈中,许多同学都针对课程的内容、进程和教师的教学习惯、技能等提出了中肯的批评和建议,帮助教师提高教学水平。这些批评和建议包括“讲课的速度有点偏快”、“思考时间较少”、“有些理论过于深奥”、“希望针对时事展开分析”、“希望多些互动”、“理论是需要加强的”等,当绝大多数学生赞成“少一点数学知识”并希望“讲得详细点”时,笔者采纳了这一建议,并列出了几本偏重数学工具的参考书让那些“吃不饱”的学生自学。

学生给予的温馨鼓励也让笔者感觉“很给力”。例如,“本节课内容很充实,希望老师保持下去”、“老师的努力我们都看到了,希望老师以后做得更好”等话语激励着笔者,使笔者能够维持浓厚的教学热情使其永不衰减,并且有信心进一步提高自身的专业能力,挑战自我的职业水平。

教学探索与实践的过程是循序渐进的过程,学生在这一过程中所起到的作用是巨大的。只要教师能够及时、充分地了解学生的需求,不断总结、深化课程教学改革的经验,就一定能取得更大的成效。

三、下一步的设想

笔者秉承“以人为本,以学生的发展为中心”的教育理念,希望博弈论公选课能为学生打开“半”扇窗,培养他们对博弈理论的兴趣,激发学生课后自主学习的潜能,做到既为学生提供基本知识,又帮助学生脱颖而出。

教学实践表明,的确有不少学生通过自主学习脱颖而出。以下是某学生的反馈:“最近看了一本《博弈三国》,该书用博弈论的方式对三国故事进行解析,感觉博弈论有一种奇妙的功能,就是能把复杂问题简单化,而且解析后的过程、缘由都一清二楚了。”更有学生觉得自己“在研究中发现了对自己有用的东西,受益匪浅”。也有在深入思考后对教学内容提出反诘者:“从平常感知上来说,同性恋的基因遗传与博弈基本无关……博弈是一种研究竞争参加者为争取最大利益应当如何做出决策的数学方法……无法说这样一种与母系基因联系较为紧密的基因遗传行为可以用博弈的方式去解决,只能说同性恋的基因遗传在某种程度上体现了社会的平衡态。”不管这些反馈的具体情境如何,它们至少说明,应从公选课的现实性、延伸性、前沿性和开放性出发,强化学生的共性。弱化学生的差异性,充分利用教学内容的充实性和教学方法的灵活性,谨慎且大胆地进行教学改革,为满足高等教育通识选修课的教学需求,进一步提高教学的水平与质量,提供一些思路和经验。

博弈论方法范文2

预算是“利用企业现有资源增加企业价值的一种方法”。作为一种系统化的现代企业管理模式,预算管理兼具计划、控制、激励等多种管理功能于一体,在现代大中型企业的管理工作中发挥着不可替代的作用。委托关系不仅在所有者与管理者之间存在,而且也存在于企业内部的管理层与执行层之间,这种委托关系带来的问题是双方目标的不一致和信息的不对称。在预算管理包括预算编制、预算调控和预算考评的过程中,目标的背离和严重的信息不对称有碍预算功能的发挥,甚至会引发控制、激励等管理职能的失效,常见的有如激励不足和预算松弛等问题。本文对预算松弛现象基于博弈论的视角进行分析并提出相关对策建议。   []

二、博弈论相关理论分析

(一)博弈论相关理论

博弈论是在一定的假设前提下,基于经济、管理以及数学相关知识对事物过程的系统分析。博弈包括参与人、策略和支付三要素。所谓参与人即参与博弈的各主体方,具有经济理性和选择的能动性特点。策略分别是各参与方可供选择地策略组合,也即是策略空间。支付又叫得益,是参与人在各博弈方选择特定策略条件下的收益或亏损(可正可负),是参与人选择策略的依据和主要目标,通常用量化的效用水平或期望效用表示。

博弈论分析基本假设:一是理性人假设,即参与博弈各方都是理性的,通过理性决策使自己的收益最大化;二是博弈者理性为共同认识,即每个博弈者都知道博弈参与者是理性的,这种相互知道能无限推演循环。

按照不同标准可以对博弈进行不同类型划分。依据决策是否同时和博弈回合数可以将博弈划分为静态博弈和动态博弈;依据信息完全与否可以将博弈划分为完全信息博弈和不完全信息博弈。依据其他标准也可进行不同分类。常见分类及达到的均衡如图(1)所示。  

(二)预算及委托理论

全面预算是由经营预算、长期投资预算、筹资预算等一系列的预算构成,内容涉及生产、采购、销售、财务等领域。由于内容复杂,企业可以根据成本允许选择不同的编制方法。常用的预算编制分类方法有增量预算法和零基预算法;固定预算法和弹性预算法;定期预算法和滚动预算法等。预算具有落实战略目标,明确经营目标,控制经营活动,明确考评依据,激励各层员工等作用。但在实际管理过程中,由于预算决策层、预算管理层和预算执行层之间存在信息不对称以及目标不一致等情况,致使预算管理并不能完全发挥理论上的功用,会出现激励不足或激励不当(包括预算松弛和操纵预算管理)等问题。

委托是现代企业制度的典型特征,是市场经济发展到一定程度专业化分工的结果。正是这种契约关系的存在,使激励制度成为一种必要的管理措施。因为委托方和方之间存在目标的不一致性,在对方进行监管的同时,为使监管成本最低,有必要采取相关的激励措施以促使双方目标尽可能的一致,并为委托方带来最大的收益。在此过程中,因为亲身参与管理执行,执行层较管理层拥有更多的信息,管理层较所有者拥有更多的信息,所以使博弈更成为一种可能。

三、预算编制博弈分析

(一)预算编制路径

(1)预算决策层下达目标。是企业最高决策层根据战略目标,基于历史情况,结合预期经济形势以及其他相关约束条件,制定下一个预算期内的预算目标,预算委员会下达到各预算责任执行中心。

(2)提出预算方案。预算执行中心会出于自身的经济利益可能会虚报,包括高报支出或低报实际生产经营能力。高报支出会带来较大的支出弹性和在职消费,低报生产能力会减小考核压力并能轻易完成考核目标以获取超额奖励。执行中心虚报的同时也存在着相关成本,包括隐瞒真相成本以及隐瞒被发现后遭受处罚成本。

(3)预算方案审查平衡。针对各中心上报的详细预算方案审核汇总,结合战略目标、决策计划以及实际约束条件,进行平衡调整,提出修改建议下达给原上报中心。预算委员会的策略选择空间为批准通过和拒绝。针对执行中心的“实报”策略,委员会采取“批准”策略,带来的是正常收益;针对“实报”行为,委员会采取“拒绝”策略,这种情况对于理性的博弈者来说不会存在;针对“虚报”行为,委员会采取“批准”策略,会带来额外损失;针对“虚报”策略,委员会采取“拒绝”策略,同样带来正常收益,但会付出更多的审核成本。

(4)预算下达执行。各预算中心根据预算委员会下达的调整建议与其进行协商并调节,最后经审议通过后依照执行。

(二)编制过程博弈分析

(1)模型假设。博弈各方都是理性经济人,且“理性”为共同认识;参与博弈双方的信息是不完美的,即博弈者对对方的收益和策略并不是完全了解;参与双方之间的策略选择有先后顺序,可看作是两阶段的动态博弈。

(2)博弈分析。预算执行中心以A表示,上报预算方案时其策略空间为{a1,a2}, a1表示虚报,a2表示实报,且为私人类型,即执行中心知道取值,而预算委员会仅知道取值概率,P(a1)=q, P(a2)=1-q。执行中心虚报并隐瞒成功时可获得额外收益R(R≥0)虚报的额外成本为C(易知R>C≥0),隐瞒被发现遭受处罚F=θR(0<θ<1)。实报时额外收益为0,额外成本亦为0。

运用海萨尼转换时,虚拟参与人以N表示,其策略空间{n1,n2},表示自然发出的执行中心想传递的信号空间。n1表示自然发出的执行中心不刻意隐瞒虚报行为的信号,n2表示自然发出的执行中心声称如实申报采取措施积极隐瞒虚报行为的信号。

预算委员会以B表示,在收到自然发出信号mi(i=1,2)后,可选择策略空间为{b1,b2},表示批准执行中心预算申请,表示拒绝执行中心预算申请。预算委员会在进行审核时,可选择一般力度审核,审核成本为C1(C1>0),也可进行大力度审核,成本为C2(C2>C1>0)。当预算委员会审查出执行中心存在虚报行为时,可得到最高决策层的奖励J=γF=γθR(0<γ<1)。

当a= a2时,必有n= n2,因为预算执行中心作为理性的经济人,不会在如实申报时对外表示 出虚报行为。

根据上述假设,预算编制过程中的不完全动态博弈可用如下博弈决策树表示。见图(2)。??????????????

分别以U1,U2表示预算执行中心,预算委员会效益在不同策略选择下的水平为:

U1(a1,n1,b1)=- C, U2(a1,n1,b1)=- C1

U1(a1,n1,b2)=- C, U2(a1,n1,b2)=- C1

U1(a1,n2,b1)=R - C, U2(a1,n2,b1)=- C1

U1(a1,n2,b2)=- F - C,U2(a1,n2,b2)=J - C2

U1(a2,n2,b1)=0, U2(a2,n2,b1)=- C1

U1(a2,n2,b1)=0, U2(a2,n2,b1)=- C2

通过对上述博弈模型分析,得出如下结论:

(1)当γ≤(C2-C1)/(qθR)时,混同均衡{n*(a),b*(n),P(a∣n)}是该博弈的子博弈精炼贝叶斯-纳什均衡。预算委员会于混同策略的最佳反应是b(n)≡b1,预算执行中心最佳反应是混同策略n(a)≡n2。此时预算执行中心的最佳策略均对外声称如实申报预算,而预算委员会的最佳策略是实施一般力度审查。   []

(2)当γ>(C2-C1)/(qθR)时,博弈双方交替使用混同策略和分离策略。预算执行中心的分离策略导致预算委员会的混同策略b(n)≡b1;而对于b(n)≡b1,预算执行中心又会选择混同策略n(a)≡n2;对于n(a)≡n2,预算委员会会选择b(n1)=b1,b(n2)=b2的分离策略;对于b(n1)=b1,b(n2)=b2的分离策略,执行中心又会选择对于n(a)≡n2的混同策略。

博弈论方法范文3

【关键词】 无线电 博弈论 纳什均衡

一、博弈论的概述

1.1概念

博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论[20]。也就是说,博弈论研究当一个主体,譬如说一个人或一个企业的选择受到其他人(其他企业)的选择的影响,而且反过来影响到其他人(其他企业)选择时的决策问题和均衡问题。所以在这个意义上说,博弈论又称为“对策论”。博弈论是一种使用严谨数学模型来解决现实中利害冲突的理论,由于冲突、合作、竞争等行为是现实中常见的现象,因此很多领域都能应用博弈论,如军事领域、经济领域、政治外交等。

1.2博弈论模型简介

博弈论自产生到发展至今已形成了较成熟的理论体系,它并不是经济学的一个分支,它是一种方法,应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学等都涉及到博弈论。不过博弈论也具有自身的基本模型,可以对一个博弈过程用5个方面来描述,G={P,A,O,I,U}

① P(player):博弈的参与方。

② A(action):博弈方可选择的全部行为或策略的集合

③ O(orders):博弈的次序。

④ I(information):博弈的信息。

⑤ U(utility):博弈方的收益。

以上五个方面是定义一个博弈时必须首先设定的,确定了上述五个方面就是确定了一个博弈。博弈论就是系统研究用上述方法定义的各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,也既是均衡。

1.3博弈论的分类

现实中各种博弈可以按照不同的办法进行分类。根据参与人的多少,可以将博弈分为两人博弈和多人博弈;根据参与人是否合作,可以将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可以将博弈分为零和博弈、常和博弈和变和博弈。

1.4纳什均衡

1.4.1纳什均衡的定义

纳什均衡(Nash Equilibrium)[20]是一种策略组合,它能够使得每个参与者的策略都是对其他参与者策略的最优反应。“最优反应”指的是该策略带给采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能带来的利益。博弈的目的,就是为了寻求这样的一个最佳的策略组合。

1.5 一些特殊的博弈模型

1.5.1重复博弈模型

重复博弈是目前人们了解的最为透彻的一类动态博弈,参与人每一期都面对同样的“阶段博弈”或“选民博弈”,而且参与人的全部收益是每阶段所得收益的加权平均。参与者基于对博弈过程的认知,例如对过去行为的了解,对未来的预期和对当前情况的观察,在每一个阶段的博弈中选择自身的策略。这些策略可以是固定的,也可以随其它参与者行动的改变而变化,甚至可以是自适应的。

1.5.2潜在博弈模型

潜在博弈是一般形式博弈中的一种特殊类型,存在函数u:SR当单方面的背离发生时,u的变化Δu将被反映到单方面背离博弈者的效用上。

二、在无线通信系统资源分配问题中应用博弈论的可行性分析

随着无线通信系统的飞速发展,许多概念和技术与现有系统相比都有很大的变化。通信系统将具有智能的资源管理,采用大量动态的、分布式的、自适应式的资源管理方式。

三、基于博弈论的动态频谱接入方法

如何利用博弈论方法对认知无线电技术的研究进行分析,其中的关键是如何将博弈论引入到相应算法的设计和分析中,找到算法的纳什均衡点。在开始具体的算法研究之前,需要将所研究的问题抽象成博弈论问题模型。

3.1 分布式自适应频谱接入方法

博弈论模型适用于分析认知无线电系统各用户竞争频谱的分布式行为,各用户根据自己获得的信息单独进行决策。

博弈论方法范文4

博弈理论实质是将供求理论借鉴运用的物理力学均衡理论及概念再移植到竞争理论的研究中,研究的是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究当某一主体的决策既受到别的主体的决策影响,而且该主体的相应决策又反过来影响到别的主体时的决策问题。博弈中作为一个整体各个主体的选择相互影响,对单个消费者或企业来说决策时不仅依赖于自己的选择,并且依赖于具体某个或某些主体的选择,最优选择是某些主体选择的函数。

博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。参与人是指博弈中选择行动利益最大化的决策主体家庭、企业或国家;

行动是指参与人的决策变量;

战略是指参与人选择行动的规则,告诉参与人在什么时候选择什么行动;

信息是指参与人在博弈中的知识特别是有关对手的特征和行动的知识;

支付函数是参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数,是每个参与人真正关心的东西;

结果是指博弈者感兴趣的要素的集合;

均衡是所有参与人的最优战略或行动的组合结果。

而上述概念中参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则决定均衡。可见博弈理论并没有跳出竞争的范畴。

弈论理论上博弈论分为合作博弈和非合作博弈,区分是博弈者之间是否能采取合作策略。合作博弈是博弈者能够通过谈判达成有约束性的契约或默契以协调行为相互采取一种合作策略,无法通过谈判达成契约或默契为非合作博弈;

还可以根据持续的时间和重复的次数分为静态博弈与动态博弈;

而根据博弈弈者所掌握的信息的程度,还可将博弈分为完全信息博弈与不完全信息博弈,以及完备信息博弈与不完备信息博弈,确定博弈与不确定博弈等。

非完全竞争中的均衡性即合作博弈论(奥曼博弈)、完全竞争中的均衡性即非合作博弈论(纳什博弈)。合作博弈中奥曼提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,建立“交互的决策论”为“最优理性决策”服务,即研究决策者的决策行为、作用条件及决策的均衡问题。

二、奥曼合作博弈论创立及一般理论

数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦合作出版的《博弈论与经济行为》一般被认为是博弈论产生的标志,概括了行为主体的典型行为特征,提出博弈模型、解的概念和分析方法。奥曼认为博弈是“交互的决策论”,即研究决策者的决策行为、作用条件及决策均衡问题,即决策者间决策行为形成的互为影响关系。因此决策主体必须考虑对方的反应,所以用“交互的决策”来描述博弈论。如果仅有一个决策者就产生最优化问题,而在多个参与者的博弈中,决策者的决策结果取决于众多决策者的交互决策作用。

奥曼认为就社会科学的理性方面而言博弈论是概括或“统一场论”,不是利用个别、特定结构讨论具体问题,而是应用于所有交互情形的一套方法,并进而探讨在每一具体应用中所导致的结果。

奥曼将“连续统”观点引入完全竞争行为及经济模型,使完全竞争的个量不影响总量的情况限制在仅存在有限多的参与者,因此个别参与者对经济的影响也就不能被忽视。连续统可看作接近于存在许多但是数量有限的粒子状况。奥曼指出竞争分配的核心和模式与企业连续统的市场相一致,并通过精确表达完全竞争观点的连续统模型,使模型改进为经济理论的基本准则。

奥曼看来博弈论和经济理论中最显著而独有的现象是竞争的价格均衡与对应的博弈的解概念间的关系,直观上看等价性原理是说市场价格的建立是从在完全竞争市场上运转的基本力量自然产生。

奥曼还利用参与者的连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。

重复博弈即同样结构的博弈重复,每次博弈称为阶段博弈,是动态博弈的重要内容。奥曼认为完全信息的重复博弈论与人之间相互作用的基本形式的演化相关,目的是解释诸如合作、报复、威胁等现象。博弈论和新古典经济学模式的现象,可能一开始看起来非理性。奥曼定义“强均衡”概念,即没有任何参与者可以单方面改变决策来获益的情形,指出重复博弈的强均衡与一次性博弈的核心相一致。

合作博弈发展的鼎盛期也是非合作博弈的开创期。合作博弈理论直接讨论合作的结果与利益的分配,隐含的假设是存在一个在参与者间可以自由转移的交换媒介,每个参与者的效用可转移。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。

非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到目标。

三、纳什非合作博弈论的无意义性

不知是否是基于本文同样的认识或观点,纳什均衡既遭到冯·诺依曼的断然否定,还受到爱因斯坦的冷遇都不是没有道理的。纳什于1950和51年发表两篇关于非合作博弈论的论文,证明非合作博弈及其均衡解的存在,即所谓纳什均衡。然而,无论纳什的囚犯两难处境也好,还是价格战博弈也罢,其分析的非合作博弈均衡状态无论方法对错其实质是完全竞争均衡状态的分析,不过是竞争与非合作博弈的名称转换而已。

纳什的纳什均衡或非合作博弈论实际是完全竞争的均衡,证明的非合作博弈均衡解的存在,不过就是完全竞争的均衡解。奥曼将博弈概念从竞争概念中相对独立出来,而纳什又转了回去,难怪遭到冯·诺依曼的断然否定。

事实上,合作博弈本来仅就是竞争的一种形式即竞争对手的相互妥协、协调、默契;而非合作博弈的实质就是竞争,与其说存在非合作博弈不如直接说完全竞争。合作博弈实际是非完全性市场竞争,是竞争的一个特殊部分;而非合作博弈就是完全性市场竞争,因此也就根本没有存在于博弈理论中的价值。

目前经济学界谈到博弈论的非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡,这实际是人与人之间利益竞争力的均衡。

四、博弈论也并不等同于对策论

博弈论是一种在合作中的竞争、竞争中的合作的交互决策方法,但不能把博弈论简单的归结或称为对策论。博弈是一种对策“场”,而对策是博弈中不同的作用点。

五、博弈理论的扬弃性研究与修正适用

现实中被博弈论的大量数学模型唬着的人不计其数,实际上博弈论不过就是一种分析方法而已,是可以帮助人了解策略性互动中的内在逻辑及构成,并提供一些有用的解决问题的方法,甚至可以说博弈论方法是对哲学思维方法的深化。目前博弈论作为分析和解决冲突与合作的方法和工具,在社会学、政治学、经济学等领域得到广泛应用。实际中如何理解博弈论、如何运用博弈论原理指导经济实践是个值得思考的问题。

价格与产量决策、经济合作和经贸谈判、引进与开发新技术或新产品等,博弈论都是有效的决策工具,至少是一种决策的思路。

国际贸易中的双方如果采取对抗性竞争策略,就会使双方因贸易战受到损害。彼此限制对抗国的产品进口,具体策略是提高关税,限制与对抗反击的结果是谁也没有捞到好处。反之,如果展开合作中的竞争、竞争中的合作,达到博弈均衡,即从互惠互利的原则出发达成减少关税,促进贸易的结果,彼此就都可以从贸易中获益。

博弈论方法范文5

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

博弈论方法范文6

Lan Xiaosheng

(China Communication Construction Company Limited,Chongqing 401147,China)

摘要: 文章引用博弈理论来分析投标行为,针对当前建筑市场上主要采用的最低标价中标评标办法,进行理论分析,建立了基于博弈理论为基础的投标报价模型,并对其结论进行了分析和讨论。

Abstract: This article explains the activity of bidding by quoting the game theory, and discusses the lowest Price Bidding evaluation method in construction market. Then it establishes the model of tender bid evaluation methods based on the game theory. Finally the article analyses and discusses the conclusion further.

关键词: 投标 博弈 模型

Key words: tender;game theory;model

中图分类号:TU723.2 文献标识码:A文章编号:1006-4311(2011)15-0075-02

0引言

招投标是建筑市场中广泛采用的工程承包方式,随着投标市场的不断规范,逐步完善,评标方法也开始多元化。由于市场竞争的日趋激烈,越来越多的国家和地区采用了最低价中标的评标原则(以下简称最低价法)。文章以此评标标准为基础,用博弈论分析投标者之间报价行为,针对最低价中标的评标办法进行理论分析,建立了基于博弈理论的最低价法的投标报价模型,为投标企业报价提供理论上的指导。

1投标报价的博弈类型、分析

博弈论,也称对策论,是研究决策主体的行为发生直接相互作用时候的决策,以及这种决策的均衡问题的理论方法。

招投标整个过程实际上是个博弈行为,这是投标人与投标人之间、投标人与招标人之间的博弈。

投标报价决策所面临的问题纷繁复杂,因为投标人在决定投标前和决定投标后都有很多不确定性的因素,每一个竞争者为了达到自己的目的,必须考虑其他对手的各种可能行动方案对自己决策行为的直接影响,并力图选取对自己最为有利与合理的对策,也就是通常所言的投标对策论。

1.1 博弈类型的划分博弈类型的划分可以从两个角度进行。一是参与人行动的先后次序,从这个角度博弈可以划分为静态博弈和动态博弈。静态博弈是指参与人同时选择行动或虽非同时,但后行动者并不知道先行者采取什么行动;动态博弈是指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动[1]。

另外一个角度是参与人对有关其他参与人的特征、战略空间及支付函数的知识。从这个角度来看,博弈可以划分为完全信息博弈和不完全信息博弈,前者指的是每一个参与人对所有其他参与人的特征、战略空间及支付函数有准确的知识;后者指的是参与人对其他参与人的知识是不完全的。

1.2招标投标博弈分析不完全信息静态博弈也称静态贝叶斯博弈,其中“不完全”信息是指博弈中至少有一个博弈方不完全清楚其他博弈方的得益或者得益函数。不完全信息并不是完全没有信息,实际上不完全信息的博弈方,至少必须有关于其他博弈方得益分布的可能范围和分布概率的知识,否则,博弈方的决策就会完全失去依据,博弈分析也就没有意义。

任何博弈分析的核心问题都是博弈方之间策略的均衡,静态贝叶斯博弈的研究成果也就是投标报价各博弈方的策略对其他博弈方策略的最佳反应。投标报价问题是静态贝叶斯博弈,招投标期间,投标人在各自的投标报价中,独立地做出决定,等价与同时选择行动,在招投标结束时,局中人彼此不知道其他投标人采取什么具体的行动,因此,投标报价问题是典型的不完全信息静态博弈。

投标报价是投标过程的中心环节,各个博弈方的策略就是他们各自提出的报价。由于各投标人信息互相保密,标书是密封递交的且同时开标,各博弈方在选择自己的策略之前都无法知道其他博弈方的策略,只能根据以往的经验作大致的判断,各博弈方的估算成本和报价属于自己私人信息,招标人根据招标文件中的评标办法,确定中标人,投标人的目标就是为了中标获取最大利益,这显然是一个不完全信息静态博弈问题,是静态贝叶斯博弈[2]。

2投标报价的博弈模型

根据博弈分析,我们首先要确定参与投标者、投标价、项目成本估价、投标人收益函数等博弈模型的基本要素:

设定有n个投标人,设为i=1,2,…,n。参加某工程项目招标投标,第i个投标人测定该工程成本估价为ci。ci只有i自己知道,并且相互独立,假设投标人均为理性的,并有着一定的投标报价经验,即ci在[0,1]均匀分布。

第i个投标人的报价设为bi,若他中标则其净效益为bi-ci,否则效益为0。假定局中人都是风险中性的,即效用期望值等价于确定值。

在招标博弈中,假定所有有效投标人的项目方案均符合招标要求,最终结果是报价最低者获得工程承建权。因此对i个投标人的收益函数ui为:

u■b■,b■,c■=b■-c■ b■b■(1)

上述收益函数:

第一种情况是博弈方i标价低于另一博弈方,中标得益;

第二种情况是同时有几个博弈方报价相同,中标概率相等;

第三种情况是博弈i的报价高于另一方,不中标,此时得益为0[3]。

3最低标价法的决策模型的理论推导

3.1 投标报价博弈的基本要素最低价中标投标报价博弈的基本要素包括:参与人、企业竞争信息情报、战略、效用和均衡。投标报价博弈分析的目的就是使用博弈规则决定投标报价的均衡。

①虚拟参与人用N来代表“自然”,参与工程竞标的所有建筑企业,设为i=1,2,…,n;

②企业能够收集到的参与工程竞标的竞争对手的历史投标报价资料数据;

③对于静态博弈而一言,战略也即行动,各竞标参与人的投标报价为a1,a2,…,an,其中ai∈Ai={ai},对于不同的建筑企业的报价有各自的浮动范围,ai min?燮ai?燮ai max,i=1,2,…,n;

④由于工程竞标具有排他性,通常只能有一家中标,因而对于各投标企业而言,设各个企业对于招标工程成本的认定为Ai,则效用为:

u■a■,…a■,…a■=0a■-A■(中标或未中标时的收益) (2)

⑤均衡:各参与竞标的建筑企业最优战略(即报价)的组合。即一组报价为:s■=a■■,…,a■■,…,a■■,其中i=1,2,…,n。

3.2 投标报价的博弈特征工程投标报价的博弈特征主要有:

①参与工程竞标的博弈参与人不具备(也不可能完全具备)关于博弈的全部信息。

②在公开招标投标活动中,只有到开标后各参与人才能得知对手报价情报的详细信息,虽然递交的标书有先后,但是可以认为是同时采取行动的。

在报价博弈中,每个投标人只知道自己对招标工程的个别成本,并不通晓其他人对该工程的个别成本,只是对别人可能的个别成本有一个主观概率,所以是不完全信息静态博弈。给定投标人i的个别成本c和投标报价b,则得益函数期望值为:

Eu■=(b-c)■Pb■

这里Pb■

投标人1面临的问题是使自己的效用最大化,即:

maxEu■=(b-c)■Pb■

当投标人选择b时,他的个人价值为(b),均衡条件下Φ(b)=c,理性的投标人之间相互博弈的结果是投标报价趋近于项目成本价,投标人越多,投标价格越接近项目成本。这种决定了投标报价的原则实际上反映了博弈方所面临的矛盾,那就是标价越小中标机会就越大,但中标的得益较小;而标价越大中标机会就越小,但中标的得益就较大。因此,采取兼顾中标机会和得益大小的折中原则,也就是确定为成本价加上自己估计其他博弈方利润加价的一个比例来进行报价,这是报价的最佳选择[4]。

3.3 投标报价博弈模型的最优解

3.3.1 模型均衡解的存在性参加公开招标投标的工程承包商竞标活动的典型博弈特征使得我们可以运用不完全信息静态博弈理论,对工程项目的竞争进行诊释。博弈理论均衡解存在性定理―纳什定理,认为建设项目投标报价博弈作为一个有限博弈至少存在一个纳什均衡解。这条定理以及工程项目的投标竞标的特征,奠定了工程项目投标报价的博弈均衡解的存在性的理论基础。

3.3.2 两个投标人的投标报价模型求解如果考虑到只有两个人投标人(即n=2)的情况,投标人的得益函数即为:

u■b■,b■,c■=b■-c■ b■b■(5)

投标人得益函数的期望值Eu■为:

Eu■=b■-c■Pb■

其中Pb■

Eu■=b■-c■Pb■

■=gb■+b■-c■g′b■(8)

由此可解得局中人i对对手采用f的最优反应函数,由于对称的贝叶斯均衡中每个人的策略都相同,因此b■取函数f应该处处满足以上一阶条件,也就是等于:

gfc■+fc■-c■g′fc■=0(9)

由于f和g互为反函数,所以我们有gfc■=c■,以及gfc■=1/fc■,因此就得:

-c■+■=0(10)

解此微分方程得到:

fc■=■(11)

即对称的贝叶斯均衡策略为b=■时,为最优解。

3.3.3 n个投标人的投标报价模型求解根据n个投标人投标报价得益函数公式和投标人的期望值为公式,则一阶条件得:

■ =-g■(b)+(b-c)(n-1)g■(b)g'(b)=0(12)

求解微分方程得:

b=■c(13)

当n=2时,上式即为公式fc■=■;

当n=∞时,b趋近于c。也就是说投标人的报价等于工程发包最合理的价值和价格[5]。

4投标报价模型的诊释

4.1 从模型中可以看出,如果成本降低,最优策略报价也要相应的降低;根据以上公式可知,随着报价的降低,中标的概率将增大。

4.2 通过对模型的求解,我们也可以得出随着参与竞标的承包商的数量增多,贝叶斯纳什均衡的最优战略报价将会越来越接近各自完成该项工程的成本,即:

4.2.1 当一个投标者把自己的标价压低在成本的边缘或以低于成本的价格中标时,从瞬时效果来看,首先降低了自己的获利空间,其他投标者则因此无法中标;

4.2.2 从长期效果来看,投标者1的行为向其他投标者传递了一条信息,即在类似竞标环境中,如果要战胜投标者1这类投标者而中标,需要把报价降低到低于投标者1的报价水平上,才有较大的把握中标,于是投标者们纷纷降低报价,可以想象本次的中标价格水平将再次降低。

4.3 如果长期如此,每个投标者都会为自身的生存发展而担忧,为了给自己留下生存的空间,各个投标者将达成一种默契,共同将报价维持在一个能够获得合理利润的水平上。在这一点上,竞标报价行为虽然属于非合作的博弈行为,但也体现了一定的合作博弈的思想[6,7]。

5结论

依据博弈论的思想以及以上模型的分析,我们还可以看出,中标的必然是对该工程项目价格预期最小的投标人,投标企业要最大限度的降低成本,并选择低报价的投标策略,争取更大的中标机会。从理论上讲,让更多的承包商参与投标会降低中标价格,这样既方便业主更好的选择优秀的承包商,也为业主更好的节省了资金,因此国际、国内工程招标一般都采用合理的最低中标评标办法。

实施合理最低评标价法是一项系统工程,需要项目法人责任制、建设监理、合同管理、工程风险管理(如:工程保险和工程保证担保)、资质管理、工程质量监督管理等制度的配套,才能更好地实施合理最低评标价法。

参考文献:

[1]Avinash Dixit, Susan Skeath,(蒲勇健译).策略博弈(Games of Strategy)[M].中国人民大学出版社,2007.

[2]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.

[3]郝丽萍.基于博弈模型和模糊预测的投标报价策略研究[J].管理工程学报,2002(16):94~96.

[4]何增勤.工程项目投标策略[M].天津大学出版社,2004.5.

[5]胡静,王世良.几种基于博弈论的施工企业投标报价模型[J].技术经济与管理研究,2004(2):65~67.

博弈论方法范文7

[关键词] 博弈论与旅游学 价格战 对策

一、博弈论及旅游价格战的博弈模型

1.博弈论与旅游学。博弈论又称为对策论(games theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。它较好地解决了对竞争等问题的可操作性分析,近年来不仅成为经济学中激荡人心的一个研究领域,也为其他许许多多包含竞争现象的问题提供了精细的分析技巧。随着博弈论在各学科中的普遍应用,旅游学中的各分支学科也在不同程度上开始了应用博弈论方法进行分析的探索。

2.旅游公司价格竞争的博弈模型。价格竞争是行业重复建设、对行业总体市场容量过度乐观、企业数量发展过快的结果。近年来,由于国家产业政策的支持, 旅游的产业规模急剧膨胀,旅游公司数量增长幅度大大超过了旅游人数的增长幅度,从而造成供求失衡。旅游公司为争夺市场份额,纷纷把降价作为争夺客源的主要手段。按照博弈论的观点,在非合作博弈条件下,降价是企业的合理选则。现用博弈模型分析如下,假定在旅游市场有两家经营同类产品的旅游公司:a和b,还假设他们同时行动,并只有两种选择:降价和不降价。从而得到表1的旅游价格战博弈模型:

(r——对双方合作的奖励,p——对双方背叛的惩罚,s——给笨蛋的报酬,t——对背叛的诱惑)

运用画线法可求得该博弈的得益数组(420,420)所对应的策略组合(降价,降价)为本次博弈的纳什均衡。由于纳什均衡是一种非合作博弈均衡,虽然双方选择(不降价,不降价)要比降价好,但是参与博弈的双方都是以追求自身利益最大化为目标,每一方都不能保证对方会不降价而自己也采取不降价来共同分享利益,为防止对方降价而自己不降价给自己带来损失的情况发生,最终双方选择的是均采取降价的纳什均衡(420,420)。于是你降我也降,你再降我也再降,重复博弈的结果就是价格大战越来越激烈。这从博弈角度说明了价格竞争的必然性。

实践证明,即使公司能够签订都不降价的行业自律协议,也是无法有效避免降价竞争的发生。因为策略组合(不降价,不降价)不是纳什均衡,行业自律协议不具强制性约束力,即使在短期内能够维持在脆弱的自律平衡状态,机会主义或其他因素也会很快将此不稳定均衡状态破坏掉。这在博弈理论中已有严格的证明。

二、应对旅游恶性价格竞争的对策

在市场经济环境下,自由竞争是市场经济活力的源泉。价格竞争是市场竞争的一种重要方式,特别是在供需失衡的行业中,当供大于求时,价格竞争将更为激烈。然而过度的价格竞争对行业的发展是不利的,以下对如何避免过度价格竞争做一探讨。

1.通过改变博弈模型的结构消除过度竞争。据前所述博弈模型,旅游公司之间的价格战博弈只要符合两个条件:1)t>r>p>s;2)r>(t+s)/2,各公司的最佳选择都是该博弈唯一最优的“纳什均衡”(降价,降价)。要避免出现旅游恶性价格战,可以通过改变博弈结构,使博弈方的收益值不再符合该博弈模型的两个条件。

一种方法是博弈双方主动改变博弈策略,将公司目标从“收入”调整为“利润”。以表1的旅游价格战博弈为基础,根据旅游业的特点,不妨假设选择“不降价”策略时,旅游企业的利润率是30%,选择降价策略时,旅游企业的利润率是20%,则得表2。

以利润为目标的旅游价格战博弈不再符合原博弈模型的两个条件,博弈的最终结果发生了改变,不再是唯一的(降价,降价)。其中纯策略纳什均衡通过划线法容易找到为两个,即(150,150)和(84,84)。目前博弈论界正在研究表2所示的(不降价,不降价)这样的最优纳什均衡出现的条件和机制,一旦找到,就可以为避免恶性的价格竞争提供一条途径。由于其中的研究颇为复杂,此处不再赘述。

另一种改变改变博弈结构的方法是旅游监管部门作为新的当事人参与博弈,也有可能会使旅游公司避免出现恶性价格战。但这需要旅游监管部门加强执法力度,对降价的公司给予足够大的惩罚才能奏效。

2.持续创新同样是旅游行业获得较高利润,避免过度竞争的有效途径。旅游企业可通过开发特色旅游新产品而避免产品雷同。比如近几年的老年旅游市场的开发;以高中学生为对象,在假期举行的高校游;以各种兴趣为对象的摄影游、徒步游、探险游等。

3.除此以外,政府还可通过深化体制改革,硬化企业投资约束,从而消除产业过度进入,达到供求平衡,避免过度竞争。

总之,这些策略需要旅游企业根据市场环境的变化及自身实际情况适时进行创新、调整和选择。

参考文献:

博弈论方法范文8

罗伯特•奥曼作为一名杰出的经济学家,在决策制定理性观点方面有着杰出的贡献,对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此,他于1983年获得了以色列技术机构颁发的科学技术哈维奖,1994年获得了以色列颁发的经济学奖。本文就他在博弈论方面的贡献以及相关思想作一评析。

一、弈论:交互式条件下“最优理性决策”

一般认为,博弈理论始于1944年。数学家约翰•冯•诺伊曼(john von neumann)和经济学家奥斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。

那么,什么是博弈论?奥曼认为,较具描述性的名称应是“交互的决策论”。可以看到,奥曼对博弈论的定义是十分简洁凝练的。因为博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的,就是说人们之间的决策与行为将形成互为影响的关系,一个经济主体在决策时必须考虑到对方的反应,所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点,认为博弈论是交互式条件下“最优理性决策”,即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者,通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中,一个参与者对结果的偏好等级并不意味着是他的可能决策的等级,这个结果也取决于其他参与者的决策。

奥曼还分析了一般和特殊模型中的“解概念”,指出,就社会科学的理性方面而言,博弈论是一种概括或“统一场论”。这里的“社会”是广义的,包括人类和非人类的参与者(如计算机、动物、植物等)。与探讨像经济学或政治学等学科的他种方法不同,博弈论不利用个别的、特定的结构讨论各种具体问题,如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说,博弈论发展了原则上应用于所有交互情形的一套方法,并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间,常常出现密切的联系。然而在其他的情形下,博弈论方法会得出一些其他方法未能得出的新见解。

二、完全竞争经济:参与者连续统模型

众所周知,完全竞争经济模型描述了一种存在着许多参与者(居民和厂商),并且每个参与者的影响都是微不足道的市场情形。就是说,在完全竞争的经济状态下,每个居民或厂商的交易量相对于市场总量来说是很小的,任何一个人交易的商品数量并不会影响总供给和总需求。然而,奥曼认为:“事实上,只要仅存在有限多的参与者,个别参与者对经济的影响就不能被忽视。因此,适合于完全竞争的直观上的概念的数学模型必须包括无限多的参与者。我们认为适合这个目的的最自然的模型包括了参与者连续统(continuum),类似于一条线上点的连续统或流体中粒子的连续统。”

在经济理论中,“连续统”观点的引入对经济学的学科发展有很大的影响。奥曼指出,连续统可以被看作接近于存在许多但是数量有限的粒子(或经济主体,或策略,或可能的价格)的真实情形。采用连续统的粗略估计的目的是使称为“分析”的数学分支的强有力的、精确的方法得以应用,而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受既定的所有商品的价格(单个居民或厂商的决策不能影响价格)。为了使经济处于稳定的状态,价格必须使总需求等于总供给,这就是瓦尔拉斯的竞争均衡(walrasian competitive equilibrium)。奥曼证明了它的存在,并用商人连续统的市场作了明确的说明。

奥曼还考虑了称为联盟的团体和它们之间以互益的方式进行的交易。竞争均衡定义假定厂商允许市场力量决定价格,他们根据市场价格进行交易;而对埃奇沃思著名的“契约曲线”(contract curve)进行概括的博弈论概念的核心,则认为这个核心由在此之上没有联盟可以有所进步的所有分配组成,它忽视了价格机制,仅仅涉及参与者之间的直接交易。奥曼指出,竞争分配的核心和模式与厂商连续统的市场相一致。奥曼通过精确表达完全竞争观点的连续统模型,成功地使最初由埃奇沃思提出,经许多其他模型改进的理论精确化,并从此成为经济理论的基本准则之一。

此外,1975年,奥曼还获得了另一个完全竞争经济中竞争分配和值分配之间等价性的结果。在奥曼看来,博弈论和经济理论中最显著而独有的现象或许是竞争市场经济的价格均衡与对应的博弈的主要解概念(除一个以外)之间的关系。直观上看,等价性原理是说,市场价格的建立是从在完全竞争市场上运转的基本力量自然地产生的,几乎不管我们假定这些力量是怎样运转的。

综上所述可以看到,完全竞争分析所获得的基本观点,使对完全竞争之外的基本经济问题的研究成为可能并且更加容易。在这方面,奥曼最重要的贡献和影响是利用一个或更大的参与者的连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。

三、重复博弈论:理论系统性的发展

重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这种分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如,奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的”(jointly controlled lottery)的概念,即没有参与者可以单方面地改变不同结果的可能性,这个概念与非零和博弈密切相关。之后,奥曼在重复博弈上的研究获得了丰硕成果。事实上,他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科,诸如寡头垄断、委托人与人、保险等等。

四、合作与非合作博弈论:非转移效用与理性的假设

博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代,既是合作博弈发展的鼎盛期,又是非合作博弈的开创期。奥曼在该方面的贡献在于,一方面把“可转移效用”理论扩展为一般的非转移效用理论;另一方面发展并提炼了“什么是理性”,使之形成统一的观点。

合作博弈理论不讨论理性的个人如何达成合作的过程,而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈,它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介(“货币”),每个参与者的效用在其中是线性的。

这些博弈被称为“单边支付”博弈,或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念,然后提出了相应的合作解的概念。他研究了不同模型中的合作解,同时,将非转移效用值公理化,这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年,奥曼还成功地制定了描述非转移效用值的一个简单公理集,这不仅拓展了这一领域的研究,而且产生了许多新的研究方向。

非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到他的目标。与之不同,合作博弈理论的重点则是对群体,并仅从更一般的意义上阐述了每个联盟的赢得,而没有说明如何赢得。奥曼通过多年的努力,发展并提炼了“什么是理性”。他认为:“如果一个参与者在既定的信息下最大化其效用,他就是理性的。”因此,一个理性人选择他最偏好的行动,当然“最”是相对于他所掌握的(关于环境和其他参与者的)知识而言的。令人惊讶的是,这个看上去简单清晰的表述可以以不同的方式理解,当然,也有些是互相矛盾的。什么是“参与者的信息”?他知道其他人的什么情况?是他们的理性吗?奥曼在他的许多影响深远的研究工作中解决了这些问题,并为这些模型制订了标准。

首先,他考察了知识和信息问题。对于这个问题,奥曼相当精确地概括出具有常识性的概念。他指出,如果开始时两个参与者具有了相同信念,但在对于一个具体事件的较晚的信念(基于不同的个人信息)是常识的,则这些较晚的信念必然形成一致。奥曼的观点对非博弈论产生了重大的影响。一方面,它导致了涉及多人情形下知识的正式概念的“交互认识论”整个领域的发展。另一方面,它形成了许多应用范畴。从经济模型——诸如只要人们有相同的最高执行官,他们的行为是人所共知的,那么具有不同信息的人们之间就不会产生交易——到计算机科学——用于分析分布环境,诸如多重处理器网络等。

其次,他假定参与者是“贝叶斯理性的”(bayesian rational)。这在一人决策论中或许是标准的,但是它在多人模型中是否也适用?奥曼引入了相关均衡的基本理论概念。相关均衡出现在经济和其他许多领域,引起了对不同交流程序和通常所说的“机制”的更重要的研究。

同时,奥曼还研究了“达到古典纳什均衡所需要的理性和理性知识的范围”的基本问题。他的观点与专业人士相反,认为答案并不一定是“理性的常识”。严格的理性是对决策者行为复杂的假设,由此产生了对边界理性模型的考察,该模型放宽了假定。奥曼指出,在交互情形下,微小的非理性是如何起很大作用的。实际上,在某些情形下,它能够导致重复博弈的合作。

五、其他贡献

奥曼在值集函数(即值为点集而非单独一点的函数)领域,也作出了许多重要的贡献,如“奥曼可衡量选择定理”、值集函数积分结果等。大部分问题产生于对不同博弈论和经济模型的研究,经济人连续统和数学理论是这些模型演化和分析的重要工具。奥曼所获得的诸如一般均衡、最优分配、非线性编制程序、控制理论、测量理论、定点理论等结果是基本的,它们被应用于经济学、数学、运筹学等许多领域。此外,奥曼把库恩(kuhn)著名的完全检索有限博弈中的行为和混合战略的均衡结果扩展为无限的情形,克服了复杂的技术困难。除了他发表的书外,奥曼多年来对许多人的研究产生了直接的影响。他向他们建议并提出了重要的问题和研究的渠道,与他们分享了深层的理解,帮助并鼓励他们从事研究工作。奥曼总是引导他的学生走向这一领域,与学生之间形成了双向反馈的相互作用,所获得的结果又被他用于塑造和提炼他的观点和理解。

六、简评

在过去的几十年中,奥曼对博弈论和经济理论的发展作出了重要贡献。可以说,在当代的博弈论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广度和深度,他的科学贡献从基本概念、学科的发现与形成到适当工具与方法的发展在分析不同具体问题中的应用,都具有开创性的进展。值得注意的是,奥曼的大部分研究与经济理论的中心问题联系密切。一方面,这些问题为他的工作提供了刺激和推动力;另一方面,他研究的结果产生了经济学新的见解和思维。

同时,奥曼的哲学论文和研究也具有相当的影响力。事实上,奥曼成功地以许多不同的受众可以接受的方式解释了甚至是最复杂的观点。他的研究并不止是一张简单列表,而是展示了所有美丽和清晰的宏伟画面,指出了成就、需要解决的困难以及将来研究的领域。毫无疑问,奥曼的观点从总体上说,在建立并使博弈思想和经济理论思想的轮廓更加清晰方面起了重要的作用。

【参考文献】

1.aumann,r.j.,1964,markets with a continuum of traders,econometrica 32.

2.aumann,r.j.and shapley,l.s.,1974,values of non-atomic games,princeton:princeton university press.

3.aumann,r.j.,1976,agreeing to disagree,annals of statistics 4.

4.aumann,r.j.,1985,an axiomatization of the nontransferable utility value,econometrica 53.

5.aumann,r.j.,1985,notes and comments on the nontransferable utility value:a comment on the roth-shafer examples,econometrica 53.

6.aumann,r.j.,1987,value,symmetry,and equal treatment:a comment on scafuri and yannelis,econometrica 55.

博弈论方法范文9

关键词:360度绩效考核 博弈论 完善措施

中图分类号:g645

文献标识码:a

文章编号:1004-4914(2013)05-148-02

高校行政管理人员主要是指在高等学校从事教学、科研以外的行政管理工作的干部。他们是学校工作的策划者、组织者和协调者,对于学校的正常运行,促进高校发展具有举足轻重的作用。绩效考核是行政管理人员选拔任命及评价的基础环节,一直是人事工作的重点和难点。长期以来,高校行政管理人员在考核中借鉴企业考核方法,在具体考核中常用的考核方法有层次分析法、平衡积分卡、360度考核法及项目管理法等。本文以博弈论为研究视角,在此基础上分析高校行政管理人员360度考核中存在的博弈现象及应用风险,同时提出完善措施。

一、360度考核法的含义

360度考核法,又称“360度绩效反馈”或“全方位评估”,最早是被誉为“美国力量象征”的典范企业英特尔首先提出并加以实施的,是指由员工自己、上司、直接部属、同仁同事甚至顾客等全方位的各个角度来了解个人绩效的一种反馈方法。简言之,即是一种选取不同层面人员,通过各种可能渠道,多角度全方位对人员进行综合考评并反馈的方法。

由定义可见,360度考核法保证了信息来源的多样性,减少了评分误差及个人偏见,具有一定的客观性。同时,在该体系中包含了待考核人员自我评价,在一定程度上提高了人员的积极性与参与意识。然而,360度绩效考核方法属于主观考核方法,考核中定性比重较大,受人为因素影响较大。由于考核涉及考评者较多,参与人员较广,极易形成不利的非正式组织,出现互评高分的现象,在一定程度上影响考核的真实与公正。笔者选取博弈理论为视角,以高校管理部门为背景,探讨360度考核方法在高校行政管理人员考核中的适应性。

二、博弈论对高校管理人员360度考核法的应用分析

(一)博弈论的概念

博弈论(game theory),亦名“对策论”、“赛局理论”,其准确的定义是:一些个人、团队或其它组织,面对一定的环境条件, 在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。{1}一个完整的博弈通常包含五方面内容: 第一,博弈的参与者,即在博弈过程中独立作出决策并承担后果的个人或组织,包括博弈中的决策人、对抗者和局中人;第二,博弈信息,即博弈双方或多方所掌握的对策略选择有帮助的情报资料;第三,策略,即博弈方可选择的全部行为或方案的集合;第四,博弈的次序,即博弈参与者做出策略选择的先后;第五,博弈方的得失,即各博弈方做出决策选择后的收益。

(二)360度绩效考核中的博弈现象

普通高校管理机构一般包含了处级、科级、一般干部,规模从几人到十几人不等,结合360度考核方法,针对高校内部管理人员组成形式,可将各考核主体的考核内容大致分为自我考核、同事间考核及上下级间考核三种情况,相应的,在绩效考核过程中出现了自我博弈、同事间博弈及上下级间博弈三种博弈现象。下面,以高校管理人员考核为背景,对三种博弈现象作如下分析。

1.自我博弈,亦即自我评价。由于博弈双方彼此了解博弈的策略及后果,从理论上说,这种博弈可以称为完全信息静态博弈。高校管理人员自我评价一般表现为个人总结。由于存在信息不对称问题,领导和同事对个人的了解多来自总结中的信息。同时,高校考核结果与奖金、晋升等利益直接相关,因此,为了给领导和同事们留下良好印象,在考核中争取考核优秀,个人在自我评价中往往会规避缺点与不足,从而做出较高的自我评价。由此可见,在自我博弈中,“为自己说好话”是最优策略,低评价的概率极小。

2.同事间博弈。在部门内部,同一科室人员由于接触较多更易形成非正式团体或联盟。绩效考核优秀名额有限,同事间会因争取考核优秀而展开博弈竞争。在360度绩效考核中,较大的联盟更具优势,同事间博弈过程中往往会出现票数垄断现象,即选举中的简单多数原则。该原则是指选举中按多数票决定胜出的办法。其中,多数票即某一候选人所获选票数大于任何其他对手,但往往不是总票数的一

。例如一候选人得票30%,另一人也得票30%,而第三人得票40%,第三人便获得了多数票,从而竞选胜利。假设一个由11人组成的行政部门存在一个6人组成的非正式团体,那么这6人中的任何人都有机会得到6票赞成票,而余下的5人无论属于一个团体还是几个,每人所得赞成票都不会超过6票。所以,该6人团体的成员会因为人数上的优势而轻松获得评价优秀。

3.上级与下级间博弈。领导要做好工作,必须有一个稳定团结的群众基础,而下属的晋升有赖于领导赏识和提拔,因此,领导与下属间一般不存在勾心斗角的竞争现象,表现在绩效考核中会采取合作态度,即双方相互打高分。现借用博弈中经典案例“囚徒困境”的博弈结构来说明这一现象。

“囚徒困境”是数学家塔克在1950年的一次讲演中提到的两个囚犯的故事。故事假设两个小偷a和b联合犯事,私入民宅被警察抓住。警方将两犯罪嫌疑人分离审讯,均给出这样政策:若一个坦白罪行,交出赃物,于是证据确凿,两人都会被判有罪。在此前提下,若另一人也坦白,则两人各被判刑8年;若另一人抵赖,则以妨碍公务罪对其加刑2年,而坦白者有功被减刑8年,立即释放。若两人都抵赖,则警方会因证据不足不能判两人偷窃罪,但可以私入民宅的罪名将两人各判刑入狱1年(如图1)。

图1可见,理论上显然最好的策略是双方都抵赖,结果是都只被判刑1年。但由于两人处于隔离状态,首先,应从心里学角度考虑,当事双方都会怀疑对方会出卖自己以求自保;其次,才是亚当·斯密的理论,假设每个人都是“理性经济人”,都会从利己的目的出发进行选择。两人都会有如下博弈过程:假如他坦白我抵赖,我要坐10年监狱,如果我坦白,最多坐牢8年;假如他抵赖我坦白,我就可以被释放,而他会坐牢10年。综上考虑,不管他坦白与否,对我而言都是坦白划算。最终,两人都会选择坦白,结果都被判刑8年。事实上,领导与下属间博弈就是一个囚徒困境,这种博弈与囚徒困境博弈结构类似(如图2):无论对方合作与否,“不合作”是下属的最优策略,对领导而言亦然。结果,(不合作,不合作)成为惟一的纳什均衡。诚然,由图2可见,从单期博弈来看,(不合作,不合作)是占优决策,但如果博弈双方存在长期关系,即要进行数次博弈,合作有可能达成。如果上级与下属都采取不合作策略,双方每次博弈后所得效益各是1,若都选择合作,双方所得效益均可提高到5。若一方选择合作,另一方选择不合作,虽然此次博弈结果对不合作方有利(得益效用为10),但从长远看这种选择并不明智,因为领导与下属之间的博弈是重复博弈,不合作一方会因一次蝇头小利(10个效用)而损失长远效益(每次5个效用)。综合上述分析,(合作,合作)是上级与下属长期多次博弈中最优策略选择。

三、运用360度绩效考核法的风险及完善措施

360度绩效考核方法在高校管理人员考核应用中存在三种博弈现象,对各种博弈现象进一步分析,总结出在运用该考核方法过程中具有不可避免的风险,如自我高评价、非正式团体的出现及上下级间在考核中的联盟等,这些往往会使绩效考核流于形式,造成考核结果失真。基于上述分析,结合博弈理论,本文提出下列改进措施。

首先,加强高校行政管理人员考核意识,提高考核者素质水平。考核弈现象的出现主要归因于被考核者没有从思想上正确认识考核,担心考核结果会影响到个人薪酬、晋升及领导对自己的态度。这种担忧导致行政人员对绩效考核持排斥、应付态度。同时,也有部分管理人员担心给领导差评会遭致日后“报复行为”。更有甚者,360度绩效考核成为某些管理人员用以泻私愤的工具。如此种种情况必然导致考核过程弄虚造假,考核信息缺乏真实性。因此,只有在高校管理人员内部加强思想培训,端正对绩效考核的态度,才能从根本上杜绝考核弈现象的发生。

其次,要逐步改进360度考核方法,增加定量考核比重。360度考核体系中人的主观因素占很大比重,在一定程度上忽略了定量的权重。因此,在考核过程中要突出量化指标,避免或减少那些由于考核者对指标的个人理解不同而易产生偏差的指标。比如,同样是“合格、良好、优秀”等标准,不同的考核者对这些标准的理解就会有偏差。一般来说,“工作业绩”等可以量化的指标就比“工作态度”、“工作质量”等易于评价。

再次,避免360度考核结果与奖金、职务晋升等直接挂钩。

作为绩效考核的奖惩结果,奖金、晋升等不应作为唯一方式。事实上,正是因为考核与管理人员薪酬、职务等切身利益相关才导致考核弈现象出现。在具体操作中,可用团体荣誉奖来代替个人物质激励,从而减少团体内部博弈现象发生。

总之,高校行政管理部门不能机械套用360度考核方法,必需结合本单位实际情况,对360度考核方法加以改进完善,同时吸取其他绩效考核方法的优点,使得360度考核方法能够扬长避短,真正做好高校管理人员绩效考核工作。

注释:

{1}吕占峰.博弈论在工作团队绩效考核体系中的应用[j].理论月刊,2007,3:85.

参考文献:

1.宋红伟.浅议高校行政管理的改革[j].知识经济,2011(10)

2.胡燕.基于互联网的360°反馈评价法在高校中层干部考核中的应用[j].黑龙江高教研究,2010(04)

3.尹鸥.齐齐哈尔大学行政管理干部绩效考核指标体系研究[d].哈尔滨工程大学,2010.

4.古银华.360度绩效考评方法研究评述[j].成都理工大学学报(社会科学版),2008(01)

5.吕占峰.博弈论在工作团队绩效考核体系中的应用[j].理论月刊,2007(3)

6.胡伟.“水土不服”的360度反馈评价[j].企业经济,2004(10)

7.孙健.360度绩效考评[m].北京:企业管理出版社,2003.

8.谢识予.经济博弈论(第二版)[m].上海:复旦大学出版社,2002.