博弈理论论文实用5篇
【路引】由阿拉题库网美丽的网友为您整理分享的“博弈理论论文实用5篇”文档资料,以供您学习参考之用,希望这篇范文对您有所帮助,喜欢就复制下载支持吧!
博弈论论文1
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(OskarMorgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括1篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimaxsolution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
囚犯的两难处境
大理论中的小故事
要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalrygame)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
贸易自由与壁垒:
以上就是差异网为大家整理的5篇《博弈理论论文》,希望可以启发您的一些写作思路,更多实用的范文样本、模板格式尽在差异网。
博弈理论论文2
在现实经济生活中,纳税人为了达到少纳税或不纳税的目的,可能采取向征税人寻租的策略,与征税人员勾结偷税。征税人利用手中控制的税收征管、稽查等权力接受纳税人的寻租行为(行贿),而相应地给予纳税人偷漏税的机会,同时自己获取非法收益。纳税人为获得这些好处要付出一定的成本(贿赂),而征税人员又因其受税收任务与受贿风险的约束,其能够接受纳税人寻租的“租金”是有限的,因此,就会出现同类纳税人向征税人竞相“寻租”的结果。因为如果某一部分纳税人通过寻租成功减少了税款,就相当于减少了其生产或经营成本,相应地就具有了相对于守法纳税人更为有利的竞争优势。从这个意义而言,纳税人是否选择寻租是具有“竞争性”的。而寻租成功所产生的“示范效应”,又进一步地鼓励其他纳税人加入寻租的行列。
假定只有两位纳税人(寻租者)A和B,对于一项特定的税收优惠,寻租者寻租成功后的预期利润为L,作为理性的经济人,一方面,每个寻租纳税人愿意花在寻租上的额外支付不会超过既定税收优惠R和他此次寻租后的预期收益L的差额M(M=R-L);另一方面,为了自身经济利益的最大化,每个寻租纳税人会使自己付出的租金M最大化。研究假设R/2≤L≤R,即寻租者寻租后的预期利润不小于平均利润,也不超过征税人员违规提供的税收优惠总额R,由此可推导出R/2-M≥0。其支付矩阵如图1所示。这是一个典型的“囚徒困境”问题,在这个博弈中纳什均衡就是(寻租,寻租)。因为若给定B纳税人寻租的前提下,A纳税人的最优选择是寻租,若其不寻租,则A的预期利润为0,B的预期利润为R-M,因此对于A来说寻租比不寻租好。同样,给定A纳税人寻租的前提下,B纳税人的最优选择也是寻租。因此该博弈的唯一纳什均衡为(寻租,寻租),各方收益组合为(R/2-M,R/2-M)。事实上,如果将这个博弈模型扩大至多个(N个)纳税人(寻租者),各参与方的行为也符合上述分析结论。多个纳税人的竞争行为会使每个寻租者均会选择“寻租”策略。因为如果有一个纳税人不选择这样做,那么他的预期收益将会从R/N-M降为0。因此,当所有博弈参与方的想法均是为了实现自身利益最大化时,最终导致的结果就是他们都采取“寻租”策略。由此可见,在税收征管活动中寻租行为是很容易发生的,征税人员若没有足够的激励和约束,就很容易利用自己手中的权力与纳税人互相勾结,偷税漏税,最终的结果必然是导致税收无序流失。
再者,因为税收总规模是既定的,纳税人的寻租活动也是需要付出一定成本的,因此,由纳税人相互之间的竞争所产生的这种博弈不是“零和”博弈,因为在交易过程中会造成大量社会资源的损失和浪费,从而最终会产生某种“负和”的结果,即社会损失。这一过程正如奥尔森(1999)认为的那样,“这种情况与其说是分蛋糕,不如说是在瓷器店争夺瓷器:一部分人虽然多拿了一些,但同时也打破了一些本来大家可以分到手的瓷器。”而产生这种结果的原因在于,各参与方之间的寻租行为,在交易过程没有创造任何的社会价值,而是通过对有价值资源的浪费来消灭价值,致使很多社会资源以交易成本的形式无谓地消耗掉了。而且如果放任下去,管理层面缺乏相应的制度和机制设计来改变这种各部门博弈的状况,这种不利局面将作为一种“纳什均衡”的状态长期存在下去。
二、监督和治理“寻租”行为的博弈模型分析
由于租金的存在,导致纳税人之间争相寻租以获取自身利益的最大化,从而造成了社会资源的无谓损失和浪费。因此,要想消除寻租行为带来的不利影响,必须消除寻租活动中产生的租金,这主要从寻租和受租(设租)两方面进行监督和治理。
(一)对纳税人寻租行为进行监督的博弈模型在该博弈中,参与者为纳税人和监督机构。纳税人以“寻租”或“不寻租”作为其纯策略选择,监督机构以“监督”或“不监督”作为其纯策略选择。假设在寻租过程中产生的“租金”为R;寻租成本为F,其中:寻租金额为F1,被发现后寻租者所受到的惩罚为F2,监督成本为C;监督机构进行监督的概率为α,监督成功的概率为t(相应地,监督不成功的概率为1-t),纳税人选择寻租的概率为β(不寻租的概率为1-β)。该混合策略博弈模型如图2所示。
(二)对征税人受租(设租)行为进行监督的博弈模型在该博弈中,参与者为征税人和监督机构。征税人以接受寻租或不接受寻租为其纯策略选择,监督机构以监督或不监督为其纯策略选择。同样假设在寻租过程中产生的“租金”为R(因为征税人接受寻租从而引起的税收损失),征税人的工资及各种薪金收入为S,监督成本为C,征税人接受寻租的金额为M,征税人受租被发现受到的惩罚为B,社会认为征税人受租可能被监督机构发现的概率为p,征税人认为受租后可能被监督机构发现的概率为q。监督机构选择监督的概率为θ,征税人选择接受寻租的概率为γ。博弈模型如图3所示。
三、税收管理中寻租行为治理的路径选择
通过前述博弈模型的分析,对税收管理活动中的“寻租”与“设租”行为的治理可从如下几个方面入手。
(一)形成良好的税收激励约束机制
一个良好的税收制度的设计和调整应该是对政府的施政目标和纳税人的利益目标通盘考虑的,能够兼顾各个博弈参与方的利益,即税制设计既考虑纳税人在具体税制实施过程中有可能采取的为了减少其自身的税负或减少纳税数额而进行的各种对策选择,又要充分考虑纳税人的这些对策选择会对整体税制的实施所带来的预期影响。因此,政府应尽可能设计这样一种税制,即能够使得纳税人追求其自身利益最大化的策略选择刚好符合政府的利益取向和施政目标,从而能够形成税收“激励相容约束”,以减少税收的无谓浪费和流失。
(二)建立有效的税收相关信息获取机制
因为纳税人和征税人之间、纳税人和监督机构之间,以及征税人和监督机构之间的这些博弈都属于不对称信息博弈,因此,征税人对纳税人行为和策略选择、监督机构对于纳税人和征税人的行为和策略选择的了解和掌握通常是不全面的,且一般情况下某些博弈参与方会尽可能地隐藏其相关信息。因此,应建立一种有效的包含税收各参与方在内的信息获取机制,全面推进税务机关与工商、银行、海关等部门的信息共享制度,以尽量打破信息壁垒,缩小信息不对称的范围,使得税收制度的设计与调整尽可能在信息完备的情况下进行。
(三)规范征纳双方行为
1.治理纳税人寻租的行为规范选择(1)硬化细化惩罚措施,加大寻租惩罚力度。目前纳税人对寻租风险大都持无所谓的态度,即“风险中性”,这其中的一个重要原因在于征税人方面一般是检查有余、惩罚不足,无法有效威慑纳税人,因此应硬化细化惩罚措施,加大对纳税人寻租的惩罚力度,使纳税人的寻租成本大大高于其由于寻租所可能带来的利润。(2)加大监督力度,降低监督的成本。加大税务机关对纳税人和征税人的双重监督,提高监督工作的效率和成功率,以此降低纳税人寻租或征税人受租的积极性。充分利用当前迅猛发展的电子信息网络,实施电子稽查与电子监督,以降低稽查成本。(3)利用各种媒介,强化税收宣传。在我国现阶段,以法治为核心的公民自觉纳税意识还没有完全建立起来,出现了所谓的“意识约束真空”。因此需要加强税收宣传,广泛利用媒体,通过扎实、深入、细致的宣传教育引导纳税人自觉纳税,增加其寻租的心理成本。(4)规范税收征管,对纳税人实行分类管理。我国进行的历次税制改革已经取得了很大的成功,但部分税种在系统性、协调性、适应性和可操作性上存在“先天不足”。因此应完善税制,建立健全税收征管法规,通过先进的税收征管手段、科学的征管方法和优化的征管模式使纳税人无机可乘。并可考虑根据纳税人以往的纳税记录,将其进行分类管理。
2.治理征税人受租(设租)的行为规范选择(1)健全约束机制,加大监督和惩罚的力度。应强化信息化建设,制约执法权,提高执法透明度,制定合理的惩罚措施,建立强有力的监督和约束机制,从源头上杜绝税务人员通过各种途径获取“租金”行为的发生。(2)提升征税人受租(设租)成本和受租(设租)风险。要降低纳税人寻租成功的可能性,就必须从提高税务人员的受租(设租)成本和受租(设租)风险入手。一是提高受租(设租)者的未来收益预期,二是提高受租(设租)查处率,从而有效防止“囚徒困境”的产生。(3)引入竞争,采取激励机制。征税人之所以选择受租(设租),其原因在于可获取违规收益,税制的设计应在加强对征税人监督的同时适当提高其工资福利水平,完善激励机制,建立奖励制度,那么征收人就没有必要冒违规之风险,从而削弱税务人员接受寻租的动机。此外,由于征税人与征税人之间存在博弈,因此可考虑引入竞争,对征税人实行竞争上岗、优胜劣汰等,加大其机会成本和违规风险,建立有利于征税人自律的激励机制。(4)完善税法,改进征管技术。税法的不完善、不健全甚至是漏洞,不仅使纳税人有机可乘,也为征税人违规提供了可解释的空间,并导致监督成本的加大。因此应完善税收法律法规,改进征管技术和手段,建立健全循环、链条式的监督制约机制,提高征管效率。
博弈论论文3
「摘要题乡村治理
「关键词宗族/农村治理/合作博弈
一、引言
随着1998年《村民委员会组织法》的颁布以及“草根民主”观念的普及,农村村民自治和农村治理成为近年来的研究热点之一,尤其赢得了很多社会学家的智慧。农村治理,就是农村公共权威管理农村社区,增进农村社区公共利益的过程。值得注意的是,正如徐秀丽等人(2004)所指出的,治理不同于统治,它不仅仅依赖于政府权威,还依赖于民间权威,或者二者的结合。因此,农村治理不是运用政府的政治权威,自上而下发号施令、制定和实施政策,而是通过上下左右的互动、合作协商、确立认同等方式实施对公共事务的管理。
从近代直到现在,治理中国农村的公共权威结构主要由政府、政党和民间三部分组成,其中,政府和政党属于官方的权威机构,他们在中国农村治理中起着决定性作用。新中国成立后,农村治理结构与以前相比还是有了很大变化,政府和政党权威深入农村,国家对农村的控制明显加强。民间治理权威,尤其是一直广泛存在的“宗族治理”受到严厉打击,在建国后的30年里销声匿迹。改革开放以后,这种情况才逐渐发生变化。20世纪80年代中国以村民自治为核心的农村治理改革,源于体制解体后农村社会广泛出现的权力真空。1982年通过的《中华人民共和国宪法》中规定了村民委员会的自治体制。1987年全国人大又通过了《中华人民共和国农村农户委员会组织法(试行)》,1988年开始实施,标志着农户委员会的建设进入了制度化、法律化的轨道。根本法和具体组织法确立了农户委员会作为农户自治组织的法律地位。《农户委员会组织法》的正式颁布,确定了农户委员会不是一级政权组织,而是农户自我管理、自我教育、自我服务的基层群众性自治组织,并要求实行民主选举、民主决策、民主管理和民主监督。于建嵘(2002)认为,在文本制度上,村民自治是以确认和保护农户个人权利为前提的农村治理制度。目前中国乡镇村治体制是国家在市场经济背景下对农户个人权利承认和保护的制度性承诺,是一种基于市场、民主和法制理念的新的行政管理结构和农村治理方式,标志着国家行政化与乡村自治权的相对分离。
换言之,农村治理应该是一种基于民主和市场的“合作”过程,是谈判而不是强制的。我们知道,要在谈判的基础上形成长期稳定的合作,谈判双方达成的协议必须是能够自我实施的,也就是说,谈判结果必须是一个纳什均衡。但是,从个人理性出发,一次性博弈的纳什均衡很难是“集体理性”的,即结果不会是相互合作,著名的“囚徒困境”表达了这个思想。在一个村庄当中,农户之间是否会相互合作?如果能,则农村治理容易达到所谓“善治”(俞可平,2001)的结果,否则,农村治理必将陷入困境。
值得注意的是,从历史上看,在农村治理中,宗族通常起着十分重要的作用。20世纪80年代以来,宗族在很多农村地区出现了复兴局面,那么,宗族复兴是否有助于以村民自治为核心的新型农村治理达到所谓的“善治”?以民间权威为主导力量的农村治理意味着农户要有相互合作的动力,而一个有待解决的问题是,如何才能产生一种能自我实施的协议来约束农户的行为,促使他们进行长期合作?本文的目的是回答上述这些问题。
本文其余部分的结构安排如下:第二部分分析了农村中宗族治理的产生、发展和复兴的原因及背景;第三部分引入了一个合作博弈的分析框架;第四部分分析合作剩余的来源;第五部分做了一个推广,分析了产权安排与农村治理之间的关系;最后是本文的结论。
二、农村治理中的宗族:我们知道什么
历史上,宗族曾在农村治理中起着十分重要的作用。将宗族置于20世纪的历史时段,宗族在村治中的作用经历了三大阶段,第一阶段,20世纪前半叶居主导地位,作用很大;第二阶段即1949年至1979年间,宗族作用潜伏着,没有正式的合法的地位;第三阶段为1980年以来,宗族的作用凸现,但是不如20世纪上半叶那么强大(肖唐镖,2001)。在新中国成立前,宗族在中国的大部分地区,尤其是南方地区一直是村级治理的核心。宗族治理依靠的是农户间的相互合作(尽管有国家行为的痕迹),这就要求从长期来看,“合作”比“不合作”的收益更大。尽管乡绅和宗族势力在1949年以后都遭到了严厉打击,乡绅阶层消失了,宗族和宗法制度的合法性被彻底剥夺,但是,宗族势力却没有消失。在宗族销声匿迹的30年中,宗族赖以萌生的先天土壤,成员连结的血缘性和居住的地缘性相契合,在中国农村并没有遭到根本的破坏。即使在国家对基层控制最严的20世纪60~70年代,宗族作为一种社会群体仍构成农村庄会的基础,宗族的关系网络成为农户寻求资源和帮助的首选对象(杨善华等,2000)。20世纪80年代以来的宗族复兴对于农村治理具有重要的意义,如果它意味着农户之间自愿合作的意愿加强,那么,利用农户的这种合作意愿,以民间权威为主的农村治理就可能取得成功。不过,农村的宗族为什么会出现复兴?这种复兴是否真的是农户“合作意愿”加强的表现?
唐军(1996)在《当代中国农村宗族复兴的背景》一文中对宗族的复兴作了精彩的论述。他认为,宗族在20世纪80年代以来的复兴,是家庭联产承包责任制的推行、农户委员会的设立及儒家思想的回潮,为宗族复兴提供了需求、空间、际遇和资源的结果。宗族的复兴说明,第一,由于社会还没有为回应农村家庭的求助而建立的正式的生产经营支持机构,于是家庭与家庭之间的合作就成了农村生产经营合作最主要的方式。第二,生产经营与家庭利益的紧密联系又在不断地压缩农户可能信赖的合作对象范围,有血缘联带的宗族家庭遂成为农户最主要的合作选择对象。第三,农民委员会与原来的生产队相比,其对农户生活的介入及对社区运转的调控能力大为弱化,这最终导致了农村庄区生活的组织真空,宗族因而有可能以同宗家庭的利益保护者和利益协调者的面貌出现,这是宗族在农户间较易取得信任也较易扩展势力的领域。第四,农村社区的很多方面缺少社会的保护、国家的干预和法律的覆盖,这也为宗族的活动提供了生存依据。
不过,值得注意的是,在市场经济的冲刷下,村庄内部的宗族和宗族联系的日益理性化是非常明显的。在通过复兴宗族和宗族力量可以在新的社会时空条件下获益的地区,宗族和宗族的联系实际上通过市场的力量以一种类似传统的方式出现(刘义强,2004)。但是,这种合作只是短期的,由于外部世界被打开,农户不再将宗族和宗族作为当然的社会联系范围,而是寻求家庭利益的最大化,这就导致传统的基于血缘的宗族和宗族这种首属群体的社会连结机制的日渐消解。宗族和宗族意识淡薄,即使亲兄弟之间也很难进行一些长期的合作(刘义强,2004)。
我们可以看到,宗族的复兴是由于农户能够通过“宗族”形式下的合作获得更大的收益,包括从生产、谈判和自我保护中得利。也就是说,宗族的复兴表明了在很多领域,农户之间存在“合作”以获得更大剩余的动力。因此,宗族组织的形成和发展可以看成一个村民为获得更大的剩余而相互合作的过程。同样,以农户自愿合作为基础的新型农村治理也可以看作是农户为获取更大的剩余而相互合作的过程,换言之,这个问题可以放在一个合作博弈的框架中进行分析。
三、一个合作博弈的框架
在本节中,笔者引入一个合作博弈的框架,分析农户合作的动力和背景。农户间的自愿合作意味着:①合作能够产生更大的剩余;②每个参与人都能从合作中获益,即对剩余的分配是合理的。在一个合作博弈的框架中,我们必须知道的几点是:
1.博弈的初始状态是什么?或者说,村民的保留效用为多少?又取决于什么?一般而言,村民的保留效用就是不合作的时候能够获得的收益。因此,在没有形成一个良好的农村治理结构以前,农户总的收益减去各种税费支出就是农户保留效用。显然,这个保留效用随着农村治理状况的变化而变化,治理状况越好,保留效用越高,反之反是。这也就意味着,治理状况越差的地方(比如公共品没有提供,公共资源不能得到保护,社会治安状况不好,农户间合作很少)越有形成新的治理结构的需要,农户的合作意愿更强。
2.合作何以发生?事实上,宗族出现和复兴的一个基本原因便是农村数百年以来的聚居格局。而且,农户聚居的村落一直以来都是封闭的。相对封闭的世居和人们在生活中的各种来往和联系强化了有关宗族的意识和观念,在农村中人们为争夺各种资源的斗争和冲突则明确了宗族或宗族的边界(杨善华等,2000)。封闭的聚居格局就构成了我们通常所说的“熟人社会”。熟人社会最重要的含义首先在于单个农户的信息在村庄中是公开的;其次在于村庄是封闭的,农户不可退出村庄。因此,熟人社会的真正要义在于把农户之间的博弈从单阶段博弈变成了重复博弈。
农户之间难于形成长期合作,与“外部世界被打开”密切相关。从博弈的结构看,农户之间进行重复博弈,意味着农户即使在某一个阶段受到损失也不要紧,因为他更看重长期利益,农户会珍惜自己的“愿意合作”的声誉而不至于为了短期利益采取不合作的态度:“外部世界被打开,农户不再将宗族和宗族作为当然的社会联系范围”使得农户决策时面临的是一个一次性博弈。对于一次性博弈而言,只有当合作的收益肯定大于不合作的收益,即合作是农户的占优策略时,农户才会采取合作的行动。
因此,总结起来,合作发生条件有两个:要么合作能够产生足够大剩余①;要么合作是长期的。
3.合作剩余如何分配?一般情况下,合作剩余总是根据谈判能力来分配的。不过,在一个农村中,村民之间的谈判能力取决于农户的保留效用,显然,农户的保留效用是以农户的效用函数和劳动生产率为基础的,越偏好劳动的农户,保留效用越高,劳动生产率越高的农户,保留效用越高;反之反是。
四、合作剩余从何而来
从上文的分析中我们知道:合作剩余的大小决定了合作能否取得成功。那么,接下来的问题就是,合作剩余从何而来?
1.生活保障的提供。赵力涛在分析宗族的时候指出,宗族的维持机制有两个,一是宗族仪式,它在确认宗族结构、明确宗族规范方面起着重要作用;二是日常实践,农户的日常实践活动发生在这么几个领域:经济领域、政治领域和社会领域。杨善华(2000)进一步强调道,中国农村的宗族组织、宗族意识和宗族活动,固然体现在宗族仪式、宗族象征符号及制度规范等方面,但更重要的是,他们是活生生的东西,存在于农户的日常生活实践中。刘援朝(1997)指出,宗族组织正是由于它所具有的认祖同宗和族人互济的功能,使同姓农户在心理上获得了保护,从而延续数千年之久。宗族具有的互助和公益事业的功能是其他社会团体所不能取代的,因此具有强大的生命力,并将在新的时代以新的面目出现,在新的环境下产生新的适应方式。这些论述表明,资源的提供和农户之间的互相救助是日常生活实践主要的表现。显然,族人共济这一方式所提供的生活保障功能是合作剩余的一个重要组成部分。
2.抵制外来压力。近年来,中国乡村两级基层政权负债严重,财政困难。它们在“压力型体制下”借助乡村准行政性体制加大了对农户税费的征收规模和征收力度,乡村干部的“赢利性经纪”行为突显(刘义强,2004),以至于在很多地方,乡村干部的工作职责变成了抓计划生育和收农业税(费)。随着农业税费改革的进一步推行,乡村基层政权面临的财政困难将更加严重,乡村政权不能运转,这会导致乡村政权加紧对农户税费的征收,并最终使得社会矛盾更加尖锐。有研究指出(项继权,2002),财政困难可能导致乡村民主的出现,也就是说为了抵制乡村政权对农户的剥夺,农户会联合起来要求更多的自,因此,抵制外来压力也是农户互相合作,实行农户加强合作的重要原因之一。[page_break]
3.村庄或者说农户间的合作,只能在农业范围内提供收益,因此,随着农业收入占农户总收入比重的日益下降,农户选择不合作的可能性增加。但是,在很多有着强大集体经济,尤其是集体工业的农村,乡村工业成为吸收本村农户最主要的载体,而且,与外来务工者相比,本村农户工资、福利更高,也更多地担任管理职务,在这些村庄,村庄为农户提供了收入来源,农户间合作的可能性加强。
4.生产要素、技术和生产工具的提供。农户间通过资金、土地和劳动力的共享与合作可以提高劳动生产率和降低劳动强度。对大型农具的共同拥有和使用,则有助于减少农户的生产成本。另外,生产技术和市场信息的共享也有助于降低农户的生产成本并且增加其收益。
前文笔者论述过,合作有两个条件:要么合作剩余足够大,要么合作是长期的。在某个一次性博弈中,合作可能是所有农户的“占优策略”。但是,这种均衡结果出现的概率不高,因此,另外一个值得考虑的问题是,如何把合作从“一次性”转化为长期的,如何把一次性博弈变成重复博弈,或者说,有没有这种转变的可能?
新中国成立前,村落的封闭性使得农户不能退出村庄,没有退出权又进一步使得农户之间的博弈从一次性博弈变成了重复博弈,声誉机制的作用最终导致了农户之间的相互合作以及宗族势力的强大。改革开放以来,农户的流动增加,村落也不再是封闭的,而是逐渐向外开放,农村庄会正逐渐变成了一个“半熟人社会”甚至“陌生人社会”,尽管单个农户的信息在村庄中是公开的,但是农户可以退出村庄,村庄和宗族不再是农户获得资源的唯一地方,这样一来,农户间的博弈就成了一次性博弈,农户相互之间的长期合作变得困难。因为合作的参与方不能惩罚不合作的参与方,只要外部机会足够好,农户就存在“先偷懒然后退出获得外部机会”的动力或者干脆“获取外部机会而从不与其他人合作”。总而言之,在这种环境下,“声誉机制”已经不起作用了。农户对农村内部合作需要程度的变化会影响农村治理模式的变动。农户对合作的需求越强烈,农户达成合作的可能性就越高。
五、一个推广:产权安排与农村治理
从前文的论述中我们知道,要保证农户间的合作,就必须保证,至少从长期来看,合作的收益比不合作的收益要大。一般情况下,只要博弈是重复的,对于效用函数和劳动生产率相同的人而言,合作收益通常是大于不合作受益的,因此,在这种情况下,若是能够保证博弈是可重复的,农户间就会选择合作。不过,在人们的效用函数或者劳动生产率不同的情况下,合作的达成就要困难得多。值得注意的是,在合作的情况下,分配往往是平均主义的,由于信息缺乏和合同不完备的原因,从而按贡献分配几乎是不可能的。我们假定农户的效用函数取以下形式:
U=a[,i]Lp[,i]+b(24-L)
其中,L表示劳动投入时间,p表示劳动生产率。i=1,2表示两个不同的农户。首先考虑效用函数的不同,即a[,1]≠a[,2];b[,1]≠b[,2];不失一般性,假定a[,1]>a[,2];b[,1]<b[,2];也就是说,农户1更加偏好劳动,而农户2更懒。此时,如果农户2采取不合作的态度(事实上,农户2几乎总是不合作,因为这样他的效用更高),与两个农户具有相同的效用函数相比,农户1对农户2的惩罚更困难。考虑一个两阶段博弈:农户1在第一阶段不合作,如果在第二阶段农户1以不合作做为惩罚手段的话,他的惩罚措施必须足够强,使得农户2不合作的总效用低于它合作的总效用②。如果农户2足够偏好闲暇,那么农户1就必须采取“彻底”的惩罚措施,但是,“彻底”的惩罚措施,比如说完全不干活,也会大幅度降低农户1的效用,因此,农户1不大可能采取很“彻底”的惩罚措施(否则自己遭受更大的损失)。这就说明,在效用函数不同的情况下,(不合作)更加可能成为农户间博弈的均衡结果。同理,在农户的劳动生产率不同的情况下(即p[,i]的取值随农户不同而不同),只要分配方式不是完全按照贡献进行(完全按照贡献进行意味着信息是完全的,而且农户的贡献是能够被证明的),那么也会导致不合作的结果。
通过以上的分析,我们看到,即便博弈是可重复的,如果农户间的效用函数或者劳动生产率不同,农户间也不会达成合作。因此,促使农户合作中的一个重要问题就是:如何边缘化不合作者?即边缘化那些具有更加偏好闲暇的效用函数和劳动生产率更低的人?
中国农村的实践表明,公有产权往往是低效率的,因为人们无法边缘化那些不合作的“搭便车者”。这是由于公有产权伴随着的事往往是“平均分配”,而公有产权下的农户根本不可能具有相同的效用函数或者相同的劳动生产率,相反,他们的效用函数和劳动生产率具有很大的差异。因此,即便博弈是可重复的,农户间也无法达成合作。最终的结果是在公有产权下,那些不合作者往往很难被边缘化。事实上,由于农村社会是一个熟人社会,农户间相互知根知底,信息是完全的,只要合作产生的收益足够大,那些效用函数和生产率相近的农户就有相互合作的动力。因此,如果不是强制性的合作,农户间通过自由选择就能把那些不合作者排除在外。我们知道,要保证没有合作不是强制性的,就必须保证农户所拥有的产权是明确和清晰的。换言之,在公有制条件下,那些愿意合作者将不能将那些不愿意合作者摈弃,从而达不成合作的结果。
以上的分析表明,在以农户自愿合作为基础的农村治理环境中,明确和清晰的产权是一个关键。通过边缘化那些不合作者,愿意合作的农户能够达成稳定的合作。然后,那些不合作者在被边缘化之后能够获得更低的收益,从而不得不加入合作。同时,对于那些劳动生产率低地的农户而言,加入合作组织的条件是同意对合作的剩余“按贡献分配”,而在公有制下,这是不可能的。
六、总结
在乡村政权向服务型政权转型的过程中,农村治理将更多地依赖于民间权威,即农户之间的谈判、协商与合作。农户之间要通过谈判达成合作,尤其是要达成长期合作,条件之一保证农户之间的博弈是重复博弈,这就要求村庄的结构是封闭式的。封闭式的村庄不是指地理位置和信息上的封闭,更不是指农户无法退出村庄,没有更好的外部机会获得更多的资源和更大的保险。毫无疑问,农村的开放和农户流动的增加使得村庄不再是封闭的,部分农户可以有更好的外部机会,获得更多的资源和更高的收入。因此,农户间的合作越来越困难。
不过,由于农户依然有着加强组织,增强自身谈判能力的需要,农户依然有互相合作的需要。为了对抗上级政权的过分的税费征收以及对村庄的侵扰或者与其他村庄争夺经济资源,农户们可能联合起来,这也可能加强农户间的合作。笔者的分析表明,村庄治理的难易程度与农村的市场开放程度、经济发展程度和经济发展模式密切相关。一般情况下,市场开放程度越高,农村治理越困难,因为农户互相合作越困难;经济发展模式越是村庄主导(即集体经济越发达),农村治理(尤其是农户自治)越容易。
另外,笔者的分析还表明,即便农村社会是封闭的,从而博弈是可重复的,合作也不一定能够达成。因为产权安排会影响农户间的合作,本文认为,在以农户自愿合作为基础的农村治理中,明确而清晰的产权是题中之意。因此,必须进一步明确和完善土地承包权,对那些共有的自然资源,比如山林,水库,池塘等,要么完全由村委会管理或者上级政府管理,要么就通过承包、租赁等方式明确其产权。
注释:
①足够大的剩余意味着,在该剩余下,囚徒困境的均衡结构不可能出现,当一方合作时,另一方不合作所得到的收益仍然小于双方合作所得。
②比方说,在一个两阶段重复博弈中,农户1合作的效用是5,农户2也是5,在博弈的第一阶段,若农户1合作,农户2不合作的效用为6.那么,只要第二阶段农户1不合作时农户2的效用低于4,农户2在第一阶段就会选择合作。不过,若在该博弈中,农户2合作的效用为4,而在对方合作自己不合作时的效用为6,在第二阶段中,若农户采取不合作的态度作为对农户2在第一阶段中不合作的惩罚,那么,只有在该条件下惩罚才是有威慑力的:都不合作时农户2的效用小于2.显然,与第一种情况相比,第二种情况下,农户1的惩罚措施必须足够有力,这也意味着该情况下合作更加困难。
「参考文献
[1]刘义强:《选举背后的村庄生活逻辑》,《中国农村观察》2004年第2期。
[2]唐军:《当代中国农村宗族复兴的背景》,《社会学研究》1996年第2期。
[3]刘援朝:《云南元江县白族的宗族组织与制度》,《社会学研究》1997年第5期。
[4]杨善华、刘小京:《近期中国农村宗族研究的若干理论问题》,《中国社会科学》2000年第5期。
[5]俞可平:《治理与善治:一种新的政治分析框架》,《南京社会科学》2001年第9期。
[6]徐秀丽:《中国农村治理的历史和现状》,社会科学文献出版社,2004年。
[7]于建嵘:《新时期中国乡村政治的基础和发展方向》,《中国农村观察》2002年第1期。
博弈理论论文4
根据生态社区环境的特点,建立博弈模型[10]步骤如下:Step1:假设信号博弈论主要对象为政府管理部门G和社区间的企业(沿街店面、企业等)P,其中P为信号的发出方,G为信号接受方,政府管理部门和社区企业在追求各自利益最大化的同时,作出“监管”与“不监管”或“治理”与“不治理”的决策,在这里,我们引入社区居委会、第三方中介等机构S,主要职责为进行日常的“监管”。Step2:用12,表示为P的类型空间,α为对P的专有信息,当1时,表示社区企业采取了“治理”决策,当2时,表示社区企业采取了“不治理”的决策,α对S是一个未知的博弈信息源,但S知道P的先验概率i。Step3:用12mm,m表示为P的信号空间,在这里假设社区的环境污染给社区企业造成的环境经济损失和进行“治理”决策企业需要投入的成本费用的总和为PC1,采取“不治理”决策时需要支付的费用为PC2,显然12PCPC,当1mm时表示社区企业给政府管理部门缴纳的费用为PC1,2mm表示社区企业缴纳的费用为PC2,通常情况下α1型社区企业缴纳PC1,α2型社区企业缴纳PC2,假设完全理性条件下,α1型企业不可能缴纳的费用为PC2,当α2型企业缴纳费用为PC1时,企业为作假缴纳费用,必须受到与之相对应的处罚。Step4:P发出的博弈信号被G接收到后,根据贝叶斯法则对i进行修正,得到P类型的后验概率''''''''iim,并根据博弈信号值来推测出P的类型空间,选择行动β,这里假设G的行动空间12,,当1时表示政府管理部门G采取了“监管”决策,当2时表示为G采取了“不监管”决策。根据以上的博弈模型假设,我们可以构建出政府管理部门和社区企业对整个生态社区的环境治理决策博弈模型,这个博弈模型属于不完全信息下的博弈,采用海萨尼转换将该博弈模型转换为完全不完美信息博弈。博弈模型表述为:将社区中的除企业外的其他居民假设为虚拟的参与自然人N,且N按先验概率确定信号发出方P的类型α1,G根据发出的信号mi运用贝叶斯法则计算α的后验''''i,并采取对自身利益最大化的行动β,其中i=1,2。P的信号选择策略是类型空间α映射到信号空间上m的概率函数,G的行动空间β是m映射到对象集合上的概率函数,由此可得管理部门和企业的期望收益如式(1)和式(2),式中(,,)PiiiZmZ为支付矩阵取值,(,)GiiZm和(,)PiiZm分别为政府管理部门G和社区企业P的决策。图1为信息不对称下政府管理部门与社区企业信号博弈的博弈树,图弈主体收益为博弈树“末梢”处括号内的值,其中第1个值为社区企业收益1Zm,第2个值为管理部门收益2Zm,1is和2is为G的决策集合,GC为政府管理部门监督的成本,1i和2i为社区环境质量差给政府管理部门带来的负面影响,满足12ii,r为政府管理部门对采取“治理”决策的社区企业所给予的补贴或奖励,0为政府管理部门未监督,且企业采取未治理决策时后受到未评为生态社区的处罚,1和2分别为社区企业未采取治理决策以及谎报支出费用的罚金。
2精炼贝叶斯均衡分析
按照类型空间与信号空间22的组合,理论上该模型的精炼贝叶斯均衡解有4个,现分混合均衡与分离均衡两种进行讨论[11]。
3博弈结果分析
通过对精炼贝叶斯均衡的求解可知,混合均衡12m,m在一定区间内存在,分离均衡12m,m一定存在,混合均衡在以下情况将被打破:当G“监督”成本减少,社区企业采取“治理”所获得的政府补贴或奖励减少,企业未采取治理决策和谎报支出费用所被处罚的金额以及政府管理部门由于“未监督”受到上级部门的处罚增加时,混合均衡区域将减少,直至政府管理部门G采取“监督”决策。
4结论
目前我国生态社区环境与社区企业、居民的利益存在矛盾,但从本质上来看是一致的。从博弈模型可以看出,当支付函数的参数取值满足一定条件时,政府管理部门与社区企业信号博弈模型存在2个精炼贝叶斯均衡,通过对博弈模型参数的调整使得模型结果向目标状态(治理,不监督)转化。通过对模型的求解与分析,可以得到在生态社区建设中,影响政府管理部门与企业治污决策的主要因素包括:社区企业对环境治理的成本,社区企业采取“治理”决策时受到政府管理部门的补贴或奖励以及社会声誉的提升,而当采取“不治理”决策时,受到的处罚与社会声誉的降低;政府管理部门检查的成本,未检查受到上级主管部门的处罚等。因此要想确保生态社区博弈模型实现最优解,政府管理部门不仅要制定相应的政策措施和激励机制,还要加强监管和实施力度。
博弈理论论文5
关键词:博弈论;田忌赛马;一般扩展式
一、什么是“博弈”
博弈论的思想最早可以追溯到18世纪,但真正作为一种理论研究则始于20世纪20年代,公认的开山之作是1944年出版的由科学家冯诺依曼和经济学家奥斯卡摩根斯坦恩合著的《博弈论与经济行为的理论》一书。此时,“博弈论”才作为一个完整的新名词被提了出来。此后,国内外对博弈论有了广泛的研究,博弈论取得了长足的发展。国内方面,关于博弈论的文章、专著不胜枚举,各位学者对“博弈”一词的认识或定义也存在偏差。
按照《现代汉语词典》的解释,“博”是丰富多彩的意思,而“弈”则指下棋、打牌等对抗性游戏,因而“博弈”就是指丰富多彩的对抗性游戏。①在英文中,“博弈”一词是“game”的复数,表示各种各样的游戏。因此,汉语中的“博弈”与英语中的“game”意思完全一致。“博弈”与“游戏”有这密不可分的联系。
学者王俊冰对“博弈”一词有着不同的理解。他指出:博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。②概括来讲,博弈是一种技艺。学者郭磊认为:博弈的基本意思是弈棋,博弈本身是一种游戏,但博弈更强调谋略……博弈则可能是一系列策略与行动的组合体,并且是一个由始而终并产生结果的完整过程。③可以理解为博弈是一个过程。还有学者认为:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。④
二、“田忌赛马”概述
忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。”⑤这是我国“田忌赛马”故事的原型。这个故事可谓是众所周知了,该故事发生在战国时期,齐威王和大将田忌赛马,根据马跑的速度双方各有上、中、下三种等级马各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快。比赛规则为三局两胜制,每局比赛各出一匹马,负者向胜者支付黄金⑥一千,显然相比之下齐王的马占优势。在第一次比赛中,田忌以上等马对齐王的上等马,以中等马对齐王的中等马,以下等马对齐王的下等马,结果连负三局。在第二次比赛中,田忌采纳孙膑的建议,以下马对齐王的上马,以中马对齐王的下马,以上马对齐王的中马,结果胜两局负一局,赢齐王一千金,而自以为胜券在握的齐王反而输掉一千金。
首先要从语言上分析一下这个典故。“孙子见其马足不甚相远”这一句是前提,否则这个故事就不会发生。我们可以这样理解这句话,即“齐威王和田忌的马根据速度划分各有上、中、下三种等级各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快”。假如齐威王的马按速度由快到慢分为A1、A2、A3,田忌的马由快到慢分为B1、B2、B3,那么这六匹马由快到慢依次是A1、B1、A2、B2、A3、B3。另外,还有一处是学者研究中普遍遗漏的,即“及临质”三个字,这一句起到了至关重要的作用。这句话在这个故事中应该翻译为“等到将要开始比赛的时候”,那么这句话告诉我们一个什么讯息呢?我认为是说孙膑献计田忌改变马的出场顺序这一情况并不为齐威王所知,这也成就了田忌在第二轮赛马中能够胜出的重要因素。“威王问兵法,遂以为师。”这一句也是关键所在,通过这一句话得知,齐威王并不知道自己是怎么输的,所以请教孙膑。假设如果齐威王知道其中玄机的话,那么田忌将必输无疑。以上三点是“田忌赛马”故事得以出现的基本前提。
而我国关于“田忌赛马”博弈论研究的相关论著可谓不少,但鲜有人认真透彻地分析这个故事的原型,殊不知这关系到“田忌赛马”是不是博弈、是怎样的博弈等问题。在以往的文献中,王俊冰在《白话博弈论》一文中指出“田忌赛马”是一个非合作博弈;詹国枢在《博弈处处有,几人能识之》中指出“田忌赛马”是博弈论的实际运用,是典型的博弈案例;周瀚光认为“田忌赛马”是一个“二人有限零和博弈”,⑦但他并没有首先从语言学的角度分析这个故事的前提;此外学者袁国强、和蔚、逯彦彦、郭鹏等等均指出“田忌赛马”是一个博弈,但没有深入分析它到底属于什么类型的博弈,是怎样博弈的等问题。
三“田忌赛马”的博弈论分析
前文分析了该故事的三个前提,一、田忌的每等级的马均次于齐威王同等级的马,但强于齐威王下个等级的马;二、齐威王事先不知道田忌临阵改变了马的出场顺序;三、齐威王不知道改变马出场顺序其中的玄机。本文以下的分析均基于此三前提。
首先要从博弈论定义上理解“田忌赛马”。很明显,“田忌赛马”确实符合“博弈”的定义,但现在言“田忌赛马”就是博弈还为时尚早。
其次需要分析“田忌赛马”是否具备博弈理论的基本要素。国内学术界对博弈论基本构成要素有分歧,基本分为两派。一派认为博弈论要素有四方面,即博弈的参加者、策略、进行博弈的次序、博弈的信息。但是主张博弈理论四要素这一派内部也有分歧,学者胡静认为博弈理论的第四个构成要素是“博弈方的得益”,⑧而不是博弈的信息;另一派认为博弈理论具有五方面的要素,即博弈的参加者、策略、进行博弈的次序、博弈的信息、博弈方的得益。可以清晰地看出后者对博弈理论的要素有了一个完整的归纳。那么“田忌赛马”是否具备五个要素呢?齐威王和田忌是博弈的参加者;策略选择按照排列组合来计算共有六种(这里不详细叙述);博弈的次序是双方非同时决策,齐威王是先手;博弈的信息是不完全的,齐威王不知道田忌策略的变化;得益是每胜一局有一千金的奖励。通过分析这些要素,我们得出一个结论,即“田忌赛马”是一个完整的博弈。
最后要弄清楚“田忌赛马”到底属于什么类型的博弈。首先要了解一下博弈论的分类情况。(1)合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。(2)零和博弈、常和博弈与变和博弈。这是按得益情况划分的,一方得益必来自一方损失,这种博弈是零和博弈。常和博弈又叫非零和博弈,指博弈各方得益之和不为零。变和博弈中各方得益之和不确定,这是最一般的博弈,常和博弈和零和博弈是它的特例。(3)静态博弈与动态博弈。根据博弈的次序,即参加者策略选择并行动的先后次序博弈可以分为静态博弈和动态博弈。静态博弈指参加者可同时决策并行动的博弈,并不考虑决策的次序问题。动态博弈指参加者先后、依次决策并且后行动者能够观察到先动者所选择的策略和行动。⑨(4)完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。⑩博弈理论按照不同的标准基本可分为以上四种情况。
“田忌赛马”这个典故是非合作博弈,也是零和博弈,这在上文中已经提到。同时,依据上文的三个前提,它同时也是一种不完全信息状态下的动态博弈。
四“田忌赛马”博弈的一般扩展式及其序列均衡
上文我们提到“田忌赛马”博弈是非完全信息动态博弈,而这种博弈则是博弈论中最为复杂的模型,也称动态贝叶斯博弈。序列均衡是非完全信息动态博弈的核心概念。
一个动态贝叶斯博弈的扩展式为=﹛N,H,P,I,p,u﹜,其中N为参与者集合,N=﹛0,1,2,…,n﹜,0代表自然。B11H为全历史集合,即从博弈开始到博弈结束所有可能的行动序列﹛a0,a1,…,am﹜,m为任一自然数,表示一个全历史包含的行动次数。P为参与者函数即对于每一个子历史h,P(h)将其映射成自然或是其他参与者。I为信息空间。p为自然的概率分布函数,其表示当自然行动时,自然以多大概率选择某个行动。u表示参与者的偏好,其定义是在全历史结果上的收益函数。B12
在“田忌赛马”博弈中,参与者集合N=﹛0,1,2﹜,0代表自然。H是全历史集合,表示所有可能的行动序列﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,即共有六个可能的行动。在此博弈中,由于是齐威王先行动,所以无论马出场顺序如何,作为自然的孙膑总是可以帮助田忌,以下等马对上等马,以中等马对下等马,以上等马对中等马(顺序无先后),这样如果把三场全胜看做“1”的话,那么田忌总有“2/3”的收益。也就是说田忌有100%的可能获得2/3的收益。齐威王由于过分自信或者智商不高,未能识破此中玄机,所以败下阵来。但在现实生活中,一方的决策是严格保密的,作为自然的“孙膑”并不可能事先知道“齐威王”的决策,而齐威王有六种行动序列,相对应,“田忌”也有六种,我们说过,只有一种情况可以助“田忌”胜出,所以“田忌”获胜的概率仅为1/6。P为参与者函数即对于每一个子历史h,P(h)将其映射成自然或是其他参与者。在此博弈中,假设一个子历史“上中下”,那么P(h)作为一个映射将有六种;一共有六个子历史,所以P(h)应该有36种。I是信息空间。假设I1 是齐威王的信息空间,I1=﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,I2同I1,因为他同样不知道对方的策略。
在“田忌赛马”这个非完全信息动态博弈中,还有一个很重要的因素需要我们注意,即参与者可能临时改变策略,这也更带来了决策的复杂性和不稳定性。因为一场赛马是由三局比赛构成的(非同时进行),假设第一局结束后,参与者肯定要根据这一局得结果变换策略,同时也能观察到一部分对方的策略,这么说来,双方获胜的概率就不是齐威王5/6,而田忌1/6的概率了,需要更复杂的计算。
客观而言,直到今天理论界也没有找到能适用所有非完全信息动态博弈的均衡概念,也缺乏一个普遍的方法来求解动态博弈的序列均衡。B13
结论
“田忌赛马”博弈不是人们想象中的那么简单的一个博弈,反而是博弈类型中最复杂的非完全信息动态博弈,应该对这个博弈有一个全新的认识。并且,在这个博弈中,至少包含着两个子博弈,这更加剧了此博弈的复杂性。博弈论思想虽然在实际生活中适用性差,但它教会我们一种思考问题的方法,对合理规避风险,获取最大收益还是有指导意义的。(作者单位:四川大学)
注解
①姚国庆:《博弈论》,北京:高等教育出版社,2007年,第1页。
②王俊冰:“白话博弈论”,《理论学习》,2006年第6期,第63页。
③郭磊:“博弈论简论”,《山东经济》,1999年第6期,第17页。
④胡静:“博弈论在数学中的应用”,《商情》,2006年第4期,第213页。
⑤《孙子吴起列传第五》,《史记》卷六十五,中华书局,2007年4月。
⑥“黄金”在古代是一种货币,不同于现代意义上的黄金;“黄金一千”只一千两黄金的意思。
⑦周翰光:“论孙膑的对策论和辩证法”,《齐鲁学刊》,1984年第3期,第36页。
⑧胡静:“博弈论在数学中的应用”,《商情》,2008年第5期,第213页。
⑨逯彦彦:“博弈论前瞻探讨”,《商丘职业技术学院学报》,2009年第1期,第33页。
⑩胡静:“博弈论在数学中的应用”,《商情》,2008年第5期,第213页。
11“自然”指在动态贝叶斯博弈中参与博弈,无收益,但可以决定不同历史发生概率的参与者。