演化博弈论简介

观点 · 2006-11-27 00:00

作者:

返回

shmilykevin 说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,...

shmilykevin

说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,请大家批评。

丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。突变同样是上帝的选择,微观个体无能为力。

接下来,我们就可以回顾演化经济学的思想史了。我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。这带有明显的动态的特征,并影响了随后的尼尔森和温特。

安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。(阿尔奇安也许是个例外)

Hansenak47:

回复:(shmilykevin)[转帖]演化博弈论简介

丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)...

丁丁是何方牛人?这么深刻的东西都被他看出来了,了不起啊!

shmilykevin:

从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。从此,演化经济学可以算真正诞生了。

尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进行实证检验。大家认为他们的模型在产业组织(IO)的应用比较成功,我就以这方面的模型为例子。

尼尔森-温特给出了个体在演化过程中的几个重要特征,我把他们列在下面

1、个体永远不会完美信息(局部知识或吉尔兹的地方性知识,而不是全局性知识)

2、个体行为受制度(正式和非正式),规范,习俗,意识系统等条件约束

3、个体(或者企业)可以模仿对手

4、开发和模仿(也就是R&D)既有“积聚效应”(可以参考Becker关于“上瘾”以及孩子教育的论文)和路径依赖的效果,又与原创性科学研究相关。

5、个体竞争的结果往往是非均衡的-即败者出局(被淘汰)

6、个体的特征是非决定性的――这里他们是在反驳“决定论”的批评。同时,演进的结果通常是不可逆的。

7、主流经济学喜欢讨论“潜在的”均衡(也就是往往达不到的,但理论上可能的均衡),而对非均衡状态的分析要远比那些均衡来的重要。

我们重点讲其中的“创新”部分。熊彼特的创新,到了尼尔森和温特那里,运用到对firm的研究,被偷换成了R&D(更具体一些,是innovation/imitation)。创新当然不完全等同于R&D,但这样做是必要的。我们可以参考Becker的研究方法,我们脚站在工具里,把能够工具化的变量尽量工具化,也许我们只抓住了变量的很次要一部分,我们只迈出了一小步,但对这一小步我们有足够的自信心。回到R&D,我下面主要依据他们1982年那本著名的教科书《Evolutionary Theory of Economic Change》。

我们根据以下知识列出计算方程

1 资本生产率是由企业的专门化知识决定的

2 R&D的产物是innovation和imitation。

3 R&D密度(就是R&D占总资金比例,例如微软好像是5%)由一固定规则决定。

4 原创能否实现是一个柏松过程。再加上一些常识,就能写出联立方程组,用计算机来算。

5 创新是不连续的,有跳跃,有“高原现象”。

接着我们就可以批评他们的工作了。先是一个小问题,就是如何区分原创和模仿,两者之间的关系是怎样的(互补或互替或其他),他们也做了回应。接着是一个大问题,就是他们把R&D看作在一个搜索空间(search space)里的搜索过程。

让我先打个岔,说说经典博弈论里的共同知识(common knowledge)的事情。耶路撒冷学派的领袖奥曼(Aumann)说,博弈论的基础是一团乱麻。要理出一根阿里阿德涅线,我们要找到一个线头,这就是共同知识。共同知识就是,我知道你的策略,你知道我的策略,我知道你知道我的策略,你知道我知道你的策略...宾莫尔(Binmore)等人试图用一个自明之理来取代这个共同知识。有些事情,只要发生了,人人都应该知道(例如911事件,现在的美伊战争等)。但他们在公理化这个自明之理时,又遇到致命的阻碍。这就是所谓的第五公理和第六公理。第五公理说,我知我所知。这还算了,第六公理说,我知我所不知,这立刻遇到了哲学问题。亚里斯多德的“愈学愈无知”的故事正好拿来反驳。一个人如何能知道自己的策略空间,更如何能知道自己策略空间以外的空间?从语言学或者认识论的角度来看,这个公理更显得荒谬了。

博弈论大师在共同知识这个问题前的狼狈是可想而知的。我这里只是想类比一下,R&D真的能表示成在给定的搜索空间里搜索吗?从实践的角度,我们只能处理一维和二维的情况,丁丁说的“一切人在一切方向上的创新”,这就超出我们能够处理的范围了。我们能够在一个时点讨论多个维度(一般均衡),我们也能在时间连续情形下讨论一个维度(演化稳定-这就是尼尔森和温特他们的工作),但我们无法讨论时间连续下多个维度的情况,这超出了理性的范围,但这正是创新的特点。

参阅:http://bbs.efnchina.com/dispbbs.asp?boardID=92512&ID=98771


好文章,需要你的鼓励