【赵汀阳】合作的条件

　　提要：作者试图分析两个问题:如果要研究由非合作博弈发展出合作的可能性,什么样的理论实验博弈的设计才是合理和普遍有效的;什么是最可能形成合作的条件。其中以罗尔斯、艾克斯罗德和哈贝马斯的设想作为具体分析案例,分别指出这些方案在游戏设计上存在着不合理的游戏条件,从而导致对合作的错误理解。最后,作者改造了中国关于和谐的传统概念,提出一种比帕累托改进更有利于形成合作的“孔子改进”。

　　一、初始状态作为政治起点

　　在解决冲突的研究中，政治学家往往不太喜欢哲学家对道德意义的夸大，因为道德行为必须同时是具有博弈优势的生存行为，才是可行的，否则是可疑的。正如宾默尔指出的：哲学家喜欢研究对生活问题的道德解决，并把道德想象成康德式的理性先验绝对命令，貌似人们必须这么做，但事实是，道德游戏终究必须同时是生存游戏，否则根本行不通[1]。这意味着，如果道德原则在生存博弈中是无效率的，那就是坏的原则。以现实主义的冷静态度去解释道德的思路并不新。荀子早就对“礼起于何也”的问题给出了在今天看来属于政治学和经济学的解释：礼这种伦理-政治制度安排是为了克服无节制的“争”所引起的乱和穷[2]。这与后来以“一切人对一切人的战争”而闻名的霍布斯“丛林”思路在很大程度上异曲同工，而且互补。荀子和霍布斯的分析都是从一种假设的初始状态去分析合作的条件以及合作规则的生成。初始状态问题后来由于罗尔斯在《正义论》中的杰出工作而成为当代政治哲学和伦理学的一个热点问题。

　　初始状态是一个尚未存在共同承认的游戏规则情况下的特殊游戏，人们在自由选择中逐步形成游戏规则，可以说，初始游戏是在无限制的策略选择中进行的，没有什么是非法的或道德上不允许的。既然每个博弈方都享有最大化的自由选择，就必定暴露出“前道德的”真面目，在充分自由的条件下去做他最想做的事情，包括杀人放火，而任何一个人的唯一限制就是他人的选择。任何人的选择都不得不受到他人选择的制约，这是分析人与他人关系最彻底的理论环境，所有的规则和制度都将在人与他人的互相互动制约关系中产生。由于规则和制度的有效性在于稳定性，至少是比较稳定的，因此需要关心的是，什么样的人际关系能够生成或导致稳定的规则和制度。

　　初始状态虽是理论虚构，但对于说明真实生活仍然必须是真实有效的，不能是文学故事。这里的“有效性”至少包括两个要求：（1）虚构的初始游戏原理与真实的生活游戏之间必须是可通达的或可过渡的，大致能够反映真实生活的思维方式和策略选择模式；（2）作为思想实验的初始游戏所发现的普遍原理往往表达了比真实情况更正确的博弈选择，这是因为，真实博弈有许多偶然因素或“噪音”，也就可能使人们做出感情冲动或一时糊涂的错误选择，就是说实验博弈可以最大程度地接近理性最优。不过，纯粹理论追求的“比真实更正确”理想其实多少有些荒谬：理论或许更正确（理性上正确），但人们在生活中所真正追求的未必是那些所谓最正确的事情，因为没有充分理由能够证明“正确的”就是“更好的”，错误的行为或许创造了丰富多彩的历史和也许更值得一过的生活，许多人宁愿要“错误的”生活（比如为爱情或民族牺牲生命）。这就像真实世界中不存在严格的直线，人们却未必就认为严格的直线比不太直的线更好。但无论如何，理论上的直线对真实而不太直的直线仍然具有说明力。作为理论实验的游戏就是试图发现比真实更正确的选择以便建立对生活的普遍理解，这也是理想和乌托邦的意义所在。

　　人们设想了多种初始状态。霍布斯的“自然状态”可能是最知名的初始状态。比霍布斯更古老的荀子初始状态有着精神相通而甚至更深刻的设想，这是我们在后面要重点分析的问题。这里先排除一些真实度不高的知名想象，例如《礼记/礼运》相信早期社会是充分合作的“大同”社会，后来才变成私心压倒公心的“小康”社会，这是一种退化论。马克思主义的想象则与《礼记》有某些相似，也相信在导致私心和冲突之前有过原始共产主义。卢梭相信自然状态中人们虽有着自然的不平等（体力和智力），但不足以导致霍布斯想象的普遍残酷冲突，因为那时还没有什么值得争夺乃至拼命的东西，直到后来出现“万恶的私产”才有了可抢可盗的物品。但卢梭肯定想错了，食物优先权和交配权即使在动物界也是你死我活的问题。这些设想都非常有趣，但恐怕都不很真实，历史上真实的初始状态更可能是群体之间的残酷冲突以及群体内部的合作与竞争并存。可是，为什么不选择真实的初始状态作为理论分析对象？秘密在于，真实状态不够极端，没有触及社会可能变化的最差极限状态，因此反而漏掉了一些可能性而不具充分普遍的说明力。人类真实历史的运气不算太差，还没有遭遇最可怕的情况（比如核大战），但最恐怖的情况是有可能发生的，所以理论必须要把任何可能性算计在内。

　　无论是设想一开始就是冲突（霍布斯），还是先有合作后来变成冲突（荀子），都同样把需要解决的核心问题落实在“冲突”上，因此，根本问题就是：在冲突条件下如何能够产生稳定的合作？或者说，给定人人自私，合作是如何可能的？并且，什么才是众望所归的合作原则？初始游戏不需要真实的历史起点，但必须是有效的理论起点。这个有效的理论起点必须足够差，在效果上接近最差可能世界，因此只能是“人人都只为自己着想”的利益冲突状态，只有这样才能够清楚地表达出需要解决的全部社会问题。假如“人人为别人着想”，人们所烦恼的绝大多数问题就不复存在了，也就不需要反思了。因此，任何一个实验性的初始状态所要分析的都是在私心主导的环境中如何形成合作的问题。荀子-霍布斯方案最为简洁：不仅人人自私，而且不择手段。“不择手段”是个真正严重的挑战，当代理论家们往往回避这一经典困难，而选择了比较温和的罗尔斯方案。这种避重就轻、掩盖问题的做法或许有抚慰心灵（尤其是知识分子的软弱心灵）的功能，但在事实上和理论上都是错误的。

　　二、罗尔斯方案的疑问

　　任何社会契约都有着特定的社会条件和时代背景，不存在普遍通用的社会契约，在特殊背景下形成的社会契约未必是公正的，事实上往往不公正。罗尔斯引入“无知之幕”这样一种人为设计的博弈条件，就是试图制造一个完全平等的处境，以便考察人们仅凭理性能够做出的真正公平的选择。在罗尔斯的初始状态中的博弈各方都是自私的，完全无视别人利益，又都是充分理性的，尤其还处于“无知之幕”这个“完全公平的”博弈环境中，人人对自身状况一无所知，不知道自己与他人在各方面的差异，甚至不知道自己所处的社会和时代[3]，相当于既不知己又不知彼，甚至不知“魏晋”。正是因为无知之幕屏蔽了一切信息，罗尔斯相信，此种人为制造的完全公平处境就能够必然地形成人们一致同意的选择。全体一致同意（unanimous）的事情显然是最合法的公共选择，也是完美的民主结果，尽管未必是最优的公共选择（一致同意的蠢事也可能发生），这一点在此不论。这里要讨论的是，罗尔斯的著名设计虽然水平很高，却有许多疑点。

　　首先，在博弈条件的设计上，博弈方被假定为只有思维（mind）而没有心(heart)，这种理解在单纯经济学中或许合适，但对于解释社会、政治和生活则是严重缺陷。社会中许多根本性的冲突是心的冲突（信仰、精神、情感和价值观的冲突）而远不仅是利益冲突，而且没有理由证明物质利益比精神价值更重要。罗尔斯在规定“人人都需要的”基本物品时就忽视了宗教信仰或精神需要，这对于人和生活实况都是歪曲，因为生活根本不是那样的活法。仅从理性和物质利益去理解的社会太过单调，以至于无法由此辨认出是一个实际上可能的人的社会。单这并非罗尔斯的个人错误，而是现代学术的流行错误。

　　“无知之幕”确实独具匠心，但无知状态的博弈与有知状态的博弈之间有着无法过渡或无法兑换的鸿沟，因为它们已经是本质不同的世界，是两种世界而不是一个世界的两种情况，由此无法互相兑换或转换，这一点也明显地限制了无知之幕模型对真实世界的说明力。任何真实的社会博弈都是某种程度的有知状态，而且人们拼命追求有知状态，因此任何社会都以有知状态为目标，人们必须知道自己有什么需要保护、有什么值得争夺、以及是否有条件去争取自己想要的东西，总之不能盲目地选择，盲目选择的游戏也许可以进行，但是无意义。进一步说，人们也不可能不知道一个游戏是什么样的就盲目同意参加游戏，那样未免太冒险了，除非是被强迫参加游戏。当然，罗尔斯需要一个充分公平的博弈环境，这个心情可以理解。自然差异无法改变，弱者对于强者无力以抗，于是罗尔斯想用“无知之幕”来让自然差异暂时失效，这样人们在绝对黑暗中就只好选择一个公平的社会契约，以免自己万一吃大亏。这是个让人佩服的想象，只可惜存在着一些难以克服的严重困难。

　　其中有一个难以自圆其说的规定。“无知之幕”规定人们甚至不知道“关于好东西的理解”（conception of the good）以及自己的“生活计划”（plan of life），这样的话，人就不知道他想要的是什么了，可是人必须知道想要的是什么才会做出选择，否则又能够选什么呢？这是个悖论，不仅在行动不可能，在思想上也是不可能的，其错误相当于说有个“我思”（cogito）却没有“所思”(cogitatum)，或者相当于及物动词没有宾语，仅仅“我要……”是说不通的。胡塞尔早就指出，如果没有明确的所思，我思就是无意义的。罗尔斯知道这个麻烦，为了自圆其说，他假定，虽然人们不知道他们的特殊偏好，但仍然知道那些“对任何人生计划”都必需的“基本必需品”（primary goods）。这个辩护暗含着更大的麻烦，它涉及一个从来也没有得到解决的“价值排序”问题：在哪些东西算是“基本必需品”的问题上，人们并没有一致意见，而所以没有统一意见，是因为人心各异。把人看成“有思无心”显然是在回避困难，而如果把所有博弈者看作是同心同好的特殊人群（比如说一群葛兰台或者一群弗洛伊德），那倒是说得通了，可那样的话，罗尔斯理论就缩水为特殊有效理论而不是普遍有效理论了（罗尔斯不会满意的）。

　　就罗尔斯强调的“基本必需品”来看（个人权利、个人自由、机会和财富），他想象的合格人群大概是个自由主义群体，等于事先强迫所有人都成为自由主义者，这既不公平也不合乎事实。人是多种多样的，事实上很多人会首选“权力”（尼采会同意），很多人会首选“家庭利益”（孔子会同意），如此等等。也许罗尔斯不得不把“基本必需品”假定为不证自明的，以避免与无知约定产生互相矛盾，但他想象的自由主义偏好显然并非不证自明，比如权利的好处恐怕就没有权力的好处那样明显，权利、自由和机会甚至加上财富也不见得能够换来权力，而权力却能够换来一切，这才是更加显而易见的。从逻辑上看，每个人最想要的恐怕是安全与权力（霍布斯会同意）。即使权且局限于罗尔斯罗列的那些“基本必需品”，人们也必定有不同理解，哪些权利是基本的？哪些权利更应该优先？各种权利之间的冲突如何解决？这些都是未决的问题。在这样情况下，罗尔斯隐去了对价值的理解（conception of the good）而又承认关于“基本必需品”（primary goods）的知识，此间自相矛盾恐怕难以避免，因为后者依赖着前者。对尚未确定的知识的非法透支是一种很隐蔽但不可接受的学术赤字。

　　罗尔斯的初始状态背叛了霍布斯开启的初始状态思路并且回避了霍布斯问题。事实上，荀子-霍布斯问题才是必须克服的真困难，而且各种可能的困难都包含其中。罗尔斯问题在规模上要小得多，基本上局限于如何理性地形成社会契约。实际上，即使有了社会契约，合作的难题也并没有因此被解决，契约并不能限制人们以合法手段互相坑害并且在必要时撕毁契约。社会始终存在着这样一个悖论性的局面：在大多数情况下，尤其从长远考虑，合作对于博弈各方（无论强弱）明明都有利可图，但合作却总是非常困难，人们总是难以超越个人的眼前利益。正如奥尔森指出的，即使人们非常愿意合作，大规模的集体合作仍然可能毁于搭便车之类的自私选择。罗尔斯的“无知之幕”简化和削弱了博弈问题的难度，它使得人们在同等的无知黑暗中人人自危，只好“必然地”选择了罗尔斯预先准备好了的合作方式。这个事先安排好的圈套不能代表人们真正自愿的选择。“无知之幕”下的选择是对初始博弈这个严重问题的一个有些轻浮的解决。

　　即使局限于罗尔斯给定的游戏条件就事论事，“无知之幕”也并非必然地产生罗尔斯式契约，特别是其中最有名的“有别原则”。“有别原则”声称，如果社会不得不出现某些不平等的制度安排，那么这些不平等的制度安排必须有利于最弱势群体的利益最大化。很多人赞赏这一劫富济贫倾向的制度安排（包括我在内），但也有许多人坚决反对，例如诺齐克等。情感倾向归情感倾向，理性归理性，尽管这个原则是个广得人心的道德要求，却不见得是一个必然的博弈结果，就是说，罗尔斯契约并不是罗尔斯条件的唯一必然结果，而只是多种并列的可能结果之一，甚至不是最可能的结果。换句话说，罗尔斯契约并非罗尔斯问题的唯一解，而只是多个可能解之一。如果罗尔斯契约只是或然结果的话，罗尔斯方案的意义又将有进一步的损失，即罗尔斯契约不但并非普遍有效，而且并非人们的必然选择。我们不能因为同情罗尔斯的道德选择而断定其有效性，理论不能感情用事。

　　罗尔斯以“无知之幕”得出其公正原则的过程中存在着博弈论上的技术疑点。他应用博弈论的“极大极小定理”(maximin principle)去分析“无知之幕”条件下的理性解。给定人人自私而无视他人利益，人们将理性地避免对自己最不利的情况而选择风险最小的结果。无知之幕让人们人人自危，不知道揭开无知之幕之后自己的资本、能力和地位，因此人们宁愿选择一种最保险的社会契约，以免自己处于不利地位时明显吃亏。博弈论和经济学都假定，人人都不愿意自己吃亏而让别人占便宜。这个假定虽然不是普遍必然的，但似乎对大多数人在大多数时候有效。罗尔斯相信，正是出于风险规避的考虑，人们将必然选择一个保证每个人同等自由权利、机会均等而又保证照顾弱者的制度安排。可问题是，罗尔斯方案未必是唯一的理性解，而只是多个可能解中的一个，而且未必是最可能的解。分析如下：

　　（1）罗尔斯以自由主义偏好去猜想人人必然优先考虑个人自由，这已经比较可疑。事实上人类是在经过无数残酷经历之后才认识到个人自由的好处，不可能先验地拥有“个人自由比别的事情更重要”这一经过长期实践才产生的后验知识，何况这个后验知识也不是普遍必然的知识。在某些社会语境和自然条件下，个人自由就未必优于集体利益，比如在资源非常匮乏或严重危机或自然灾害之类情况下，集体共产就很可能是大家得以勉强存活的条件。哲学家经常忘记，价值不是个常数，而只是个函数值——价值，顾名思义，本来就是一个函数“值”。按照“无知之幕”的规定，人们并不知道社会、时代和资源的情况，因此，在“自由”、“平等”、“平均”、“共产”等等可选项目之间，既然缺乏函数语境，也就没有必然根据和理由去算计和证明哪一种能够避免最坏结果。当缺乏清楚的语境和计算条件，一切都是未知数。假如非做出选择不可，在“无知之幕”的压力下，人们恐怕更容易接受保险系数最大的集体主义契约，因为“有难同当，有福共享”的集体主义契约比自由主义更符合理性的风险规避原则。罗尔斯似乎算错了自己出的题。“有别原则”虽有平等主义倾向，但并不彻底和充分，罗尔斯的自由主义原则的优先性对平等主义形成了制约，使之不可能是真正的平等主义，只是比较保险而决非最保险的策略。相比之下，令人讨厌的利益均分平均主义就比罗尔斯的选择更符合理性要求了。

　　平均主义策略可以这样分析：由于无知之幕，每人落在任何一种地位上的概率是同样的，相当于抓阄，根据博弈理性，利益均分是每个人风险最低的策略，它保证每个人获得至少不少于任何人的收益。在自己没有权利去挑选较大利益的情况下，利益均分就是优选策略，由此看来，平均利益才是逻辑上无懈可击的均衡解。可以参考“公平分蛋糕”的经典例子（尽管情况并不完全一样）：a切蛋糕而b先挑。a没有权利先挑选（相当于不知道自己将要得到什么），他的最好策略就是把蛋糕尽量切成一样大[4]。同理，在无知之幕条件下，平均利益才真正是极大极小值，同时它又是极小极大值，是真正的鞍点。在这种情况下，平均利益显然好过罗尔斯“扶贫”式的有限平等。石元康先生有过更有趣的论证[5]，他说，平均主义有个额外的优势：人们“不会忌妒”，因此是个更稳定的策略。当然，在真实社会里，平均主义通常并不公正，甚至是反公正的，除非遇到特殊情况，否则人们不会喜欢平均主义，可是罗尔斯的无知之幕很不幸地正相当于那种有利于平均主义的特殊情况。也许还应该注意到，罗尔斯的有别原则也同样不公正，正如诺齐克所批评的，没有正当理由的利益再分配其实是掠夺。

　　更有趣的是，即使强行规定只能选用罗尔斯原则，不许选别的，还是拯救不了罗尔斯方案，因为相对平等终将慢慢地演变成平均主义。其演变过程是：根据“有别原则”，如果社会需要某些相对不平等的制度安排，这些不平等的制度安排应该使在社会和经济方面处于最不利的人们的利益得到改善[6]，那么，假设“处境最不利的人们的收益”为X，而X有理由获得改善而变成X+n，可是X+n的改善仍然不够大，还是属于“最不利人们的收益”，就又有理由进一步改善为(X+n)+1，以同样理由就可以不断改善，只要还存在相对的“最不利群体”，就显然有理由不断“损有余而补不足”，这一过程不会自动停车（除非引入保护富人的条款，这又等于增加了额外条件），直到所有人的收益都成为平均数。由平等主义到平均主义的演变显然是罗尔斯不能接受的，因为它会破坏“更优先的”自由原则。可是，除非有额外的理由对这个演变过程进行刹车，否则“有别原则”必定无法止步地演变成平均原则。进一步说，即使可以增加额外理由，也是非常危险的，如果有某个理由可以使“损有余而补不足”在某一点上停车，那么就能够制造任何理由在任何点上停车，那样就将是罗尔斯的失败和诺齐克的凯旋了。罗尔斯试图在自由和平等之间制造调和，这一努力令人赞叹，但可惜自由和平等之间存在着理论上难以克服的矛盾。不过，在真实社会中，自由和平等可以形成某种动态平衡，但与公正原则无关，而是获利人群需要为社会秩序、安全和稳定而“购买”不利人群犯上作乱的动机。

　　（2）如果在平均主义之外还存在着另一个非常可能中选的方案，那么很可能会是一个古典公正策略，也未必输给罗尔斯方案。人们愿意自己的劳动能够得到成比例的收益，这个“多劳多得，少劳少得”的对称意识才是理性先验直观。人们天然乐意承认这种古典的对称性公正（在理论上说，这是唯一严格的公正）。在无知之幕下，假如人们不选择平均主义而选择了古典公正，也同样合乎情理。平分利益虽然最能满足风险规避原则，但支出与收益的对称也同样没有违反风险规避原则，即使某人在无知之幕消失后发现自己能力较小，只能获得较小收益，这样也没吃亏，因为毕竟得到了该得份额，并没有得到小于成本的回报。人们没有理由对此不满意，除非能够证明懒惰、弱智、无赖、偷窃、不劳而获也是美德，此种证明恐怕很难。因此，在无知之幕下，不敢指望暴力、偷窃、耍赖等等风险策略的人们非常可能会选择平分利益的平均制度，但也很可能愿意选择古典公正制度，这两者都是理性选择，中选的可能性恐怕优于或至少不弱于罗尔斯契约。当然，这不意味着它们比罗尔斯方案更好。罗尔斯方案是相当优秀的社会制度，大概相当于平均主义和古典公正的中间道路，但问题是，它在实践方面恐怕是个不可靠也不稳定的策略，而且在理论上不可信。

　　（3）最后，罗尔斯方案还有一个致命漏洞：他没有考虑到如何对付当无知之幕消失之后的后继博弈的破坏性情况。罗尔斯知道无知之幕总要消失，按照想象，在完成立宪和立法任务后就不需要无知之幕了。初始状态下的博弈只是第一轮博弈，而博弈总是连续多回合的。权且假定罗尔斯方案在初始状态里中选（尽管并非如此），当无知之幕消失，博弈条件完全改变了，博弈各方的优选策略也必定随着地位变化和“有知”状态而发生根本变化。当一切真相大白，相当于进入了真实生活，人们各就各位，有了明确的各自利益，肯定有许多人（具有博弈优势能力的人）将重新考虑并调整自己的策略，因为他们在第一轮博弈中选择的罗尔斯方案已不再是优选策略，而变成了专门让自己吃亏的策略。人们的新策略必定导致在第一轮博弈中所建立的“制度”土崩瓦解，或者在具体实践中被偷偷解构。人们很可能不承认在初始状态下所签定的糊涂契约，而将在新的形势下重新讨价还价、重新协商、重新斗争甚至革命，即使人们没有实力改变法律或发动革命，也总会在契约下去钻各种空子和漏洞，使契约实际上无法执行或无法正确兑现，总之是从“合作”回到“背叛”状态，直到某种符合现实形势的新制度在多轮博弈之后达到某种稳定策略均衡而得以建立。既然无知之幕下所签定的社会契约在后继博弈中是坚持不住的，游戏终将重新玩过，罗尔斯契约终成画饼，这就是罗尔斯方案的根本困难。关键在于，无知之幕是靠不住的，所谓“骗得了一时骗不了一世”，人们总会在后续博弈中颠覆原先的盲目之约。

　　三、回到荀子—霍布斯思路

　　罗尔斯方案虽然引人入胜，可惜不是有效出路，转了一圈还是回到了老问题上，我们还是不得不回来面对如何在冲突中形成合作的这一初始问题。“无知之幕”是个多余的假设（当然可以是个智力游戏），它改变了真问题的存在条件，因此对于解决真正的问题并没有很大的帮助。虽然我们需要理论模型，但归根到底要解决的是真实问题。理论不能忘记生活，从生活中来还要能够回到生活中去，理论模型不能背叛真实生活，因此必须能够容纳复杂变量以便能够对付真实问题。许多理论方案，例如罗尔斯方案，却选择了变量最小化的极简主义模型，生活变量的极简化等于篡改了生活，文不对题所以不能解决真实问题。相比之下，荀子-霍布斯的初始状态假设仍然在理论上较优，它能够包括一切可能社会状态中的最坏状态，这是优势所在。显然，在各种可能状态中，只需考虑最坏的，最坏状态已经代表了所有困难。没有把最坏可能性考虑在内的社会分析模型都是无效的。罗尔斯设想的条件实在不够坏，应该说太好了，所以无效。这就是为什么需要回到荀子-霍布斯思路的关键理由。

　　荀子和霍布斯对于从冲突到合作的解决原则很相似：（1）强人们意识到冲突对任何人都不利，包括对强人自己也不利；（2）只有强大政府能够通过权威而造成社会合作。不过问题是，集权虽然能够导致社会合作（历史事实证明这一点），可也非常可能导致与冲突同样有害甚至更加有害的结果（比如个人自由的严重损失），因此人们需要寻找比集权更优的合作条件。艾克斯罗德指出：人们对“在什么条件下才能从没有集权的利己主义者中产生合作”这个问题更感兴趣[7]。在没有集权的条件下如何产生合作，不仅是更有趣的问题，也是学理上更重要的问题，不仅是一个国家内部社会的根本问题，也是国际社会的根本问题。

　　四、艾克斯罗德实验

　　罗尔斯的实验虽老谋深算却无助于解决问题，而艾克斯罗德的实验很天真却令人鼓舞——有趣的是，在艾克斯罗德的实验中，也正好是天真胜过了老谋深算。艾克斯罗德1980年做过一个试图理解合作出现的必要条件的计算机实验[8]。艾克斯罗德的初始状态不需要诸如“无知之幕”之类的不正常条件，当然，它也不够真实，比如，博弈各方被假定为能力相等，而且不可能消灭对手而只能在得分上胜过对手，这些限制条件暗中埋下了严重的困难，这是后话。无论如何，艾克斯罗德实验相对于罗尔斯是比较仿真的，它的条件比较宽松，不要求博弈者必定是理性的，甚至不一定是“利益最大化者”，更不需要无知之幕。这些宽松条件使艾克斯罗德实验具有某种现实感。

　　艾克斯罗德设想了这样的博弈环境：（1）博弈者是多样的，理性或不理性，谨慎或投机，善良或邪恶，一切动机和心态都可能；（2）博弈回合相当多，回合总数多达12万回合，类似“一生”；（3）参赛的博弈策略类型也相当多，类似一个社会；（4）博弈可以不择手段，可以不断变招，比较接近真实的“人性人”游戏，而不是经济学家们喜欢的“理性人”游戏。

　　实验是全体混战的循环赛，参赛的14个代表性策略由“足够精明的”各种专家分别设计（一个没有傻子的社会），博弈策略由“合作”和“背叛”的各种可能组合。如果双方合作则各得3分，双方背叛各得1分，一方背叛而另一方合作则背叛5分而合作0分。背叛的回报相当大，与真实生活的情况类似（人无横财不富）。比赛结果出人意料，一个具有善良、宽容和公正等优良品质的“一报还一报”策略（TFT）优势胜出。TFT的策略设计非常简单：第一步选择合作；从第二步开始就模仿对方上一步的选择。这意味着：首先是善良，从不先背叛；其次是公正，如果对方背叛就进行回击；然后是宽容，一旦对方改正错误，就马上重新合作。那些不成功的策略都太想占便宜，总是主动背叛谋求高分。在比较成功的策略群与比较不成功的策略群之间存在着明显的得分差异，比较成功的前8名策略都是比较善良的，而所有不成功的策略都是故意与人为敌的。艾克斯罗德对这个太过美丽的结果不放心，第二次实验使参赛策略增加到62个。他有意把第一实验的结果事先公开，让第二实验的策略设计者们都知道TFT的优势，相当于事先宣告“好人有好报”，可令人吃惊的是，大多数人还是宁可千方百计地发明更复杂的敌意策略，可见大多数人多么希望多占便宜而不惜伤害他人。第二实验的结果仍然是TFT等善意策略胜出。这个实验被认为或多或少证明了“好心有好报”或“好人笑到最后”。

　　这样的好结果虽是人们一直的梦想，但经验事实往往并非如此。如果理论与实际不符，肯定是理论出了问题，必须调查原因。艾克斯罗德实验所以似乎能够证明“好人笑在最后”，根本原因是其“杀不死”的假定：每个博弈者可能失败（得分低），但不可能被消灭（杀死），永远不会被淘汰出局，因此总有翻本机会。这个设定显然与真实世界不符，不能正确表达人生命运。这是现代学术司空见惯的失误：人们为了让实验能够出成果，总把实验设计成一个容易计算但不真实的可能世界，因此导致误差。理论世界对于真实世界至少应该是一个可通达的可能世界，否则原理不能通用。艾克斯罗德实验与罗尔斯实验都存在这个困难，都改变了某些必要的存在论条件而使实验世界与真实世界不相通。采取了“杀不死”假定，生死游戏弱化成输赢游戏，博弈不再严重，命运不再严肃。杀不死等于可以后悔，永远还有机会卷土重来，这就限制了不择手段竞争的威力，背叛就只能占到小便宜，不能大获全胜于一役，从而造成善良策略具有博弈优势的假象。

　　假如修改“杀不死”假定，重新规定为，当博弈者由于选择合作而遭受n次背叛（n次0分）就算被“杀死”或被淘汰出局，情况就很可能非常不同，也许会更接近真实世界。可以推想：在这个生死博弈中还是会有一些善良合作者最后获得胜利，但也会有一些善良合作者被不幸淘汰，比如TFT，由于具有比较强硬的回击策略，因此可能在博弈中幸存，但未必能够仍然成为冠军。这是个危险的消息，当许多合作者发现可能被淘汰的危险，就可能会选择“不出头”、“搭便车”以自保，甚至蜕变成背叛者去伤害他人。“坏人”多占便宜的信息会使“好人”失去信心而退化，这是个真实的社会难题。在艾克斯罗德实验中，另一个反真实的设计是，博弈者之间不能交流经验，即使可以交流，博弈策略也不能中途改变（计算机博弈程序是事先设计好的），好人即使总是吃亏也只能坚持做好人，因此回避了好人变质的可能性，可问题是，真实生活无法回避这个困难。可以看出，艾克斯罗德的实验结果也不能充分有效地应用到真实世界中。

　　艾克斯罗德的实验成果尽管有些疑问，但他把这个实验的基本精神和原理推广应用于研究社会进化时，却还是获得了一些重要而值得分析的发现：

　　（1）那些专门占别人便宜的博弈者在遇到同样的小人时，就会两败俱伤，大概证明了“恶人自有恶人磨”。而且，如果一个社会坏人太多，坏人就反而占不到便宜，因为坏人遇到坏人而两败俱伤的几率增大。从进化角度看，开始时坏人会迅速繁殖，但坏人增多又使得坏人更多地遇到坏人，这样又导致无利可图，长此以往就迫不得已只好选择合作，这不需要坏人真的洗心革面，但克制自己做好人就几乎相当于好人。合作策略更能发展成稳定策略（由稳定回报来保证），因此好人会越来越多。但合作策略的稳定性并非坚如磐石。好人增多又会导致坏人有较多机会获利，于是坏人又会增殖。社会状况的循环波动是经常性的，事实上的社会总是保持好坏因素混合存在而此起彼伏的状况；

　　（2）如果新来者是单个人的话，一个背叛成风的小人群体就能够阻止其侵入落户，但如果新来者是一个合作性的群体，哪怕是小群体，却一定能够成功侵入并且发展壮大。与此相反，哪怕是规模比较大的小人群体却很难成功侵入合作群体，因为合作群体能够形成集体团结力量而胜过只顾自己各怀私心的小人。这似乎证明了团结就是力量。但值得注意的是，这条规律不能过分演绎，因为，假如按照这个规律来简单推论的话，那么小人迟早是要失败的，而社会历史已经很长了，现在应该几乎没有小人了才对（小人们只好改过自新变成合作者），这显然太不可信，与事实不符，也与前面的发现互相矛盾。据说有数学家证明说，假如存在吸血鬼，哪怕开始只有一个，到今天也不可能有人存在了，因为吸血鬼不断壮大，而人迟早被吃完，所以，事实反证了不可能有吸血鬼。与此类似，假如好人总能胜利，到今天就不可能有小人存在了。因此，只有结合前面的发现来理解社会，才能理解为什么好人和小人都没有能够获得全面胜利；

　　（3）艾克斯罗德还试图证明，合作的基础与其说是信任和友谊，还不如说是关系的可持续性，只有当人们有着值得重视的未来，才能保证持续稳定的合作关系，就是说，长远的未来使得持续的合作关系具有价值，如果不存在未来，合作就失去意义。这个残酷的发现打击了我们对道德的信心。不过，对此并非不能质疑。也许信任和友谊并非合作的必要条件，但仍然可以是充分条件，这一点多少能够维护我们对道德的期望。另外，可持续的未来是否就是合作的必要条件或充分条件？这也并无十分把握，事实上确实有人一意孤行宁可自取灭亡也故意不与人合作。另一方面，“没有未来”也不一定导致背叛，有时反而会是合作，比如“人之将死其言也善”的现象，这是因为，虽然“没有未来”注定了不再有利益回报，可同时也意味着无可损失了，因此，“没有未来”是否导致背叛还要取决于具体情景和人品。未来的权重和持续关系未必就比信任和友谊更能够促成合作，我们不应该轻视美德。不过，信任、友谊和高尚人品确实并不普遍存在，而与利益密切相关的未来权重和关系持续性却无处不在，在这个意义上，艾克斯罗德是对的。然而更有趣的问题是，未来和关系的持续性并非可以完全放心的合作条件。

　　在艾克斯罗德实验中，博弈者之间没有语言交流，只能根据对方的策略来做出回应。这是个有争议余地的设计。语言能够把本来需要在时间中一步一步做出来的事情化作语言空间里的“可能事实”来讨论和交流，这个化时间为空间的功能使得人类能够事先演习各种策略，从而避免大量实践失误。显然，有声的博弈与无声的博弈有着根本差异，而无声的艾克斯罗德实验不能充分说明真实博弈。尽管艾克斯罗德相信，成功的合作并不非要语言交流不可（他钟爱的例子是第一次世界大战时英法部队与德国部队之间没有通过语言而达成“都给对方留活路”的合作策略）。但无论如何，默契合作肯定不是主要的合作方式，人们通常无法在无语状态下充分知道对方的要求和策略，必须通过语言交流才能公开问题、摆明情况甚至亮出底牌。如果双方都知己知彼，博弈情况将完全不同。关于他人的知识在博弈中无比重要，如果省略这个因素就会错误理解形势，包括对未来的估计。仅仅考虑到“未来”的重要性并不能保证选择正确的合作策略，而关于未来的正确知识才是真正起作用的因素。语言的重要性就在于此，只有语言才能预告未来，提前说出来而把未来变成预先可见的，这有可能改变博弈情况。因此，最合理也最如实的理论必须考虑有声的博弈，这正是哈贝马斯不遗余力强调的。

　　五、哈贝马斯对理性对话的厚望

　　“正确的”语言活动是否能够化敌为友？是否能够促成由背叛到合作的进化？这是个更为复杂的问题，因此需要讨论一个与罗尔斯和艾克斯罗德都不同的哈贝马斯设想。尽管罗尔斯和艾克斯罗德非常不同，但有一点是相同的，他们设想的都是实验室里的游戏，都是由不真实的博弈条件和不真实的人所构成的，都省略了一些事实上不能省略的条件，其中最不应该被省略的条件就是语言活动。

　　罗尔斯游戏没有明文规定不许进行语言活动，但无知之幕导致信息极度匮乏，对话几乎没有意义，因为没有什么可说的；艾克斯罗德游戏里的策略是预先设计好的程序，即使可以交流也不能更改。忽略语言活动正是使实验游戏与真实世界难以相通的一个重要原因。因此，忽略语言活动肯定不是好的游戏设计。罗尔斯的一个缺陷就是，他想象的人都是在“独白”，这是现代主体理论的通病。现代主体（笛卡尔—康德---罗尔斯式的主体）只意识到独白式的理性，这是哈贝马斯很不满意的。独白不是有效的语言活动，独白的反思并不能代表别人的意见，更不可能代表所有可能的观点，因此康德或罗尔斯的各种原则都必须能够通得过“对话检验”才能被证明是普遍的，否则只是独白主体的一厢情愿。哈贝马斯的贡献是，他把康德的实践理性进一步发展为“交往理性”，把“独白式”理性变成了“对话式”理性，把主体性的理性变成了主体间的理性，由此“他人”才真正具有了对等的意义。在“独白式”理性那里，无论多少人都被假定在思维上等于一个人，据说理性是普遍的，却没有考虑到理性所要处理的问题并不是预定普遍的。哈贝马斯发现了这个严重问题，他希望人们能够在交往理性中把原来互相冲突的不同意见化为一致意见。交往理性似乎成为了能够化特殊为普遍的途径，于是，冲突的游戏就变性为对话游戏。如果经过对话能够达成一致同意，那么，哈贝马斯式的互知下的一致同意显然优于罗尔斯式的互相无知的一致同意，因为充分信息条件下的一致同意比起限制信息的一致同意不仅更真实而且更难得。

　　说话的内容能够表达利益和价值冲突，因此，话语世界必定是个政治世界。甚至，语言本身就是一种政治，当使用这样而不是那样的语言去命名、定义和描述世界，就同时是在重新安排甚至虚构事物（福柯指出语言安排了事物的秩序），比如说，当谈论某种神怪就是虚构了这种神怪。把某种事物定义和描述成这样而不是那样，制造出这样而不是那样的事物，赋予事物这样而不是那样的价值，这是支配心灵的最有力的政治，语言所规定的思想空间、思想方式以及思想对象变成最大的政治问题，甚至可以说，没有语言活动就没有政治。古希腊的城邦政治就是广场话语的政治。在这样的语境和意义上，哈贝马斯设想的以语言活动为核心的政治游戏就是更值得分析的模型。哈贝马斯游戏不必是初始游戏，而可以是任何阶段都可能出现的一个游戏状态。初始游戏是什么样的状态并不重要（反正都要过去），只要能够进入“理性交往”的对话游戏，就有望消除冲突。由于拒绝了各种生硬的人为条件（如“无知之幕”等），哈贝马斯游戏具有了很高仿真性，但同时又指向一个难以成真的理想化乌托邦。

　　哈贝马斯推荐了一个据说能够形成合作的理想化游戏模型，即“理想说话环境”（ISS）。这个想象源于古希腊城邦政治的公共领域传统，相当于想象了一个“最好的公共领域”。公共领域虽好，却并非必然成为人们的集体选择，因为没有理由能够证明公共领域游戏必然对每个人都更有利，也不能证明这个游戏将是每个人自由选择的共同结果（独裁者、宗教狂、偏执狂、强人、官僚主义者、暴力倾向的人、懒得跟人废话的人，见人就烦的人，等等，就不见得喜欢这一游戏）。如果不是自由选择，就不可能证明什么样的规则、契约和制度将是人们真正的集体选择。那么，人们为什么要放弃冲突而改为对话，就还是个未决问题。可见一个缺乏初始性的游戏终究是不彻底的，它需要更多的解释。

　　权且假设人们碰巧都愿意进入对话游戏。ISS要求所有人平等地、理性地、公开地进行对话，最后达成同意形成一致意见。对话规则为：（1）任何人都有资格参加对话；（2）任何人都有资格提出自己的任何观点和质疑任何观点；（3）任何讨论都必须是理性的；（4）妨害（1）、（2）、（3）的行为都被禁止[9]。另外，判定对话沟通的有效性标准是：（1）所说的话必须是“能懂的”（comprehensible）；（2）所说的话必须是“真的”（true）；（3）所说的话必须是“真心的”（truthful）；而且（4）所说的话以及说话方式必须是“正当的”（right），即论辩必须合乎理性标准，观点必须有正当理由[10]。

　　这些要求貌似平平无奇，其实是很难被满足的高标准严要求。哈贝马斯这些平实要求决不平庸，但有些幼稚。事实情况是，越是最起码的道德规则就越不可能落实为普遍必然的实践，比如说谎，就无法避免，有些谎言甚至有助于拯救和正义；虚情假意也不可避免，许多时候需要给人面子；说话永远正当和正确恐怕歪曲人性，没有激情、偏心、任性和愤怒，只有干巴理性，一切正确了，生活却不值得一过了。当然，哈贝马斯可能会说，ISS只适合专门的对话时刻，平时就不用那样。这多少是个辩护，但还是说不太通，因为大多数共识、契约和制度都是在平常生活中经过长期博弈磨合而形成的，是在长年累月的日常谈话中逐步形成的，而不是在会议桌上谈判而成的。平常生活的长期实践是绝对必需的，因为生活的丰富性、复杂性和不确定性超出我们的想象力和理性能力，各种事情只能慢慢发生，不可能一切都做到未雨绸缪、百无一漏而胸有成竹，那是典型的德国唯心主义想象。维特根斯坦关于“遵循规则”的研究就分析了具体实践是如何把好像明确的规则搞得面目皆非的。“说”了不算“做”了算，这是生活的最终道理。制度和规则是长期博弈所形成的稳定均衡，是“做”出来的，而不是“说”出来的。尽管在广义上“说”也可以看成一种“做”（日常语言学派就研究“说话即行事”的问题），但两者毕竟本质不同，说的未必能够兑现为做。

　　即使只限于说话，有效的“说”也必须足够丰富乃至于能够反映“做”的丰富性，这样才能在“说”中象征性地处理“做”的问题。但ISS是个“说”跟不上“做”的典型案例。ISS并不是充分自由的说话而是谈判式说话，是个因约束而失去丰富性的局限性公共领域。当生活对话在ISS中被限制为贫乏的正确对话，通过对话达成协议的能力虽然似乎提高了（是否真的提高了还有待实践考察），但所能够达成的协议却恐怕文不对题，未必能够回应真实生活中需要解决的那些问题。问题在于，删掉了“不正确”和“不真实”的话语就等于删节了生活，这样削足适履的结果就是无法回应足够多的生活问题，而重要问题很可能就漏掉了。语言中的问题至少必须与生活问题等价，语言可以大于生活，但不能小于生活。因此有理由担心，ISS虽然提高了对话达成协议的能力，却只能达成一些不太重要的协议，生活的重大难题还是没有被解决，甚至没有被触及。

　　另外，哈贝马斯还忽视了ISS的一些技术性困难。比如说：（1）“真”的概念是一直争论未决的问题，如果说要追求真理，当然没有问题，但把“真”作为标准或规则，就难免有些模糊。逻辑真与经验真就非常不同，许多诡辩在逻辑上为真但在经验上为假。即使把真理限定为经验真理，其标准也有争论。最成问题的是，人类需要说的有意义的话大部分都不符合真理要求，包括关于未来的谈论、关于历史的讨论、关于政治的分析、涉及道德和审美价值的评论，以及关于趣味、偏好和主观态度的议论，甚至关于当下事实的描述，都不是真的或很难是真的。因此，“说真话”这条标准有效范围非常小，作用有限；（2）ISS的话语有效标准之间也存在矛盾，比如“真心话”与“正当话”就有可能形成矛盾，有些真心话说出来会很吓人很恶心，在政治或伦理上很不正确，至少不礼貌，而大量正当话却又是虚伪的或者是敷衍了事的废话。因此，“真心”与“正当”往往不能同时满足，这正是为什么生活中需要礼貌、花言巧语和虚情假意的原因。另外，“真心”与“真”、“真”与“正当”也都会出现类似的矛盾。

　　无论如何，哈贝马斯的对话游戏把康德的实践理性发展为交往理性，把独白变成对话，这是理性主义的一个重要进展。但哈贝马斯也仍然继承了理性主义的一个顽固错误。理性主义所理解的“人”只是理性人，理性被认为能够解决一切问题，这种理性的妄想完全忽视了心（heart）才是一切根本困难之所在。理性能力足以解决“思”（mind）的问题，却无力解决“心”的问题，心的问题落在理性能力之外。哈贝马斯虽然克服了理性的独白困难，却仍然重复了崇思贬心的理性主义困难。这是一个非常值得分析的问题，它触及了对话问题的根本。

　　按照哈贝马斯理论，对话的成功路径是这样：理性沟通（满足ISS标准）→ 互相理解→ 一致同意。这个过程很理性化，但不够人性化，对于人工智能之间的合作大概是足够了，但对于人之间的合作就恐怕不够。问题出在“互相理解”与“一致同意”之间漏掉了一个关键环节：互相接受。互相理解至多是同意的必要条件而决非充分条件，因此“互相理解”无法确保“一致同意”[11]。在许多情况下，对话双方完全互相理解了对方的需要和看法，都非常同情对方的处境，但决不接受对方的主张，因为对方的主张与自己的主张水火不容。因此，互相接受是一个绝不能省略的条件和环节，而且比互相理解重要得多。互相理解不是一致同意的充分条件，但互相接受却是一致同意的充分条件以及必要条件——即使在并不完全互相理解的情况下，也可能形成互相接受。因此，完美的成功对话过程应该修改为：理性沟通 → 互相理解 → 互相接受→ 一致同意。这个升级版的对话模式与哈贝马斯模式虽然差别不多，但却有着根本的区别，因为“互相接受”这个条件卷入了“心”的问题，而心的问题却落在理性的能力之外了，要解决心的问题就必须引入理性之外的精神原则，这样，问题就复杂了。

　　不过哈贝马斯仍然希望能够捍卫理性的绝对地位，他曾经在回答我的这个挑战时辩解说（大概意思）：理性仍然是足够有能力的，只不过理性也不能一蹴而就，如果正确对话的时间足够长，各种冲突应该可以在互相理解中慢慢消磨掉，理性加上时间就总能够消除各种无理要求导致的冲突。这倒是个有趣的问题。时间确实可以消解许多冲突，可是时间并无偏心，正如时间可以消除冲突，也同样可以积累冲突，可以消除旧矛盾也可以产生新矛盾。哈贝马斯似乎没有注意到时间是两面派。为什么哈贝马斯非要捍卫理性的绝对地位？可以这样猜想，理性主义所以不愿意考虑“接受问题”，大概因为，如果承认了“接受问题”，就不得不进一步承认心的问题与思的问题的并列重要地位，也就等于承认了理性之思不可能解决一切问题，这对于理性主义是个釜底抽薪的挑战。无论是否情愿，心的问题终究回避不了，心是所有冲突的根源，根据“解铃还需系铃人”原理，心的和解是化敌为友的唯一解法，只有通过接受他者之心才能真正接受他者。如果无视心的问题和“互相接受问题”，无论多么充分彻底的理性对话都将是徒劳。

　　“互相接受”的最大难点很可能在于价值排序。大多数人在其价值观体系所包含的项目上大概有着相似甚至相同的理解（所谓人同此心），但在各个价值项目的排序上却各有偏好（所谓其心必异）。假定所有人都选择了A, B, C, D, E作为基本价值，比如自由、平等、公正、美德和财富，又假定其中有些人承认价值排序{B, C, A, E, D}，这是以平等为首的价值观，而另一些人则承认价值排序{ E, C, A, D, B}，这是以财富为首的价值观，尽管这两种价值观所承认的价值项目别无二致，但不同价值排序使其价值观南辕北辙，甚至不共戴天，就像碳元素由于分子结构排列不同而形成钻石与石墨。当然，还可以有其他多种排序，而且许多种排序之间也都互相难以兼容。价值排序问题说明了，所谓“在许多事情上有着共识”其实距离“达成一致同意”还有万里之遥。价值排序问题可以解释许多事情，比如文化差异、文明冲突、制度对立、社会选择的困难以及国际合作之艰难等等。可以看出，即使哈贝马斯所预设的那些理性共识确实普遍存在，理性对话恐怕也未必能够——估计基本没戏——避免和解决心的冲突，即精神原则、价值观排序以及情感方式的冲突。心的和解恐怕不能靠说，而要靠做。

　　总之，对话虽是避免暴力冲突的理性之路，但不能避免非暴力冲突。事实上，对话是个艰难无比的博弈，其难度并不亚于行动的博弈。对话游戏的优势在于能够以纸上谈兵的方式把各种问题和底牌提前亮出来，它是一个信息更加充分的游戏，虽然各种问题变得清楚起来，但所有困难的实质并没有改变，因此，我们还需要进一步寻找真正能够解决问题的秘密。

　　六、和谐的条件与孔子改进

　　以上讨论了关于冲突到合作的几种声望卓著的研究，大同小异的研究还有许多，但同样都还没有发现这个难题的真正有效解法。根据前面的分析可知，要形成从冲突到合作的进化至少需要这样一些博弈条件：（1）每个人的自由选择权利；（2）长时间的未来；（3）可以畅所欲言的理性对话。但仅仅这些条件是不够的，甚至这些都还不是最关键的条件。那么，到底漏掉了什么特别重要的条件？

　　许多人寄希望于信任[12]。信任的吸引力是明显的，首先，信任确实是合作的充分条件，有了互相信任必有合作；其次，信任是众望所归的传统美德，尽管众望所归的信任在真实游戏中并不容易实现为齐心协力，但信任毕竟并没有被残酷的社会事实完全摧毁，仍然存在于某些关系和情景中。不过，信任毕竟只是心理现象，并非不可动摇的铁的事实，信任本身是难以绝对信任的，这个困难降低了信任理论的意义。进一步说，“信任如何可能”与“合作如何可能”这两个问题其实几乎是等价的（尽管不完全等同），很难把信任看作是合作之前就预先存在的条件，在许多时候，合作是信任的条件而不是相反。有信任就可以有合作，反过来，有合作就可以有信任。在信任和合作之间存在着循环解释，因此，以信任去解释合作或多或少是废话。真正的难题是，在没有信任的情况下怎样才能形成信任，或者，如何从不合作进化为合作。显然，如果预先设定了信任，就不太可能出现“囚徒困境”之类的问题了。另外，众所周知，公正的制度能够形成并且维持合作，其中特别重要的是法治和自由权利制度。假如已经存在公正的制度，确实能够促进合作，公正的制度是合作的充分条件，但公正制度也不是在合作之前的给定条件，反而是社会合作的一个重要成果。这里不能颠倒因果。需要研究的正是，在尚未存在公正的制度的条件下，合作如何成为可能？同样，哈贝马斯想象的具有良好正当程序的公共领域也是一个制度，是个话语制度，但也是社会合作之后的产物，不能提前预支。

　　如果不能提前预支各种以合作为前提的制度，包括信任关系和各种良好制度，那么，前面预设的三个条件又必须进一步修改为：（1）每个人都拥有自由选择的能力；（2）长时间的未来；（3）语言交流。这是一组弱化了的条件，在（1）中，“自由”不是宪法确认和保护的权利所定义的政治自由（liberty），而是未被权利所定义的仅仅作为自主能力的天然自由（freedom），因为权利体系是合作产生的制度，不能预支；另外，在（3）中，作为制度存在的具有良好程序的公共领域也被弱化为自然状态的语言活动，因为公共领域制度也不能提前预支。自然状态的语言活动当然不是理想的对话状态，人们可以说谎，会说不正当的话或无理的话，可以说苦口良药的话，也可以说出残酷真理，甚至恐吓威胁，总之是全部真实的语言活动。这样的博弈环境几乎回到了荀子-霍布斯的初始状态。如果愿意对荀子-霍布斯的初始状态有所改进的话，可以优先语言活动。在语言游戏中进行博弈可以象征性地代替许多实际冲突，纸上谈兵有可能避免无谓的损失。既然语言活动是代价最小的博弈方式，就理当成为博弈的首选方式。

　　给定修改版的荀子-霍布斯初始状态，从冲突到合作的进化是否可能并且如何可能？人人知道，冲突使人们只能获得最差收益，因此，从单纯利益上考虑，人们应该有合作动机。唯一缺少的是克服“零和博弈”、“搭便车”、“囚徒困境”之类不合作的必然有效策略，或者说，能够保证由冲突向合作进化的充分条件。艾克斯罗德似乎证明了合作进化的关键条件是“好人帮好人”，它的双赢效果使好人集团拥有胜过坏人的集体力量，这是个令人鼓舞的好消息。可是正如前面分析的，艾克斯罗德游戏的规则实际上对好人有所偏心，永远不会被淘汰出局于是永远有翻本机会的规定显然更有利于好人发挥互助的长期博弈优势。另外，更可疑的是关于“好人”的假设，艾克斯罗德的好人假设是本质论的，预设了具有合作本性的好人群体的存在，这个过于乐观的假设回避了最严重的可能挑战。在理论上说，更为合理的假设有两种：（1）每个博弈者都是坏人。虽然这个假设不符合事实（其实总会有好人），但它充分表达了可能的最差状态，因此足以覆盖一切可能状态，因此在理论性上最优。这是霍布斯式的假设；（2）博弈者的所谓好人品格和坏人品格是非本质的，是相对的和情景性的，就是说，不存在绝对稳定人格，一个人总是在特定人际关系中相对于特定他人而成为好人或坏人的。这个假设也同样足以解释一切可能状态，也是理论上最优的设定。这是荀子式的假设。只有这两个假设能够无遗漏地覆盖一切可能状态，因此在理论上优于艾克斯罗德假设。

　　如前所论，荀子-霍布斯假设至今仍然是最老到的，最充分表达了一切可能状态。荀子和霍布斯所见略同地假定了人们只能去选择有能力建立公道秩序的强人作为代理人，来建立秩序和管理社会。这个具有专制倾向的强人统治一般被认为是危险的，尤其不合当代人的价值观。当代人对民主如此迷信以至于相信民主是权力合法性的唯一根据。假定人们都同意以民主方式产生统治代理人，显然也不是为民主而民主，而是为了背后的目的。民主本身既不是生存所需也不是利益所在，甚至不是乐趣而只是一种有效手段，因此，重要的不是民主，而是人们希望通过民主这种手段去获得的利益。制度之争仍然不是触底的问题，无论什么制度都是试图达到某种利益的手段，因此，更深入的问题是：（1）人们到底是因为什么而选择了某种制度？（2）什么样的制度才能使人们普遍满意，因而愿意维持合作并且把对制度的反叛降到最低程度？这两个问题的答案非常可能是同一个，即人们发现策略S对所有人都有好处（普遍受益），并且，人们选择S的收益好过拒绝S的收益（利益改进），因此，S就非常可能发展为一个用来保证合作的稳定制度。

　　艾克斯罗德证明，主动追求合作的TFT策略在长期博弈中能够获得明显优势，人们不至于视而不见，人们会被其成功所诱惑而去模仿这个拥有最好收益的选择。但我们已经分析了，TFT所以如此成功是因为游戏的特殊规则对它相对有利，这与真实世界有不小的差距，因此，TFT还不是我们所寻找的答案S。但艾克斯罗德实验还是给出了一个非常重要的启示：既然模仿最好收益的策略是挡不住的诱惑，那么，具有优越性的合作关系应该会成为博弈均衡并且被普遍接受而变成稳定制度。现在问题进一步明确为：什么是可能比TFT更具真实性甚至更有优势的策略？是否存在这样的策略？

　　根据真实世界，必须考虑人生的有限性。人生是人们对事物进行估价的一个最重要指标，它限定了有效“未来”的实在意义。假如人寿千年，未来的分量变得如此之重，人们就更容易合作，但事实上人生苦短，偶然机遇稍纵即逝，“背叛”就是巨大诱惑。那么，什么样的关系才能抵制背叛的诱惑？我们不能寄希望于伦理规范，对于大多数人，伦理规范从来只能抵抗微不足道的诱惑，甚至连这一点也是可疑的，事实上大多数人更可能见利忘义，而且是见小利而忘大义。真正抵抗住诱惑的是法律，是惩罚而不是奖赏。何况伦理也是合作的成果而非给定的前提，因此不可以预支伦理。显然，我们需要寻找的是一个即使在充分自由（不择手段）的情况下仍然能够形成合作进化的策略。于是，剩下的唯一可能性是，如果S是最优策略，它就必须能够形成一种同步对称的利益互相依存关系（标记为SS）：如果博弈者X或Y中任何一方获得正面回报，另一方也必定连锁地同时获得正面回报；如果X或Y中任何一方获得负面回报，另一方也必定连锁地同时获得负面回报。SS应该是唯一绝对保险的合作策略，在任何可能世界中都能够建立稳定合作，尤其能够避免博弈论担心的“最后的背叛”这种没有机会报复的致命一击。在SS中，没有人能够通过背叛获得任何利益，如果背叛就会反身挫败。SS策略有两类，正面SS和负面SS，都同样重要。不幸的是，负面SS似乎比较容易形成，现成例子就是两个拥有“确保互相摧毁”核武器的国家之间几乎不可能发生全面战争，但这只是一种消极的合作。要形成正面SS，即互相成全、互惠双赢，则难度较高。

　　对于建立一个好社会，正面和负面的SS都是必要的，分别用于发展利益和确保安全。为了使SS能够顺利形成，有效的对话是必要的。人们需要确定在哪些具体事情上可以形成SS，需要有效的试探和协商活动来确定别人也同意如此这般的策略，也就是需要达成SS的足够信息。于是，事先的对话就成了唯一合理的试探性行为，在这一点上哈贝马斯是对的。但哈贝马斯的对话游戏包含一些不切实际的要求，因此只好放弃哈贝马斯式的“理想说话环境”而寻找另一种要求比较低而更现实主义的“有效对话环境”。要求不能太高，这是一个重要的生活原理。只要对话双方各自提出明确要求，就足够了，至于“真实性”、“真心”和“正当”，都是过高的要求。事实上，明确的信息正是博弈者真正需要的，有了明确的信息就足以在其范围内查明是否存在SS合作的可能性。

　　何种条件能使人们决心建立双方利益绝对挂钩的关系即SS策略？对于这个问题，要找到完美解决，恐怕难以断定，相对最好的答案应该是一个久经考验的传统观点，即“和”策略。和策略最早是周朝政治家提出的，是从属于天下体系的一个重要策略，主要用于“协和万邦”（《尚书·尧典》），相当于所谓全球治理，但立志更为高远，和策略有助于定义一种化敌为友的政治概念。远古文献有限，和的概念未见清楚界定。最有参考价值的理解来自春秋时关于“和”的争论，至今富有学术意义，转换为当代学术语言可以表达为：给定世界的多样差异状态，差异可能诱发冲突，于是至少存在两种可能的解决方案，一是“同”，即消灭差异实现大一统。但普遍主义只在真理范围内是合理性的，对于价值领域，普遍主义却导致不良的存在状态，因为“同则不继”，任何事物都不可能在失去多样性的环境中存活；另一方案是“和”，即在承认多样性的前提下在差异中寻找并且建立相互利益最大化的协作关系，这是在存在论上合理的策略。其中的关键论证是这样的：（1）事物之间的和谐是任一事物能够生存的必要条件。一种事物单靠自身不可能生存，任何事物都不得不与其他事物共存而得以存在，这意味着，共存（co-existence）是存在（existence）的存在论条件，或者说，存在论总是共在存在论；（2）各种事物只有在互相配合之中才能使任一事物达到其最大的可能价值，事物间或人之间的相成关系将使任何一方的利益都获得改善，并且在相互改善中每一方的收益最大值大于独自改善的收益最大值。经典表述是：“和乃生，不和不生”[13]；“夫和实生物，同则不继。以他平他谓之和，故能丰长而物生之，若以同裨同，尽乃弃矣……声一无听，物一无文，味一无果，物一不讲”[14]。

　　据此可以把SS策略进一步明确为“和策略”：（1）对于任意博弈方X，Y，和谐是一个相成互惠均衡，它必然使得，X获得其应得利益x，当且仅当，Y获得其应得利益y，同时，X如果受损，当且仅当，Y也受损，反之亦然；并且（2）X获得利益改进x+，当且仅当，Y获得利益改进y+，反之亦然。结果是，促成x+出现成为Y的优选策略，因为Y为了达到y+ 就不得不承认并促成X获得x+，反之亦然。在“和策略”的相成互惠均衡中所能达到的各自利益改进均优于各自独立所能达到的利益改进，因为那些对于每个人的生存极其重要的利益绝非个人或单边力量所能获得，所以合作是必需的，所谓“不和不生”。从逻辑结构上看，“和策略”是一个互为条件的关系，相当于逻辑的互蕴关系。

　　“和策略”的要求比较苛刻，它需要存在着各方都可接受的利益改进，而“都可接受”是很难满足的条件，虽然比罗尔斯追求的“一致同意”容易一些，但仍然很不容易。准确的说，和策略比帕累托改进的要求更高。人们不可能满足于帕累托改进，问题在于，帕累托改进远不足以保证每个人的幸福，甚至不能保证多数人的幸福，因此无助于消除冲突而建立合作。帕累托改进与经济学喜欢说的“把馅饼做大”的观点是一致的，毫无疑问，当财富“馅饼”做得足够大，对大家都有好处，至少没有坏处，但物质上的好处未必能够消除所有问题。可以考虑一个“心理学馅饼”问题：当帕累托改进仅仅改善了某些人的利益而维持其他人的利益没有受损，或者所有人利益都获得改善，但某些人的利益改善程度明显不如其他某些人的改善那样大，那些利益改善很小的人们就未必感激变大了的“经济学馅饼”，因为人们还需要“心理学馅饼”。如果在“心理学馅饼”上之所失大于在“经济学馅饼”上之所得，人们就不愿意合作了。经济学仅仅考虑生存所需要的物质利益而忽略心灵所需要的精神世界，这样恐怕不能解决冲突与合作的问题。只有“和策略”才能达到人人满意（不是平均主义，只是按公正比例受益），不仅在“经济学馅饼”上人人满意，而且在“心理学馅饼”上人人满意。假如与艾克斯罗德的合作原则“自己活也让他人活”（live-and-let-live）作比较，“和策略”则是一个强化合作原则，表现为“自己活当且仅当他人活”（live-iff-let-live）而且“自己发达当且仅当他人也发达”（improved-iff-let-improved）[15]。为了表达对孔子的敬意，我愿意把这里所定义的“和策略”利益改进称为“孔子改进”。

　　关于“和策略”，未决的问题是：（1）“和策略”是否能成为解决任何冲突问题普遍适用的模式？这一点还没有充分理由可以证明。从逻辑上看，估计有些冲突是和策略无法解决的，比如零和博弈的冲突就恐怕在任何意义上不存在合作解，只好你死我活或者退让回避零和博弈；（2）最能保证“和策略”的客观条件是存在着某些巨大而可分享的共同利益，尤其是，各人所能分享的共同利益大于或重于各人所能独占的私人利益。这种情况不少但并非普遍现象，因此，在共同利益不足以压倒私利诱惑的情况下就无法形成合作。这也正是人类一直无法克服的一个根本困难，即共同利益敌不过私利、长远利益敌不过当前利益。令人失望的是，造成这种根本困难的原因不是别的，正是人性本身的缺陷，不仅是感性的缺陷，尤其是理性的缺陷，即使在共同利益大过私利、长远利益好过眼前利益的时候，多数人仍然算不清帐；（3）另一个足够诱导人们选择“和策略”的客观条件是存在着明显的互补利益。但是，是否存在着互补利益的判断以及对互补利益的评估需要理性对话，而有效的理性对话又需要人们对各种形势各种事情有着正确认识，而“正确的认识”是很难达到的——正如苏格拉底指出的，如果人们真的有了正确知识就不会犯错误了，可问题是人们总是没有正确知识。

　　这里的结论是，能够形成最优合作的“和策略”在理论上有能力解决或减少冲突的各种困境，包括最典型的囚徒困境、搭便车、公地悲剧以及反公地悲剧等困境，但由于人性本身的缺陷以及实践条件上的局限性，在实际上无法普遍地形成“和策略”，因此实际上至多能够减少减弱但不可能消除上述的各种典型困境。这一点虽然令人失望，但至少清楚地说明了：任何试图通过知识论上的发现去彻底解决人类冲突与合作问题的努力是徒劳的，无论人们多么理性，都不可能彻底解决冲突问题，或者说，理性终究是有限的，人类要改善命运，很可能还是不得不求助于根基从来不稳的道德。更严重的是，现代价值观的根基更不可靠，一切以个人为准的现代价值观没有改善人性，反而张扬强化了人性弱点。可能需要再次“重估一切价值”了。

　　【注释】

　　[1]（美）肯·宾默尔著，王小卫、钱勇译：《博弈论与社会契约》第一卷，上海财经大学出版社，2003，§1.2.4.

　　[2]荀子：《荀子/礼论》：“人生而有欲，欲而不得，则不能无求，求而无度量分界，则不能不争，争则乱，乱则穷，先王恶其乱也，故制礼义以分之”。

　　[3] Rawls: A Theory of Justice.Cambridge,Massachusetts, the Belknap Press ofHarvardUniversityPress. 1971, p. 137.

　　[4]类似的智慧可以参考宋朝张咏公断“兄弟分家产”的故事：兄弟分家，哥哥主持分家，弟弟认为少分了，哥哥不承认，张咏说，其实解决方法很简单，哥哥的财产和弟弟的全部对换就可以了。

　　[5]石元康：《罗尔斯》，广西，广西师范大学出版社，2004。pp91-97.

　　[6] Rawls: A Theory of Justice, 1971, p.302.

　　[7]（美）艾克斯罗德著，吴坚忠译: 《合作的进化》，上海人民出版社，1996，p.3.

　　[8] R. Axelord: Effective Choice in the Prisoner’s Dilemma. Journal of Conflict Resolution. 24: 3-25. 1980.

　　[9] Habermas：Moral Consciousness and Communicative Action.Cambridge,UK, Polity Press, 1990. p.89.

　　[10]（德）哈贝马斯著，曹卫东译：《交往行为理论》第一卷，上海人民出版社，2004，pp.99-100.

　　[11]我关于“理解不能保证同意”这个命题的论证参见Understanding and Acceptance, 载《les Assises de la connaissance reciproque》，France，Le Robert, , 2003.

　　[12]从齐美尔、卢曼到福山等人有关于信任的研究。许多关于信任的解释其实只是解释了信任的积极作用，例如卢曼发现，信任是对社会事务复杂性的简化机制。许多经济学家也认为信任可以降低交易成本。

　　[13]《管子·内业》。

　　[14]《国语·郑语》。

　　[15]孔子的原始表述是：“己欲立而立人，己欲达而达人”。见《论语·雍也》。

　　本文原载《世界经济与政治》2007年第6期，原题为“冲突、合作与和谐的博弈哲学”。