您好、欢迎来到现金彩票网!
当前位置:秒速牛牛投注 > 统计推理 >

因果推理中的潜在结果模型起源、逻辑与意蕴

发布时间:2019-07-14 16:34 来源:未知 编辑:admin

  潜在结果模型是统计学上的因果推理革命,它开创了统计学研究因果推理的新境界,具有划时代的意义。潜在结果模型强调对同一单位同时接受不同干预的比较而得出一个干预相对于另一个干预的因果关系。潜在结果模型得以成立需要依赖两个关键假设:一个是稳定单位干预价值假设,它强调被干预的单位或对象之间不会有交互关系;另一个是可忽视的干预机制假设,它强调在一定情景之下,分配机制不会对潜在结果产生影响。由于潜在结果是由分配机制决定,这使得分配机制在潜在结果模型中具有突出作用。分配机制是区分不同研究的重要依据。潜在结果模型是认识论和方法论革命,它将实验研究和观察研究统一在一个框架之下思考,并且让观察研究去接近实验研究,也是判断因果关系的重要标准,它对社会科学因果推理研究具有重要启发和借鉴意义。

  本文作者:李文钊,中国人民大学公共管理学院副教授,摘选论文《因果推理中的潜在结果模型:起源、逻辑与意蕴》,原载于《公共行政评论》2018年第1期

  在因果推理的理论模型中,潜在结果模型(Potential Outcomes Model)是其中最重要的理论模型之一,其核心是比较同一个研究对象(Unit)在接受干预(Treatment)和不接受干预(Control)时结果差异,认为这一结果差异就是接受干预相对于不接受干预的效果。对于同一研究对象而言,通常我们不能够既观察其干预的结果,又观察其不干预的结果。对于接受干预的研究对象而言,不接受干预时的状态是一种“反事实”状态;对于不接受干预的研究对象而言,接受干预时的状态也是一种“反事实”状态;所以该模型又被某些研究者称之为反事实框架(Counter factual Framework)。潜在结果模型的主要贡献者是哈佛大学著名统计学家唐纳德·鲁宾(Donald B.Rubin),因此该模型又被称为鲁宾因果模型(Rubin Causal Model)。不过,鲁宾(Rubin,2005)并不认同“反事实框架”的概念,他认为结果的出现与否主要取决于干预机制(Assignment Mechanism),这并不意味着一种结果不存在,只是我们事实上只能够看到一种结果。对于鲁宾而言,潜在结果是一个更合适的概念。考虑到这一理论主要是由鲁宾开创并持续推动这一研究,我们在介绍该理论时,也使用了潜在结果模型的概念。

  潜在结果模型推动了因果推理研究的复兴,也促进了统计学与经济学、社会学、生物医药学等各学科之间广泛争论、相互交流和共同进步,正成为一个跨学科研究的理论模型,并为其他各学科的因果研究提供基础性理论和方法论贡献。潜在结果模型对于公共管理和公共政策研究也具有重要价值,它可以帮助我们重新思考公共管理和公共政策中因果关系问题,为公共管理和公共政策的理论发展提供坚实的基础,也可以使得公共管理和公共政策研究者站在与其他学科相同的起跑线上,实现公共管理和公共政策学科的跨越式发展,共同推进人类对知识的理解与认知,以改善自身福祉。以公共政策研究中政策评估为例,一个重要的研究问题是“政策干预是否实现了预期的效果?”,也即干预效果问题(Treatment Effect)。很显然,潜在结果模型可以为政策评估提供理论基础,更好地回答政策评估中的因果推理问题。

  2015年,哈佛大学统计学家鲁宾和计量经济学家圭多·因本斯(Guido W.Imbens)(Imbens&Rubin,2015)合作出版了《统计科学、社会科学和生物医学中因果推理:一个简介》的著作,首次对潜在结果模型进行了系统、全面和深入的介绍,这也标志着潜在结果模型的研究进入一个新阶段。接下来,我们将以此书为基础,结合其他学者(Morgan&Winship,2015;Guo&Fraser,2014)对潜在结果模型的研究和评论,对潜在结果模型的理论来源、主要内容和基本假设等进行阐述,并讨论其对计量经济学、社会学、政治科学、公共管理/政策学的意蕴。

  随着潜在结果模型在因果推理中重要性和影响力增大,人们开始关注这一理论模型的历史传统、理论来源和发展过程。通常,学者们都认为鲁宾(Rubin,1974)在这一理论模型的发展过程中做出了突出性贡献,这也是潜在结果模型被命名为鲁宾因果模型的主要原因。在鲁宾明确提出这一理论模型之前,谁还对这一理论做出过重要贡献?此前进行因果推理的理论模型是什么?我们能否从历史上找到该理论发展的一些早期线索?对此,不同学者有不同看法。通常认为,哲学和统计学是这一理论模型的主要来源:其中休谟(David Hume)和密尔(John S.Mill)是哲学家的典型代表,他们最早从反事实框架的视角讨论因果关系;耶日·奈曼(Jerzy Neyman)和罗纳德·费希尔(Ronald A.Fisher)是统计学家的典型代表,他们分别提出从潜在结果和随机的视角来讨论因果关系。不过,詹姆斯·赫克曼(James Heckman)(Heckman,2008)认为,经济学家罗伊·哈罗德(Roy F.Harrod)也提出过潜在结果模型的学术思想。尽管如此,鲁宾仍然是因果推理中的潜在结果模型的主要发现者和开创者(Rubin,1974;Rosenbaum&Rubin,1983)。

  由此可见,潜在结果模型挑战了因果推理的正统观点,发展了哲学中反事实框架思想,通过借鉴统计学中潜在结果和随机的概念,建构了因果推理的新路径。这一新路径是关于如何进行因果推理的基础性研究,使得观察研究和实验研究在统一理论框架之下思考,为社会科学的因果推理建立了坚实的理论基础。通过对因果关系研究的历程回顾,对潜在结果模型的理论来源的分析,可以更好地理解潜在结果模型的核心主张和内在逻辑。

  对于什么是“原因”(Cause),什么是“结果”(Effect),几个世纪以来哲学家似乎都没有给一个明确定义。这种现象产生的一个主要原因是对于原因和结果的定义部分依赖彼此,即需要通过结果来界定原因,通过原因来定义结果。与此同时,原因和结果嵌套在因果关系之中,这使得两者之间关系复杂。对此,哲学家约翰·洛克(John Locke)(Locke,1975:324-325)对因果给出了一个定义,他认为:“会产生任何想法的事务,不论是简单或复杂,我们都称为因,而被生产出来的,就称为果。……因就是会使任何其他东西产生的事务,不管该事务是简单的想法、物质或状态;而任何东西,只要起源于其他的事务,就是果。”这一定义使得哲学家和科学家开始对原因、结果和因果关系产生了浓厚的兴趣,并尝试发展因果关系的基础理论。

  在潜在结果模型之前,哲学中有关因果推理的思想主要是遵循“连续性或相关性的规律”(Regularity of Succession or Correlation)这一范式,认为因果关系是发现规律的过程。不过,一般认为,哲学家密尔提出了判定因果关系的三项原则:即原因在结果之前;原因变化,结果也变化;两者之间变化不是由第三个变量产生的(Shadish etal.,2002)。对此,保罗·拉扎斯菲尔德arsfeld)(Lazarsfeld,1959)进一步提出了一个被广泛接受的因果关系定义,他将因果关系的判定描述为遵循三个标准:(1)两个变量之间因果关系必须有时间顺序关系(Temporal Order),这意味着在时间序列上,原因必须在结果之前,如果A是原因,B是结果,那么,A必须发生在B之前;(2)两个变量之间必须在经验上具有相关性;(3)更为重要的是,两个变量之间观察到的因果关系不能够被第三个变量解释,即两个变量之间不能够是伪关系(Spurious)。对于因果关系中“规律性”的强调,对学术发展产生了广泛而深远的影响,其中“回归时代”(The Age of Regression)正是受这一思想的启发而成为学术界探讨因果关系的主流方法(Morgan&Winship,2015)。

  随后,越来越多的学者认识到通过发现连续性或相关性的规律来探讨因果关系,并不一定能够得出真正的因果关系。正是对因果关系中“规律性”思维范式的挑战,使得哲学思想中开始出现通过“反事实框架”(Counter factual Framework)来探索因果关系。根据戴维·刘易斯(David Lewis)(Lewis,1973)和朱迪亚·伯尔(Judea Pearl)(Pearl,2009)的看法,18世纪的休谟是最早从反事实框架讨论因果关系的哲学家。休谟(Hume,1959[1748]:Sec VII)指出:“我们界定一个对象(Object)是原因,意味着它之后产生另一个对象,与此同时,所有与第一个对象类似的对象都会产生第二个类似对象,或者,用其他语言表达,如果第一个对象不产生,则第二个对象从来不会产生。”密尔受到休谟的启发,也讨论了反事实框架问题。密尔(Mill,1973)指出,如果一个人吃一盘特别的食物,随后死亡了,这意味着,这个人不会死亡,如果他不吃这盘特别的食物。这说明密尔在比较在同一个人的两种潜在结果,一个是死亡(吃一盘食物),一个是不死亡(不吃一盘食物),这样一个人可以推断吃一盘食物导致了死亡。

  刘易斯(Lewis,1973)发展了休谟有关反事实框架的思想,并将其正式化和符号化,为因果推理提出一种不同于规律性分析(Regularity Analysis)的另一条路径,它奠定了哲学中反事实框架的思想基础。他认为正统因果关系研究主要是继承了休谟对因果关系的第一个定义,强调了规律性对于因果关系的重要性,而从规律性分析来理解因果关系存在很多缺陷。对此,他(Lewis,1973:557)进行了简洁而深刻的评论,指出:“依旧需要观察:任何规律性分析是否将真正的原因与效果、副现象(Epiphenomena)、优先潜在原因(Preempted Potential Causes)等进行有效区分,以及它是否能够成功而没有使更严重的问题成为牺牲品、没有在周转圆上打桩、没有离开因果关系是规律性的示例。”于是,他通过借鉴休谟关于因果关系的第二个定义,提出了因果关系的另一条路径,即对因果关系的反事实分析(A Counter factual Analysis of Causation)。刘易斯结合可能世界语义学(Possible World Semantics)和反事实来刻画因果依赖性(Causal Dependence),并形成了“界定可比较相似性(Comparative Similarity)———用相似性来说明反事实———用反事实来定义反事实依赖性———用反事实依赖性来阐述因果依赖性———用因果依赖性来解释因果性”的逻辑链条。反事实的可能世界语义学的核心观点是世界之间存在可比较相似性的关系,一个世界与现实世界更接近意味着它与其他世界相比,与现实世界有更多的相似性。对刘易斯而言,可比较相似性意味着世界之间存在弱排序关系(Weak Ordering),并且现实世界(Actual World)更接近实在(Actuality)。通过借鉴相似性关系的词汇,刘易斯(Lewis,1973:560)对“如果命题A是真的,那么命题C是真的”的反事实为真的命题表述为:“A□→C:命题如果A为真,C也为真。A□→C为线)不存在可能世界其中A为线)与现实世界相比,存在C为真且A为真的可能世界,其相似度比任何C为假且A为真的可能世界都要高。”这说明,反事实命题“A□→C”为真的充分必要条件是第二个条件,它要求全部相似于现实世界中A为真的世界中C为真。在此基础上,刘易斯对反事实依赖性进行了界定,提出:如果A和C是两个命题,若有A□→C,则说明C反事实依赖A。以反事实依赖为基础,刘易斯(Lewis,1973:562)形成了因果依赖性命题:“让c1、c2、……和e1、e2、……代表不同事件,没有任何来自c的两个事件和来自e的两个事件是共存的。因此,我说事件e1、e2等因果地依赖事件c1、c2当且仅当O(e1)、O(e2)等反事实地依赖于O(c1)、O(c2)。正如我们所言:是否e1、e2等事件发生主要依赖于c1、c2等事件发生。”很显然,这是对休谟因果关系的正式概括,即若事件c没有发生,则事件e也不会发生。一旦这一反事实命题成立,则“若事件c发生,则事件e发生”的命题自然成立。最后,刘易斯完成了从因果依赖性向因果性的跨越,认为事件之间因果依赖性意味着因果关系。他(Lewis,1973:563)指出:“如果c和e是两个现实事件并且满足c不发生,e就不发生,那么说c就是e的因。”

  刘易斯对因果关系进行反事实分析,使得反事实从一种思想转化为一种分析框架,为因果关系的理论思考提供了另一种路径。哲学中的反事实框架主要是对一般性因果关系的讨论,它不同于社会科学对特定因果关系的讨论(Lewis,1973)。不过,哲学中反事实框架并没有产生预期的影响。正如哲学家詹姆斯·伍德沃(James B.Woodward)(Woodward,2003)在《使事情发生:因果解释理论》一书中指出的那样,哲学家刘易斯及其学生所倡导的基于反事实框架的因果理论并没有统计学家、经济学家、社会科学家等所提出的基于反事实框架的潜在结果模型的影响力大。在刘易斯开创性提出因果关系的反事实框架近30年后,哲学家又重新开始关注反事实框架,这也使得其成为哲学中因果研究的一个重要研究话题(Woodward,2003;Collins etal.,2004;Hoerl etal.,2011;Schulz,2017)。在哲学家使用反事实框架思考因果关系时,统计学家和计量经济学家开始使用另外的语言来表达同样思想,即用潜在结果模型来重新定义因果关系和进行因果推理,并且产生广泛而深远的影响。

  统计学家奈曼和费希尔对潜在结果模型的提出产生了实质性影响。根据鲁宾(Rubin,2005)的观点,奈曼是第一个提出“潜在结果”(Potential Outcomes)概念并将之应用于随机实验的统计学家,而费希尔则是第一个提出“随机实验”(Randomized Experiment)概念的统计学家,“潜在结果”和“随机”这两个概念奠定了潜在结果模型的思想基础。而统计学家鲁宾(Rubin,1974)则进一步将两者结合,并将潜在结果模型系统地应用于随机实验和观察研究(Observational Study),系统地提出潜在结果模型的理论假设、核心内容和操作方法,其中匹配(Matching)和倾向值(Propensity Score Analysis)更是革新了社会科学的研究方法(Rosenbaum&Rubin,1983;Guo&Fraser,2014)。奈曼(Neyman,1990[1923])在其博士论文中首先使用了“潜在结果”这一表述,并将之用于农业实验中,以估计每一块田地的“潜在产出”(Potential Yield)。他对于潜在结果概念的提出始于一个农业实地实验(Field Experiment)的描述,设想在m块土地中需要种植v个不一样的种子,用Uik表示“潜在产出”,其中i表示不同种子,i=1,……,v,k=1,……,m表示不同地块。“潜在产出”不同于实际产出,每一块土地在实际过程中只能接受一种干预,实现一种产出,它是所有潜在产出的实际表现形式。潜在结果的集合是对所有潜在结果的描述,U={Uik:i=1,……,v,k=1,……,m}。奈曼所谓的“最优估计”(Best Estimate)是所有潜在结果的平均值(见等式1):

  其实根据后面鲁宾(Rubin,2005)对潜在结果的定义,奈曼的这一“最优估计”实际上为真实产量(True Yield)。但是,在现实中我们并不能够计算出所有潜在产出。为此,奈曼设计一个类似完全随机实验的瓮模型(Urn Model)让n=m/v块土地暴露于不同种子,xi是n块土地实际暴露于第i种种子的样本平均产出,它不同于潜在结果的平均产出ai。由于是随机实验,实际观察到的两种不同种子之间差异就是对所有潜在产出之间差异的估计,即等式2:

  鲁宾和因本斯(Imbens&Rubin,2015:25)在评论奈曼的贡献时指出:奈曼主要作出了三个方面贡献,即明确提出了潜在结果的概念;隐含地考虑了稳定性假设;隐含地考虑到了对干预单位实现随机分配的问题。不过,正式提出随机实验的统计学家是费希尔(Fisher,1925,1935),他证明了没有“随机”,任何实验都没有价值,通过随机可以避免对实验环境的严格要求。

  费希尔对于“随机”的讨论始于一个经典案例,即如何测量一个人对于奶茶的品尝能力(Guo&Fraser,2014)。与此前对于实验条件的严格要求相比,随机实验对于实验条件要求并不高,它更重视随机过程。以奶茶的品尝能力实验为例,费希尔设计了八杯奶茶,有4杯是先加奶后放茶,另外4杯是先加茶后放奶,随后对这八杯奶茶的位置进行随机放置。然后请奶茶品鉴人员对这八杯奶茶进行鉴赏,根据排列组合,这八杯奶茶一共有70种排列顺序(见等式3和等式4)。

  一个人如果对这八杯奶茶全部鉴定正确,那么其正确概率是1/70,即0.0124(见等式5)。费希尔进一步提出了P值检验的原理,认为一旦正确品鉴,由于这种概率极低,P0.05,因此我们可以假定这是具有品鉴能力的结果而不是因为偶然或运气产生。

  如果我们放宽假设,假定一个人可以正确品尝6杯奶茶,那么一共有17种可能6杯奶茶品尝正确的排列,这样一个人正确品尝的概率则高达0.243(见等式6)。根据P0.05的假设,我们显然不能够随便拒绝假设,很可能一个人能够品尝6杯奶茶更多是一种偶然或运气而不是品尝能力本身很高。

  潜在结果模型真正成为因果推理理论中重要的、有竞争力和有影响力的理论模型,其主要贡献者是统计学家鲁宾(Rubin,1974,1975,1978)。鲁宾作出了两个关键贡献:一是将潜在结果放在了因果分析的中心环节,并且认为潜在结果不仅在随机实验中能够发挥作用,在观察研究中也能够发挥作用;二是它重点讨论了潜在结果中的分配机制(Assignment Mechanism),认为分配机制对于潜在结果具有关键和重要的影响(Imbens&Rubin,2015)。正是因为鲁宾的贡献,这使得统计学真正从“相关时代”(Association)进入“因果时代”(Causal Inference),为因果推理提出了独特的统计理论基础,即潜在结果模型。与此同时,这也加深了统计学与经济学、生物医学等学科的进一步对话、交流和融合。

  通过对鲁宾的潜在结果模型和刘易斯倡导的反事实框架进行对比,我们发现两者之间既具有共同点,也存在差异。就共同点而言,潜在结果模型和反事实框架使用不同语言系统表达了相同的含义,都要求比较没有发生干预和发生干预的世界,反事实框架使用可能世界语义学,潜在结果模型使用了潜在结果的概念。当然,两者之间也存在较大差异。反事实框架更多是一种文字理论(Verbal Theory),它强调使用语言来对理论进行阐述,即便有一些符号也是为了语言的清晰表达,因此,哲学中反事实框架更多是对休谟思想的清晰化。相反,潜在结果模型则是一种计算模型(Computer Model),它强调使用数学和可计算的语言来对理论进行阐述,这也使得这一理论会将其假设、命题和结论以清晰化的方式呈现,这也有利于该理论的传播和扩散。此外,反事实框架更多关注对因果关系的界定,而潜在结果模型不仅关注对因果关系的界定,而且还关注因果推理,从某种程度上看,因果推理构成了潜在结果模型需要解决的最核心问题。潜在结果模型更多与社会科学对话,并且强调其与现有的观察研究与实验研究之间的关系,反事实框架仍然停留在哲学思想层面,从哲学思想到社会科学方法还有很长的距离。正是这些原因,使得潜在结果模型被更多地接受。即便有些学者使用了反事实框架的语言,但是其核心内容仍然是依据潜在结果模型来构造(Morgan&Winship,2015)。接下来,我们将对潜在结果模型的主要内容、核心假设、分配机制等进行讨论,以期进一步厘清潜在结果模型的内在逻辑。

  潜在结果模型的核心假设是“没有操纵就没有因果”(No Causation without Manipulation)(Rubin,1974:238),它由行动(Action)、单位(Unit)、分配机制(Assignment Mechanism)和潜在结果(Potential Outcomes)等概念组成。这意味着潜在结果模型的研究路径强调因果(Causality)将行动与一个单位联系在一起,行动就是原因(Cause),行动所导致的结果就是效果(Effect)。这一行动就是我们所说的操纵、干预(Manipulation,Treatment,Intervene)等,它通常又可以分为积极干预(Active Treatment)和控制干预(Control Treatment),根据约定俗成的说法,积极干预被称为干预(Treatment),控制干预被称为控制(Control)。潜在结果是这一模型的核心,它的含义是“给定一个单位和一系列行动,我们将每一对‘行动-单位组’界定为一个潜在结果”(Imbens&Rubin,2015:4)。这一模型被称之所以为“潜在结果”,主要是因为在实际中,我们通常只能够观察到一个结果,这一结果是由实际行动产生的。哪些结果能够被观察到,这主要取决于哪一类行动被分配到干预对象。正是这一原因,“分配机制”在潜在结果模型中处于核心位置,它直接决定什么样的结果能够被观察。因此,鲁宾认为潜在结果模型的本质是一个“缺损数据问题”(Missing Data Problem),推理过程是一个估计缺损数据的过程,它要求我们对推理因果关系的单位的缺损数据进行估计,通过估计缺损数据与实际观察结果之间差异来推断因果关系。

  根据潜在结果模型,因果关系(Causal Effect)涉及对同样单位同时在干预后比较两个不同潜在结果。例如,一个人面临头痛是否吃阿司匹林问题,它涉及两个选项,是否吃阿司匹林,以及会导致两种结果,头痛存在或者头痛消失(见表1)。我们不能够对同一个人不同时间进行比较,一个人在不同时间属于不同单位,这意味着我们不能够通过“前后对比”来判断阿司匹林的效果。同样,我们也不能够对同一个人在不同时期的状态进行比较来得出因果关系,如上个月我有头痛,没有吃阿司匹林,头继续痛,这个月我又有头痛,我吃了阿司匹林,结果头痛好了,于是我们来判断阿司匹林发挥了效果。与此同时,两个人都得了头痛,让一个人吃阿司匹林,另一个人不吃阿司匹林,这也是两个不同单位,而不是同一单位比较两种不同干预。潜在结果模型非常强调同一个单位的同时接受干预和不接受干预,比较干预发生之后的状态。

  虽然从定义上看,对于因果关系只需要观察一个单位就可以。但是,在实际中,我们不可能观测到同一单位的两种不同状态。正如保罗·贺兰(Paul W.Holland)(Holland,1986:947)所言,“因果推理的最基本问题”(The Fundamental Problem of Causal Inference)是最多我们只能够实现一种潜在结果,其他潜在结果不能够观测到(见表2)。

  如果我们用符号表达,潜在结果模型的因果关系在单位层面和平均层面表现为如下两个正式公式(见等式7和等式8):

  当对多个单位进行干预或控制时,我们同样面临着一次只能够观察一个潜在结果,那么如何对多个单位的潜在结果进行无偏估计?鲁宾(Rubin,1974)在其开创性论文中给出了一个简单证明,他首先假设存在两个单位(Two Trials),如果双方同时接受干预或控制,那么两个单位的平均效果如等式9:

  但是在实际的干预和控制中,我们要么将第1个单位作为干预组,第2个单位作为控制组,或者将第1个单位作为控制组,第2个单位作为干预组,实际中我们不可能对所有结果进行观测。于是我们在实际中可以观察到等式10或等式11:

  等式10或等式11并不一定要和等式9一致,也不需要和每一个单位自身的干预效果相一致。等式12或等式13表示了每一个单位自身接受干预与不接受干预所产生的效果。

  如果实验是随机的,干预或控制随机分配给第1个单位或第2个单位,那么等式10和等式11的差异应该是相同的,这意味着无论是第1个单位或第2个单位分别接受干预或控制,我们都会得到同样结果。这样我们可以通过计算等式10和等式11的平均值得到整个实验的干预效果,见等式14:

  很显然等式14与等式9是相同的。这也意味着,一旦实现随机干预,干预组和控制组差异减少,那么等式9=等式10=等式11=等式12=等式13。这样,我们对于多个单位的因果推理就可以转换为等式15:

  进一步假设随机干预的作用,即干预组和控制组的初始条件是一致的,并且这两组接受干预之后也会得到同样结果。于是,我们可以得到如下两个等式18和19:

  等式20表明,我们对于多单位因果关系的估计,可以通过比较干预组和控制组的结果来对所有单位根据潜在结果模型计算的因果关系进行一致性和无偏估计,这样潜在结果模型中“缺损数据”或“反事实”问题得以解决。这也意味着,在随机实验的背景下,对干预组与控制组之间差值与潜在结果模型计算的差值一致。而一旦随机实验不成立,也即等式18和等式19的假设不成立,则通过比较干预组和控制组之间差值来计算因果关系则面临基准偏差(Baseline Bias)和差别化干预效应偏差(Differential Treatment Effect Bias)问题(Morgan&Winship,2015)。基准偏差意味着干预组和控制组在原始状态方面存在差异,这是由于选择性偏差造成,而选择性偏差产生的根本原因是分配机制(Assignment Mechanism),这意味着等式18的假设不成立。差别化干预效应偏差则意味着干预组和控制组对于干预本身的效果反应不一致,很有可能因为干预组的原初状态比较好,这使得他们接受干预所产生的效果好于控制组如果接受干预时产生的效果作用大,这也意味着等式19的假设不成立。

  稳定单位干预价值假设从广义上看既包含受干预的个体价值是否受其他个体的是否接受干预的影响,也包括分配机制也不会影响干预或控制对象的潜在结果,即可忽视的干预分配假设。例如,鲁宾(Rubin,1986:961)在评论贺兰(Holland,1986)的重要论文《统计与因果推理》时指出,他的潜在结果模型的核心假设是稳定单位干预价值假设,并指出这一假设的含义是:

  稳定单位干预价值假设是一个简单的先验假设,它强调无论分配干预t到单位u的机制是什么,以及无论其他单位接受什么样的干预,单位u受到干预t的影响而形成的价值Y总是相同的。

  很显然,这一假设中既包含了其他单位接受干预时对接受干预的单位没有影响的假设,也包含了分配机制对于潜在结果没有影响的假设。考虑到分配机制的重要性,在这里,我们将这两个假设分开讨论。事实上,后来鲁宾也分开讨论了这两个假设,他把后一个假设称为分配机制问题(Assignment Mechanism)。目前他将这一假设划分为没有干扰假设(No Interference)和没有隐藏的多样性干预假设(No Hidden Variations of Treatments),并将这一假设正式界定为(Imbens&Rubin,2015:11):

  任何一个单位的潜在结果不会因为其他单位接受干预而表现不同,对于每一个单位而言,没有不同形式或版本干预层次,这些不同层次干预会导致不同的潜在结果。

  对于没有干扰假设而言,以前面提到过的头痛吃阿司匹林为例,一个人吃药后的头痛状态的改善不受其他人是否吃药的影响。同样以劳动力市场的就业培训项目为例,一个人接受培训之后在市场中表现,不会受到其他人是否接受培训的影响,当然这里主要是假设就业市场和规模足够大,这一假设才能够成立。否则当很多人都接受了培训,市场容量有限,这有很可能使得培训本身因为其他人接受了培训而变得没有效果。在讨论鲁宾的稳定单位干预价值假设这一假设时,摩根和温希普(Morgan&Winship,2015)构造过一个稳定单位干预价值假设被违反的例子,见表4:

  表4所展示的两组干预模式,对于第一组干预模式而言,只有一个对象接受干预,其他对象没有接受干预,这样干预的净效果为2。对于第二组干预模式而言,有两个对象接受干预,一个对象属于控制组,对于这一干预模式而言,由于违反了稳定单位干预价值假设,使得因为干预对象增多而干预的净效果减少,干预的净效果从2减少到1。

  鲁宾所主张的稳定单位干预价值假设的第二项内容主要是指一个对象,要么接受干预,要么接受控制,在干预层面只有两种选择,即积极干预和消极干预,没有不同种类和层次的干预。以头痛吃阿西匹林为例,只有吃一个剂量干预,没有吃两个剂量或半个剂量干预。这一假设主要是为了研究方便。当然,在实际社会中,这一假设通常也会被违背。我们很有可能既想知道干预是否有效果,也想知道什么样的干预最有效果,这就会出现多价值的干预(Many-Valued Treatments),见表5。例如,面对就业培训项目时,我们会采取不同培训模式,我们既想知道培训是否有效果,还想知道哪一种培训更有效果。

  对于稳定单位干预价值假设的违背,通常会有两种模式:一是影响模式(Influence Pattern),它强调接受干预群体之间相互影响会对潜在结果产生影响;另一种是分散或集中模式(Dilution/Concentration Pattern),这主要是由受干预群体的比例产生(Morgan&Winship,2015:50)。目前哈佛大学另外一名教授泰勒·范德韦勒(Tyler J.Vander Weele)(Vander Weele,2015)就专门讨论了存在互动(Interaction)情况时的因果推理解释,这很显然是对违反稳定单位干预价值假设情景下的因果推理的深入和系统研究。

  分配机制(Assignment Mechanism)是潜在结果模型的重要内容之一,有关这一机制的假设也构成了潜在结果模型的另外一个重要假设。这主要是因为分配机制直接决定研究对象或单位哪些接受干预,哪些接受控制,正是因为分配机制使得“潜在结果”可实现化。一般而言,分配机制使得我们只能够观测到干预组和控制组的一种状态,用数学符号表达见等式21:

  对于每一组接受干预或控制的组,他们还存在一组潜在结果,但是这些结果在现实中不能够观测到,他们是缺损数据,参见等式22:

  这样,我们可以分别用Yobs和Ymis来表达每一个单位的实际观测到的结果和另外一个被观测到的潜在结果,见等式23:

  可忽视的干预分配假设意味着在考虑共变量X的情况下,对参与者进行干预或控制的分配不会影响潜在结果,分配机制不会对接受干预或不接受干预的结果产生任何影响。用数学符号表达,见等式24:

  从本质上看,可忽视的干预分配假设强调在通过分配机制将所有单位分配干预或控制之后,如果重新改变分配机制,将原有接受干预的单位转化为控制组,将原有接受控制的单位转化为干预组,这不会影响接受干预或控制的潜在结果,即等式18和19成立,或者等式25成立:

  可忽视的干预分配假设又被鲁宾称为非混淆分配机制(Unconfounded Assignment),即分配与否,除了共变量外,不会影响潜在结果。很显然,随机实验可以满足可忽视的干预分配假设,它既可以实现原初状态相同,也可以实现分配机制对于潜在结果没有影响。而一旦不能够实现随机实验,则潜在结果和共变量都会影响一个单位是进入干预组还是控制组,这也意味着“分配机制”向“选择机制”(Selection Mechanism)转变。对此,赫克曼作出了突出贡献,他试图将选择机制内在化,发展了二阶段模型(Two-Stages Model)。从广义上看,整个社会科学就是解决选择性偏差问题,实现可忽视的干预分配假设。

  通过对分配机制的分类,可以重新对不同研究进行定义,尤其是重新对实验研究(Experiment Research)和观察研究(Observation Research)进行定义,从而使得潜在结果模型成为整个社会科学研究的统一模型。这样,实验研究和观察研究是潜在结果模型中同一谱系中不同类别,两者之间可以因为潜在结果模型这一桥梁而建立紧密联系,这也是鲁宾(Rubin,1974)在1974年发表的有关潜在结果模型开创性论文的意图所在。不同理论研究,只是分配机制的差异,在本质上仍然可以使用潜在结果模型来思考因果关系,并进行因果推理。

  鲁宾(Imbens&Rubin,2015:34)给分配机制下了一个正式定义,认为分配机制是一个行列转换的函数,它通过对所有研究单位赋予干预(1)和控制(0)值,每一种不同排列组合方式的总和概率是1。在此基础上,他进一步提出了单位分配概率(Unit Assignment Probability),其含义是一个单位接受干预的概率,一旦一个单位接受干预的概率计算出来,那么它接受控制的概率也随之清晰。

  在此基础上,他又进一步提出了对分配机制的三种限制,或者说分配机制可能拥有的三种属性,并以这些属性为基础对实验研究与观察研究进行了定义。这三种属性是:

  个体化分配(Individualistic Assignment)。这一属性强调一个单位是否接受干预不受其他单位的分配及其结果影响,它要求每一个单位接受干预或控制的概率应该在[0,1]之间。这一个体化分配的假设可能会在某些情况下被违背,如在选择后续实验对象时主要依据前一组实验结果,或者前一组接受干预或控制的结果。

  概率分配(Probabilistic Assignment)。这一属性强调一个单位是否接受干预或控制,其概率严格限制在[0,1]之间。每一个单位既有被分配进入干预组的可能,又有被分配进入控制组的可能,不能够被人为决定分配结果。

  非混淆分配(Unconfounded Assignment)。这一属性与上一部分讨论过的可忽视的干预分配假设一致,强调分配机制对潜在结果没有影响。没有混淆分配也是分配机制特别强调的属性,它构成了不同研究之间差异的重要基础。

  这样,以分配机制的这三个属性为基础,鲁宾将所有研究分为三类:随机实验与经典随机实验、正常分配机制(Regular Assignment Mechanism)的观察研究、不正常分配机制的观察研究。随机实验遵循的分配机制具有两个基本特征:一是概率分配,每一个单位是否接受干预符合概率原则;二是分配机制本身有一个明确的函数形式,并且这一函数是由研究者控制。而经典随机实验(Classical Randomized Experiment)除了满足随机实验的特征外,它还要求分配机制具有个体化属性,并且非混淆分配。这说明,经典随机实验需要满足分配机制的三个基本属性。对于观察研究,保罗·罗森鲍姆(Paul R.Rosenbaum)(Rosenbaum,2002,2010)曾经有过经典定义,他指出:观察研究是对干预、政策或暴露以及他们产生的效果的经验调查,但是它不同于实验,这主要是由于调查者不能够控制干预的分配。鲁宾也强调了这一点,他指出不知道分配机制的函数形式,那么它就属于观察研究。而在不知道分配机制的函数形式的情况下,如果观察研究仍然满足分配机制的三个属性,即个体化分配、概率分配和非混淆分配,则该观察研究属于正常分配机制的观察研究。而不符合这些特征的则属于不正常分配机制的观察研究。

  潜在结果模型为社会科学中因果推理研究提供了一种新的认知视角和探究方法,它是一场认识论和方法论革命。认知论的革命会加快社会科学的因果推理探究过程,让人类更好地理解自身社会的运行逻辑。与此同时,潜在结果模型也推动了研究方法的革命,由于要寻找“缺损数据”,这使得它十分强调匹配(Matching)和倾向值分析(Propensity Score Analysis)对于因果推理的重要性。潜在结果模型重新推动了社会科学对于实验研究的关注,并且从实验研究的视角出发从事观察研究,思考观察研究如何向实验研究靠拢,将实验研究和观察研究纳入统一的分析框架。随机实验通常被称为研究的黄金法则,潜在结果模型则从理论的角度证明了随机实验对于因果推理的重要性,认为随机实验可以解决潜在结果模型中“缺损数据”问题。目前实验研究正在成为社会学、政治学、经济学、公共政策学等各学科的重要方法,并且发展了实验室实验(Lab Experiment)、实地实验(Field Experiment)和社会实验(Social Experiment)等不同实验方法和程序。更为重要的是,潜在结果模型让观察研究基于随机实验的思路,讨论如何通过设计和数据分析让观察研究接近实验研究,从而提升观察研究的内部效度和外部效度,这使得观察研究从传统上的“回归时代”走向“实验时代”,也使得实验研究成为社会科学研究中的重要方法。

  潜在结果模型也成为社会科学中因果推理的重要判断标准和参照系,它是衡量因果推理科学性和有效性的准则。一旦社会科学中因果推理符合潜在结果模型的逻辑,那么该因果关系的有效性会提升。而有一些研究可能并不符合潜在结果模型,则其因果关系本身是受到怀疑的。例如,从潜在结果模型的角度看,著名的罗德悖论(Lord’s Paradox)本身并不是真正的悖论,因为他们的研究设计主要是前后对比,没有找出另外一个潜在结果,并不是真正的因果推理,所以结论也就不成立。接下来,将分别阐述潜在结果模型在计量经济学、社会学、公共管理/政策学等学科的应用情况。

  因本斯和杰弗里·伍德里奇(Jeffrey M.Wooldridge)(Imbens&Wooldridge,2009)对近20年中有关项目评估的计量经济学(The Econometrics of Program Evaluation)进行了回顾。他们认为潜在结果模型(或鲁宾因果模型)是这些研究进展的基础,并指出了潜在结果模型的五个应用途径,即:敏感性分析(Sensitivity Analyses,SA)、边界分析(Bounds Analysis,BA)、工具变量(Instrumental Value,IV)、断点回归(Regression Discontinuity,RD)和双重差分(Difference-in-Difference,DID)。他们并根据分配机制的类型将这些研究划分为三类,即:随机实验(随机分配);倾向值分析(Propensity Score Analysis,PSA)、敏感性分析和边界分析(基于非混淆分配,以及对非混淆分配假设的放宽);工具变量、断点回归和双重差分(基于不可见的选择分配)。在一篇最新的讨论本科生计量经济学的论文中,约书亚·安格里斯特(Joshua D.Angrist)和尤恩-斯特芬·皮施克(Jrn-Steffen Pischke)提出计量经济学教学应该遵循设计路径(Design Based Approach),而不是模型驱动的路径(Model-Driven Approach),指出模型驱动路径的计量经济学已经过时,设计路径计量经济学应该成为教学的主要内容,他们(Angrist&Pischke,2017:126)认为:“设计路径强调单一方程工具变量估计,断点回归方法,双重差分的差异性,与此同时关注由这些基本工具估计的因果关系的特殊威胁。”

  国内学者也开始认识到潜在结果模型对于计量经济学的重要性,并且倡导基于微观计量经济学定量评估中国经济政策,提升政策决策的科学化水平(洪永淼,2015,2016;洪永淼等,2016)。洪永淼等(2016:128)认为微观计量经济学和政策评估是计量经济学最重要的前沿进展之一,它强调“因果分析与政策效应评估是经济分析最为关注的核心问题,其主要难点在于经济事件与经济政策的内生性问题,以及虚拟事实(Counter factuals)的不可观测性”。最近,国内学者赵西亮(2017)撰写了基于潜在结果模型的计量经济学教材,重点讨论了因果推理的识别策略,包括:线性回归、匹配方法、工具变量化、面板数据方法、断点回归设计等。

  中国的社会学研究者也开始重视因果推理中潜在结果模型,目前主要讨论倾向值分析和工具变量对于因果推理的意义(胡安宁,2012,2017;陈云松,2012)。中国社会学研究者在引入潜在结果模型时,也开始反思因果关系,认为社会研究中应该重视因果关系,并且讨论了理论、定性研究和定量研究在因果关系中的地位和作用(王天夫,2006;陈云松,2012)。不过,这些对因果关系的讨论仍然是建立在休谟和密尔有关因果关系的理论基础之下,还没有引入潜在结果模型。胡安宁(2012,2017)是社会学中明确引入潜在结果模型的学者,他使用“反事实框架”的语言,讨论了倾向值分析的历史与逻辑,并将倾向值分析与断点回归、工具变量等进行了比较。陈云松(2012)则从潜在结果模型的角度讨论了工具变量在社会学研究中的应用,认为工具变量是社会科学定量分析中解决内生问题的重要手段,是基于调查数据进行因果推断的前沿方法。总体而言,中国的社会学研究引用潜在结果模型及其研究设计才刚刚起步,未来存在广阔的发展空间。

  实验政治科学的一个重要方面是促进了实验方法对于政治问题的研究,并形成了一些有意义的结论。德鲁克曼等(Druckman etal.,2011)编辑的实验政治科学手册中,将实验方法应用于政治科学的研究划分为:决策(态度变化实验、有意味或无意味的信息处理、政治知识)、投票选择、候选人评估和投票人数(候选人印象和评估、媒体和政治、候选人宣传、投票人动员)、人际关系(信任与社会交换、公民审议、社会网络与政治环境)、身份、民族和政治(候选人性别、民族身份、偏见、少数民族)、民主和行为(集体行动理论、立法投票、选举与战略投票、民主与发展)、精英讨价还价(联盟、协调与中介、外交决策等)。由此可见,实验政治科学已经广泛涉及政治研究的不同二级学科,并且尤其是在政治心理学、投票行为和立法行为中有较多研究。

  潜在结果模型在公共政策研究中得到广泛应用,正在形成基于因果推理、实验方法和研究设计的政策评估研究领域(Shadish etal.,1991)。事实上,在潜在结果模型提出之前,唐纳德·坎贝尔(Donald T.Campbell)(Campbell,1969,1979,1991)就表达了从实验途径来对政策效果进行评估,并倡导“作为改革的实验”(Reformsas Experiments)和“实验社会”(Experimental Society)。在此基础上,坎贝尔及其团队系统地发展了基于实验和准实验设计的因果推理理论,其中重视研究设计是他们探讨因果推理的核心观点(Shadish etal.,2002)。他们(Shadish etal.,2002)认为实验是探讨可操作的因素的效果,如限速政策是否减少死亡率,班级规模是否会影响学生成绩等,他们将研究区分为随机实验、准实验、自然实验和相关研究等四类,并提出了判断实验中因果推理有效性的四个标准,即内部效度(Internal Validity)、外部效度(External Validity)、建构效度(Construct Validity)和统计效度(Statistical Validity)。

  与潜在结果模型在政策评估研究中的广泛应用相比,它在公共管理研究的应用刚刚起步(Margetts,2011;Bkgaard etal.,2015;Anderson&Edwards,2015;Bouwman&Grimmelikhuijsen,2016)。当然,有学者在20世纪90年代就开始倡导公共管理中的实验研究,但是这一途径并没有被该共同体学者群体所接受(Bozeman&Scott,1992)。奥利弗·詹姆斯(Oliver James)等研究者(James etal.,2017)最近刚编辑了《公共管理研究中的实验:挑战和贡献》一书,试图为公共管理实验研究提供了一个统一框架、方法路径和研究示范,这必将对推动公共管理学中实验研究发挥重要作用。在这本著作中,他们按照四个部分组织:第一部分公共管理研究中实验兴起的背景,重点讨论了公共管理研究中实验途径的一些古典根源,并对研究进展进行了系统回顾;第二部分提出了公共管理实验研究的方法,在这一部分中他们提出了以因果推理中潜在结果模型为基础,重点关注实验室实验、实地实验和调查实验等三种实验设计在公共管理研究中的作用,没有关注准实验和自然实验;第三部分则是应用实验方法对公共管理研究中一些实质性议题,如工作激励、领导、繁文缛节、官僚制、绩效管理、政府透明、公民满意度、公民参与、监督、非营利等话题进行了研究;第四部分则是对实验研究的一些问题与未来挑战进行了展望。与此同时,国内学者也开始介绍公共管理研究中的实验方法,并尝试进行探索性研究(马亮,2015;景怀斌,2015;陈少威等,2016;余莎等,2015;耿曙等,2016)。总体而言,潜在结果模型倡导的其他研究设计,如倾向值分析、工具变量、间断回归、双重差分分析等,则还处于萌芽之中。

  潜在结果模型是统计学上因果推理革命,它开创了统计学研究因果推理的新境界,具有划时代的意义。从某种程度上看,它也使得统计学从回避因果关系到重新开始讨论因果关系,并形成了广泛的争论(Pearl etal.,2016)。潜在结果模型因为其逻辑的清晰性、内容的明确性和方法的科学性,正在成为因果推理的“正统理论”。

  潜在结果模型强调对同一单位同时接受不同干预的比较而得出一个干预相对于另一个干预的因果关系,通常一个干预是积极干预,被称之为干预,另一个是消极干预,又称之为控制。潜在结果模型得以成立需要依赖两个关键假设,一个是稳定单位干预价值假设,它强调被干预的单位或对象之间不会有交互关系;另一个是可忽视的干预机制假设,它强调在一定情景下,分配机制不会对潜在结果产生影响。由于潜在结果是由分配机制决定,这使得分配机制在潜在结果模型中具有突出作用。分配机制是区分不同研究的重要依据。

  潜在结果模型正在对统计学、经济学、社会学、生物医学等各个学科产生广泛而深远的影响。不过,中国学者对此关注不多,只有少数论文讨论该模型的方法问题,但是对于该模型还没有系统和深入介绍、引进和研究(胡安宁,2012)。很显然,这会阻碍中国社会科学发展进程。中国社会科学要在因果推理中有更多进步,就需要加入这场寻找因果推理的理论基础的学术研究进程中。

http://duchtech.com/tongjituili/354.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有