倾向评分匹配

✍ dations ◷ 2025-11-04 07:22:45 #倾向评分匹配

倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据。在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,一般常用于医学、公共卫生、经济学等领域。以公共卫生学为例,假设研究问题是吸烟对于大众健康的影响,研究人员常常得到的数据是观察研究数据,而不是随机对照实验数据(Randomized Controlled Trial data),因为吸烟者的行为和结果,以及不吸烟者的行为和结果,是很容易观察到的。但如果要进行随机对照实验,招收大量被试,然后随机分配到吸烟组和不吸烟组,这种实验设计不太容易实现,也并不符合科研伦理。这种情况下观察研究是最合适的研究方法。但是面对最容易获得的观察研究数据,如果不加调整,很容易获得错误的结论,比如拿吸烟组健康状况最好的一些人和不吸烟组健康状况最不好的一些人作对比,得出吸烟对于健康并无负面影响的结论。从统计学角度分析原因,这是因为观察研究并未采用随机分组的方法,无法基于大数定理的作用,在实验组和对照组之间削弱混杂变量的影响,很容易产生系统性的偏差。倾向评分匹配就是用来解决这个问题,消除组别之间的干扰因素。

倾向评分匹配法适用于两类情形。第一,在观察研究中,对照组与实验组中可直接比较的个体数量很少。在这种情形下,实验组和对照组的交集很小,比如治疗组健康状况最好的10%人群与非治疗组健康状况最差的10%人群是相似的,如果将这两个重合的子集进行比较,就会得出非常偏倚的结论。第二,由于衡量个体特征的参数很多,所以想从对照组中选出一个跟实验组在各项参数上都相同或相近的子集作对比变得非常困难。在一般的匹配方法中,我们只需要控制一两个变量(如年龄、性别等)即可,就可以很容易从对照组中选出一个拥有相同特征的子集,以便与实验组进行对比。但是在某型情形下,衡量个体特征的变量会非常多,这时想选出一个理想的子集变得非常困难。经常出现的情形是,控制了某些变量,但是在其他变量上差异很大,以至于无法将实验组和对照组进行比较。

倾向评分匹配通过使用逻辑回归模型来决定评分。

相关

  • 不死长生不老,指寿命长而不会衰老。相近的辞汇还有长生不死(在安全无外力状况下拥有无限的寿命,但依旧会老化)、不老不死(在安全无外力状况下不会衰老与死亡)、不朽(Immortality)与永生(
  • 倚天屠龙记《倚天屠龙记》(英文:Heaven Sword and Dragon Sabre)为1978年邵氏电影公司出品,楚原执导的武侠电影。改编自金庸著名武侠小说倚天屠龙记。后有续作《倚天屠龙记大结局》及外传
  • 胡安·庞塞·德莱昂胡安·庞塞·德莱昂(西班牙语:Juan Ponce de León,1474年-1521年7月,生于西班牙巴利亚多利德,死于古巴哈瓦那),文艺复兴时期西班牙探险家,他参加了对伊斯帕尼奥拉的征服,后成为博里基
  • 2019冠状病毒病卡塔尔疫情2019冠状病毒病卡塔尔疫情,介绍在2019新型冠状病毒疫情中,在卡塔尔发生的情况。2020年2月27日,一批卡塔尔公民搭乘一架私人飞机由伊朗撤回国内。2月29日,卡塔尔确诊首例新冠肺
  • 蔡方荫蔡方荫(1901年4月27日-1963年12月13日),字孟劬,江西南昌人,中国土木建筑结构学家,中国科学院院士。蔡方荫于1925年毕业于清华学堂土木科。此后赴美留学,1928年获麻省理工学院土木工
  • 普扎蒂普扎蒂(Puzhathi),是印度喀拉拉邦Kannur县的一个城镇。总人口33470(2001年)。该地2001年总人口33470人,其中男性16484人,女性16986人;0—6岁人口3688人,其中男1948人,女1740人;识字率83
  • 卫生福利部台北医院火灾事故坐标:25°02′34″N 121°27′34″E / 25.042896°N 121.459559°E / 25.042896; 121.459559卫生福利部台北医院火灾事故,简称台北医院火灾、台北医院大火,是2018年8月13日凌晨
  • Theatre Academy戏剧学院公司(日语:株式会社テアトルアカデミー,英语:Theatre Academy Co., Ltd.)是日本一所综合演员培训机构及经纪公司。戏剧学院公司于1980年创建。其主要业务包括演员培训、
  • 贝奥武夫冰川坐标:.mw-parser-output .geo-default,.mw-parser-output .geo-dms,.mw-parser-output .geo-dec{display:inline}.mw-parser-output .geo-nondefault,.mw-parser-output .geo-multi-punct{display:none}.mw-parser-output .longitude,.mw-parser-output .latitude{white-space:n
  • 克里斯·布朗 (田径运动员)克里斯托弗·“克里斯”·布朗(英语:Christopher "Chris" Brown,1978年10月15日-),巴哈马田径运动员。克里斯·布朗在2000年奥林匹克运动会和2008年奥林匹克运动会获得400米接力赛铜牌和银牌。在2012年夏季奥林匹克运动会田径比赛,他与队友德米特里斯·品德、迈克尔·马修、拉蒙·米勒于4×400米接力赛摘下金牌。