倾向评分匹配

✍ dations ◷ 2025-07-27 12:35:12 #倾向评分匹配

倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据。在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,一般常用于医学、公共卫生、经济学等领域。以公共卫生学为例,假设研究问题是吸烟对于大众健康的影响,研究人员常常得到的数据是观察研究数据,而不是随机对照实验数据(Randomized Controlled Trial data),因为吸烟者的行为和结果,以及不吸烟者的行为和结果,是很容易观察到的。但如果要进行随机对照实验,招收大量被试,然后随机分配到吸烟组和不吸烟组,这种实验设计不太容易实现,也并不符合科研伦理。这种情况下观察研究是最合适的研究方法。但是面对最容易获得的观察研究数据,如果不加调整,很容易获得错误的结论,比如拿吸烟组健康状况最好的一些人和不吸烟组健康状况最不好的一些人作对比,得出吸烟对于健康并无负面影响的结论。从统计学角度分析原因,这是因为观察研究并未采用随机分组的方法,无法基于大数定理的作用,在实验组和对照组之间削弱混杂变量的影响,很容易产生系统性的偏差。倾向评分匹配就是用来解决这个问题,消除组别之间的干扰因素。

倾向评分匹配法适用于两类情形。第一,在观察研究中,对照组与实验组中可直接比较的个体数量很少。在这种情形下,实验组和对照组的交集很小,比如治疗组健康状况最好的10%人群与非治疗组健康状况最差的10%人群是相似的,如果将这两个重合的子集进行比较,就会得出非常偏倚的结论。第二,由于衡量个体特征的参数很多,所以想从对照组中选出一个跟实验组在各项参数上都相同或相近的子集作对比变得非常困难。在一般的匹配方法中,我们只需要控制一两个变量(如年龄、性别等)即可,就可以很容易从对照组中选出一个拥有相同特征的子集,以便与实验组进行对比。但是在某型情形下,衡量个体特征的变量会非常多,这时想选出一个理想的子集变得非常困难。经常出现的情形是,控制了某些变量,但是在其他变量上差异很大,以至于无法将实验组和对照组进行比较。

倾向评分匹配通过使用逻辑回归模型来决定评分。

相关

  • 詹庆元詹庆元(1970年-),男,中国内科学博士,教授,博士生导师。研究方向为呼吸与危重症医学。现任中日友好医院主任医师。1993年毕业于华西医科大学医学院,获临床医学学士学位。毕业后在北京
  • 吉森尤斯图斯-李比希大学吉森大学,全称吉森尤斯图斯-李比希大学(德语:Justus-Liebig-Universität Gießen,缩写为JLU),是一所位于德国黑森州吉森的公立大学,1607年由黑森-达姆施塔特伯爵路德维希五世(德语:L
  • 以太网络以太网(英语:Ethernet)是一种计算机局域网技术。IEEE组织的IEEE 802.3标准制定了以太网的技术标准,它规定了包括物理层的连线、电子信号和介质访问层协议的内容。以太网是当前应
  • 截获核间谍指擅自向其他国家泄露有关核武器的国家机密。在核武器的历史上有许多已知的核间谍案件,也有不少怀疑或指控从事间谍活动的案件。核武器一般被视为是最重要的国家机密,因
  • 培植肉培植肉,亦作人造肉、人工肉、试管肉、清洁肉或合成肉,指任何并非从动物身上取得的肉类,而是透过生物工程培养动物的肌肉细胞而成。原理是先从动物体内抽取干细胞,再放进试管或培
  • 圣贝尼托圣贝尼托县(San Benito County, California)是美国加利福尼亚州的一个县,位于太平洋海岸山脉。面积3,605平方公里,根据美国2000年人口普查数字,共有人口53,234人。县治霍利斯特(Ho
  • 史星海史星海(1971年5月28日-),中国甘肃灵台人,作家,“皇甫谧文化”研究者,曾担任世界针灸学会联合会副秘书长。1998年,史星海撰写出版了纪实文学《性之魔:全球艾滋病追踪》。2005年,撰写出
  • 对头冤家《对头冤家》(英语:Nothing In Common)是一部1986年美国喜剧电影,由盖瑞·马歇尔执导,汤姆·汉克斯和杰基·葛里森主演,这是葛里森出演的最后一个电影角色,因为他患了晚期癌症。虽
  • 霍亨索伦统治者列表霍亨索伦位于今日德国的巴登-符腾堡州的士瓦本,德意志帝国时期是普鲁士王国的一个省。霍亨索伦的名称源于霍亨索伦家族,他们是勃兰登堡-普鲁士(1415年-1918年)及德意志帝国(1871
  • 高空槽高空槽是指在高空存在的低压槽,通常比地面的低压槽为明显。高空槽出现在对流层中层西风带上的短波槽。一年四季都会出现,一般春季出现较多。通常高空槽的波长是大约1000km,因槽前盛行温暖潮湿西南气流,造成云雨天气;槽后盛行干冷西北气流,天气晴朗。高空槽可分为三大类型,因高空槽与温度槽配合,得出三种不同形式的槽:后倾槽、垂直槽和前倾槽。