差分隐私

✍ dations ◷ 2025-11-27 15:49:50 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • Y染色体亚当Y染色体亚当(Y-chromosomal Adam),或称Y-MRCA,在遗传学上,由人类Y染色体DNA单倍型类群推测出的所有现存男性在父系上的最近共同祖先,从他遗传Y染色体。Y染色体亚当相对于线粒体夏
  • 胡人胡人,或称胡族,中国古代汉族对外族的称呼,主要是指欧亚大草原上的游牧民。该名称来源一说是匈奴人在历史上自称为“胡”,另有说法为鹘人的错写,因为草原游牧民族多有养鹰的传统,秦
  • 邵 峰邵峰(1973年-)是一位中国免疫学家。1973年生于江苏淮安,1996年毕业于北京大学技术物理系,1999年获中科院生物物理研究所分子生物学硕士,2003年获密歇根大学医学院生物化学博士。其
  • 吉林2019冠状病毒病吉林省疫情,介绍在2019冠状病毒病疫情中,在中华人民共和国吉林省发生的情况。截至2020年3月25日24时,吉林省全省有确诊病例95例,其中境外输入1例,治愈出院92例,死亡
  • You Am I乐队You Am I乐队,是一个来自澳洲悉尼的摇滚乐队,成员有Tim Rogers,Davey Lane,Rusell Hopkinson和ANdy Kent 他们暂时是澳洲唯一一队有3张大碟有拿个澳洲排行磅冠军。安德鲁.肯特
  • 河狸科河狸科(学名:Castoridae)是啮齿目河狸亚目(英语:Castorimorpha)的一个科,包含多种化石物种,最早出现于始新世晚期。本科共有四个亚科,绝大多数物种已灭绝,现生物种只有一个属(河狸属)共
  • 钋的同位素钋有25个已知的同位素,都具有放射性,目前已观测到的钋同位素质量数在186到227之间,其中有七个属于天然放射性的痕量元素,当中以210 Po最为稳定。备注:画上#号的数据代表没有经过
  • 迈克尔·波伦迈克尔·波伦(Michael Pollan,1955年2月6日-)是一位美国作家、专栏作家、行动主义者、新闻学教授及柏克莱加州大学科学和环境新闻学奈特项目的主任。普兰出生于美利坚合众国纽约
  • 诺恩语诺恩语属北日耳曼语支,是一种已经消失的语言,使用范围约为设德兰群岛、奥克尼群岛、苏格兰北部海岸及凯瑟尼斯。后来在15世纪时,这些岛屿被挪威抵押给苏格兰,便逐渐被低地苏格兰
  • 皮冻皮冻是一种用猪皮制成的食品。将新鲜猪皮除去脂肪及毛发,切成块或细丝,加入适量调味料(也可再加入干虾仁、花生碎等),用清水长时间熬煮,将其中的胶原蛋白熬煮出来,之后放入容器中冷