差分隐私

✍ dations ◷ 2025-11-21 09:53:22 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 隔离在医疗保健设施(英语:health care facilitiess)中的隔离是指为了达到感染控制(英语:infection control)的目的,需进行的多个方法之一:预防感染性疾病(英语:contagious disease)由患者身
  • 海城海城县,可以指:
  • 日本裁判所 */?)。日语的“裁判所”即汉语所称的法院。在日本法律中,“裁判所”有广义狭义两种含义。狭义的“裁判所”是指诉讼法上的“裁判所”,即在每个案件中行使审判权的合议庭或者
  • 最终幻想IV系列角色列表最终幻想IV系列角色列表列出了电子游戏《最终幻想IV》中的登场角色。由史克威尔(现史克威尔艾尼克斯)发行的角色扮演游戏《最终幻想IV》大量的人物设计为天野喜孝负责。《最终
  • 约翰尼·卡森约翰·威廉·卡森(英语:John William Carson,1925年8月23日-2005年1月23日),昵称强尼·卡森(Johnny Carson),生于美国爱荷华州柯宁,著名节目主持人,曾主持国家广播公司(NBC)深夜时段著
  • 阿贝尔·费拉拉阿贝尔·费拉拉(英语:Abel Ferrara;1951年7月19日-)是旅居罗马的美国电影工作者,他执导的电影以激进与争议题材闻名。阿贝尔·费拉拉出生在布朗克斯一个信奉天主教的爱尔兰与意大
  • 凯特·纳什凯特·玛丽·纳什(英语:Kate Marie Nash,1987年7月6日-) 出生于伦敦哈罗,是一位英国创作歌手兼演员,在英国2007年以一曲休眠热歌(Sleeper hit)《Foundations》 开始逐渐知名。她的首
  • 曹申吉曹申吉(1635年-1680年),字锡馀,别号澹馀,清初大臣,山东安丘县城东关人。祖父曹铨,官光禄寺丞;父曹复植为弟子员,早亡;兄曹贞吉。申吉八岁能文,十七岁中举人。顺治十二年(1655年)中进士,选内
  • 阜平县阜平县是河北省保定市下辖的一个县。位于河北省中西部。据《河北现名考源》记载,“阜”为“盛”,县名寓“兴盛平安”之意。县政府驻阜平镇北街,距离省会石家庄大约96公里远。宋
  • 伊朗省份伊朗有31个省;每个省都有一个省长,由国家内政部长委任。在1950年以前,伊朗只有12个省。1950年,伊朗改革行政区划,将原有的12个省改为10个。1960年以后,一些地区被提升到省级地位,伊