差分隐私

✍ dations ◷ 2025-11-28 01:11:28 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 人均寿命平均寿命、生命期望或预期寿命(英语:life expectancy),指生物群体中衡量单一生命存活平均长度的统计量。预期寿命最常用的测量方法是自出生起算(英语:Life expectancy at birth,LEB
  • 广岛大学广岛大学(日语:広島大学/ひろしまだいがく Hiroshima daigaku;英语译名:Hiroshima University),是日本一所国立综合大学,位于广岛县东广岛市,成立于1949年。广岛大学是广岛县唯一的
  • 最后的审判最后的审判(希伯来语:יום הדין‎;阿拉伯语:يوم القيامة‎;英语:Last Judgment),或者称为大审判、末日审判,是一种宗教思想,在世界末日之时神会出现,将死者复生并对他
  • span class=nowrapTh(SOsub4/sub)sub2/sub/span硫酸钍是一种无机化合物,化学式为Th(SO4)2,存在无水物、二水、四水、八水和九水合物。硫酸钍在很稀的水溶液中可以发生水解,产生碱式硫酸钍Th(OH)2SO4。硫酸钍可以由二氧化钍水
  • 邓弗里斯-加洛韦邓弗里斯-加洛韦(英语:Dumfries and Galloway),英国苏格兰地区的32个一级行政区之一。它地处苏格兰与英格兰的边界,南面与英格兰坎布里亚郡接壤。面积广大,在苏格兰仅此于两个高地
  • 酥油 (印度)酥油(印地语 घी,乌尔都语 گھی,旁遮普语 ਘਿਉ,克什米尔语 ग्याव/گیاو -来源是梵语 घृत "洒"之意;在埃及阿拉伯方言则是 سمنة,,意思是酥油或脂肪),古称醍醐,是印
  • 欧洲中部时间欧洲中部时间(英语:Central European Time,CET)是一个时区名称,比世界标准时间(UTC)早一个小时,在大部分欧洲国家和部分北非国家采用。冬季时间为UTC+1,夏季欧洲夏令时为UTC+2。下列
  • 古尔德古尔德可以指:
  • 马全马全(1732年-1773年),原名马瑔,字具堂,号绳斋,山西阳曲县人。清朝军事人物。乾隆年间两登武科殿试鼎甲,先取探花,后中状元。官至四川提督。随军进攻金川时战死。朝廷追谥壮节。马全本
  • 造父变星型振子造父变星型振子,1955年天文学家W.S。Krogdahl在天体物理学学报上发表《天体的搏动是一种极限环现象》。Krogdahl用下列非线性常微分方程组模拟造父变星的半径随时间的变化: