差分隐私

✍ dations ◷ 2025-12-08 13:40:11 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 苯乙烯苯乙烯也被称为乙烯基苯,是用苯取代乙烯的一个氢原子形成的有机化合物。室温下,苯乙烯是一种具有甜味的粘稠易挥发液体,但苯乙烯浓度过高时,气味就会变得令人不愉快。苯乙烯中,乙
  • 395年* 12月8日 前燕 镇南大将军陈留王慕容绍阵亡于参合陂之役(前燕太原王慕容恪幼子)
  • 即墨区即墨区为中国山东省青岛市所辖的一个市辖区。地处东经120°07′—121°23′,北纬36°18′—36°37′,濒临黄海,位于胶东半岛南部。“即墨”因故城(位于平度市古岘镇大朱毛村一带
  • 墨西哥狼墨西哥狼(Canis lupus baileyi)是狼的最为稀少及遗传上较疏离的亚种,分布在北美洲。墨西哥狼是狼最细小的亚种,最长只有1.2-1.5米,最高0.8米。重约27-37公斤。墨西哥狼主要猎食野
  • 巴士拉巴士拉(البصرة‎,al-Baṣrah),为伊拉克巴士拉省省会,位于底格里斯河和幼发拉底河交汇形成的夏台·阿拉伯河西岸,南距波斯湾110公里,是连接波斯湾和内河水系的枢纽,伊拉克第一
  • 迪迪埃·奎洛兹迪迪埃·帕特里克·奎洛兹(法语:Didier Patrick Queloz,1966年2月23日-),瑞士天文学家。他是剑桥大学的教授,也是剑桥三一学院的研究员,以及还是日内瓦大学的教授。 1995年,他与米歇
  • 富时中国A50指数富时中国A50指数是中国内地A股市场的一个指数,是富时中国指数系列的旗舰指数。包含了在上海或深圳证券交易所上市的股票中市值最大的50家A股公司。季度审核于每年的三月, 六
  • 锦云锦云(越南语:Cẩm Vân,1959年5月31日-),原名黄锦云(Hoàng Cẩm Vân),出生在西贡市第一郡。是一位拥有扎实唱功的越南歌手,长处是抒情,传统歌曲和音乐家郑公山的作品。锦云被认为是19
  • 吴匡时吴匡时(1883年-1944年),字应干,又名祖逖。江苏省嘉定县人。父吴宗濂,上海广方言馆、法国理科大学毕业,工科进士、翰林院庶吉士、巴黎理科博士,农商部工业试验所所长,商标登录局筹备处
  • 埃斯法拉延埃斯法拉延是伊朗的城市,位于该国东北部,由北呼罗珊省负责管辖,海拔高度1,244米,该市在易卜拉欣.阿夫沙尔管治时被彻底破坏,2010年人口55,970。