差分隐私

✍ dations ◷ 2025-11-20 09:15:49 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 亚美利哥·维斯普西亚美利哥·韦斯普奇(意大利语:Amerigo Vespucci,1454年3月9日-1512年2月22日)是佛罗伦萨商人、航海家、探险家和旅行家,美洲(全称亚美利加洲)是以他的名字命名的。他经过对南美洲东
  • 抗痉挛药物解痉药(antispasmodic、抗痉挛药物、同义词:镇痉剂(spasmolytic))是一种抑制肌肉痉挛的药物,或药草。解痉药的一种类型用于平滑肌收缩,尤其是在胃肠道的管状器官。其效果是防止
  • α-亚麻酸α-亚麻酸(α-次亚麻油酸, 英语:α-Linolenic acid, ALA)是有三个双键的多元不饱和脂肪酸(C18H30O2),是一种ω-3必需脂肪酸。α-亚麻酸在紫苏籽油中占70%,在亚麻籽油中占55%,在沙棘
  • 恐龙的体型恐龙的体型将目前已知的不同恐龙生物群中,最大、最重与最小的成员列表出来。备注:这个列表并不包含未公布的化石。恐龙的体重估计值比身长估计值变化范围更大,因为使用已灭绝动
  • 79年
  • 欧洲新闻台欧洲新闻台(Euronews)是一家以多语种播放的欧洲跨国新闻电视台,于1993年1月1日开播,其总部位于法国里昂。从欧洲的角度来报道国际新闻。欧盟每年为该电视台提供500万欧元的资金
  • .fm.fm为密克罗尼西亚联邦国家及地区顶级域(ccTLD)的域名。著名线上音乐网站last.fm、douban.fm(豆瓣电台)均为此域名使用者,取其调频(FM)广播之意。A .ac .ad .ae .af .ag .ai .al
  • 4 in Love (专辑)《4 In Love》是Cookies重组后的第三张及最后一张专辑,于2004年12月18日发行,共收录十首新歌。2005年2月16日推出限量版,加送一片VCD。
  • 花月正春风《花月正春风》是中华电视公司(华视)播出的八点档电视剧,播出时间是1986年4月3日至1986年5月14日,制作人是邓育昆、邓育庆,主演包括了蓝毓莉、张琼姿、石修、石峰、张魁、王珏、
  • 阮廷询 (进士)阮廷询(越南语:Nguyễn Đình Tuân/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-