差分隐私

✍ dations ◷ 2025-04-26 12:57:50 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 古菌分类表本表以LPSN网站的分类为基础(当前版本2007年3月29日),本分类代表原核生物分类的权威杂志IJSEM的分类系统,同时参考NCBI Taxonomy,但目前其它中文维基分类表可能依照其它标准,请注
  • B06ACA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码B06(其它血液学药剂)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Coll
  • 阿维斯陀语阿维斯陀语(Avestan)是一种古老的印欧语言,属于伊朗语支的东伊朗语,亦是波斯古经《阿维斯陀》成书时所使用的语言。“阿维斯陀”一词与印度的“吠陀”相似,所以有语言学家认为这
  • 礼亲王和硕礼亲王(满语:ᡥᠣᡧᠣᡳᡩᠣᡵᠣᠩᡤᠣ ᠴᡳᠨ ᠸᠠᠩ,穆麟德:Hošoi doronggo cin wang,太清:Hoxoi doronggo qin wang;“礼”音译“多隆乌”,意为“有礼的、端庄的”),清朝世袭
  • 增城增城区(官方音译:Zengcheng,传统外文:Tsengshing、Tsang Shing)是中国广东省广州市市辖区。增城建县于东汉建安六年(201年),因南海郡原辖六县,新设一县,增多一城,故名“增城”;1993年12
  • 马尔默大学马尔默大学(瑞典语:Malmö universitet),是一所位于瑞典第三大城市马尔默的综合性大学,建立于1998年7月1日。
  • 阿伊莎·宾特·侯赛因公主努尔王后陛下阿莉亚公主殿下穆娜公主殿下穆罕默德王子殿下 塔吉德王妃殿下菲雅王妃殿下哈桑王子殿下 莎瓦王妃殿下巴丝玛公主殿下阿里王子殿下 莉玛王妃殿下亚森王子殿下 珊
  • 雄尚站雄尚站(韩语:웅상역)是朝鲜民主主义人民共和国罗先特别市先锋郡雄尚劳动者区的一个铁路车站,属于咸北线。咸北线
  • 联合太平洋铁路4014号机车联合太平洋铁路4014号机车是一台巨人号蒸汽机车,也是目前世界上最大的现役蒸汽机车。该机车由位于纽约州斯克内克塔迪的美国机车公司(ALCO)为联合太平洋铁路制造,1941年11月下线
  • 花田光花田光(1958年9月12日-)是日本男性声优,经纪公司为大泽事务所。岐阜县出身。血型是A型。身高171cm。体重68kg。1999年2006年2008年2011年2015年2017年2018年2019年2020年2002年2