差分隐私

✍ dations ◷ 2025-12-03 19:56:02 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 安乃近安乃近(英文名 Metamizole Sodium;Metamizole、dipyrone、Sulpyrine),,一种解热镇痛药,1920年被德国 Hoechst AG公司合成,1922年开始批量生产。由氨基比林、甲醛和亚硫酸钠缩合得到
  • 威尔特郡威尔特郡(英语:Wiltshire,英文简称:Wilts),英国英格兰西南区域的名誉郡和单一管理区。以人口计算,索尔茲伯里是第1大(亦是唯一一个)城市;斯温登是第1大镇、特罗布里奇是第2大镇(亦是郡
  • 铀-铅测年铀铅测年法是放射测年法中最早使用且准确度最高的测年方式,可测定距今100万年到45亿年的物体年代,例定精确度大约是测定范围的1%至10%。铀铅测年法依赖两个独立的衰变链,即半衰
  • 加利福尼亚淘金热“加利福尼亚州淘金潮”(California Gold Rush)(1848年-1855年),于1848年1月24日开始,事源是在沙特磨坊发现黄金。一开始消息传播得较慢,主要是当地人开始淘金,但到1849年消息传开后,
  • 箴言箴言是旧约圣经诗歌智慧书的第三卷,意思是智慧的话,教导人如何行事为人。 (《箴言》第1章第1节参-《箴言》第9章第18节参)。这部分是一首连载诗,由若干段父亲劝勉儿子的简短训话
  • 折从阮折从阮,五代时的军事家、政治家,半独立的藩镇,历事后唐迄后周四朝。河东道云中(今山西省大同市)人,生于唐大顺二年(891年),卒于后周显德二年(955年)。初名从远,字可久,为了避后汉高祖刘知
  • 2010年中国足球超级联赛2010年中国足球协会超级联赛(由于赞助原因,亦被冠名为2010倍耐力中超联赛)是自2004年中国足球超级联赛创立以来,由中国足球协会主办的第7届中超联赛,也是自1994年中国足球职业化
  • 玛丽公主 (黑森和莱茵)玛丽公主,全名玛丽·维多利亚·费奥多尔·利奥波汀(德语:Prinzessin Marie Viktoria Feodore Leopoldine von Hessen und bei Rhein,1874年5月24日-1878年11月16日),是黑森和莱茵大
  • 汪燮卿汪燮卿(1933年2月-),浙江龙游人,石油加工专家,中国工程院院士。
  • 布雷瑟湖坐标:53°40′55.75″N 12°7′31.00″E / 53.6821528°N 12.1252778°E / 53.6821528; 12.1252778布雷瑟湖(德语:Breeser See),是德国的湖泊,位于该国东北部,由梅克伦堡-前波美拉