差分隐私

✍ dations ◷ 2025-11-19 13:27:36 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 肌肉系统肌肉系统(英语:Muscular System) 指身体的所有肌肉组织, 包括骨骼肌, 平滑肌和心肌,它参与动作的产生, 维持姿势及产生热量。
  • 泛音泛音是指分音列中除了基音以外的任何一音。当一根弦或空气柱整体振动而产生基音(第一分音)时,在该基音上发出的微弱的音。如果分成几段振动就会产生一些泛音(上方分音)。听者一般
  • 先兆先兆(英语:aura)是指癫痫开始发作之前患者的最先感觉。此时患者仍意识清醒,记忆完整。先兆的具体表现因人而异。根据患者事后描述,先兆常包括看到怪异的光、闻到难闻的气味或出现
  • 异形配子配子(英语:Gamete)是单倍体细胞,它由行有性生殖的生物在特定的器官通过减数分裂产生。两性配子通过配子结合 产生合子。有性生殖的好处是遗传讯息的重组,这也是物种内遗传信息的
  • 河迹湖河迹湖(英语:Oxbow Lake),又称牛轭湖、马蹄湖,是由于河流的变迁或改道,曲形河道自行截弯取直后留下的旧河道形成的湖泊。这类湖泊多呈弯月形水深较小。例如湖北省江汉平原地区,大小
  • Microsoft Message QueuingMicrosoft Message Queuing或MSMQ微软公司实现的一种消息队列,始于Windows NT 4与Windows 95。Windows Server 2016与Windows 10仍然包含这种组件。1999年起,Microsoft Embedd
  • 周恩平周恩平(Chou En-Ping,1985年10月12日-),是一名台湾男子轻艇运动员,台湾原住民阿美族人。2018年亚洲运动会他担任中华龙舟队队长。2018年亚洲运动会他和队员们在传统龙舟项目,200米
  • 盖塔拉洼地工程盖塔拉洼地工程或者简称为盖塔拉工程,是一个可在埃及实施的巨型工程概念,它可与阿斯旺高水坝相媲美,旨在通过在盖塔拉洼地创造一个人工湖来发电。 盖塔拉洼地是一个平均位于海
  • HTTP严格传输安全HTTP严格传输安全(英语:HTTP Strict Transport Security,缩写:HSTS)是一套由互联网工程任务组发布的互联网安全策略机制。网站可以选择使用HSTS策略,来让浏览器强制使用HTTPS与网
  • 杀人者《杀人者》(The Killers),美国作家海明威最著名的短篇小说,海明威在这部作品中实现他的“冰山理论”。背景在1920年代的美国伊利诺伊州库克县的Summit(英语:Summit, Illinois)村。