差分隐私

✍ dations ◷ 2025-11-30 18:00:46 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 自然哲学自然哲学是现代自然科学的奠基,主要是思考人对于的自然界的哲学问题--包括自然界和人的相互关系、人造自然和原生自然的关系、自然界的最基本规律等。这当中不少理论,都奠下了
  • 脸颊(拉丁语:buccae)是指眼睛下部,鼻子周围到左右耳的表面部分。具体是指人类和哺乳动物面部皮肤直到下巴的部分,并且在眼睛和颧骨的下部内形成了口腔侧壁。在脊椎动物亚门中,脸颊
  • 惠更斯-菲涅耳原理惠更斯-菲涅耳原理(英语:Huygens–Fresnel principle)是研究波传播问题的一种分析方法,因荷兰物理学者克里斯蒂安·惠更斯和法国物理学者奥古斯丁·菲涅耳而命名。这个原理同时适
  • 统计评估局中国人民解放军军徽中央军委战略规划办公室统计评估局,位于北京市,是中央军委战略规划办公室下属局,负责统计评估工作。在深化国防和军队改革中,2016年1月组建中央军委战略规划
  • 玉米笋玉米笋,又称珍珠笋,是玉米在吐丝授粉前的幼嫩果穗,因外形细长,上尖下粗,类似竹笋,故名玉米笋。一般是将玉米笋中的玉米及软的玉米秆一起吃。若玉米成熟后,玉米秆太硬无法供人类食用
  • 开通通榆县位于中国吉林省西北部,是白城市下辖的一个县。清光绪三十年(1904年)九月初四日,设立开通县,隶属盛京将军洮南府;1915年11月1日,设立瞻榆县,隶属奉天省洮昌道。1958年10月16日,
  • 克里斯汀·芭伦斯基克里斯汀·珍·芭伦斯基(英语:Christine Jane Baranski,1952年5月2日-),美国电视剧与舞台剧女演员,曾获得一座艾美奖与两座东尼奖。其演出作品有《傲骨贤妻》()、《生活大爆炸》()等。
  • 贡山小檗贡山小檗(学名:)为小檗科小檗属下的一个种。
  • 彻克默彻克默(匈牙利语:Csökmő)是匈牙利豪伊杜-比豪尔州的一个村。面积约68.97平方千米(6,897公顷),2013年预测人口1,925。
  • 乔治·赫比格乔治·霍华德·赫比格(英语:George Howard Herbig,1920年1月2日-2013年10月12日),美国天文学家,任职于夏威夷大学天文研究所。以发现赫比格-哈罗天体而闻名。赫比格在洛杉矶加利福