差分隐私

✍ dations ◷ 2025-11-18 12:35:17 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 二氧化碳二氧化碳(IUPAC名:carbon dioxide,分子式:CO2)是空气中常见的化合物,由两个氧原子与一个碳原子通过共价键连接而成。空气中有微量的二氧化碳,约占0.04%。二氧化碳略溶于水中,形成碳酸
  • 负离子负离子可能是指:
  • 无穷小演算无穷小演算(infinitesimal calculus )是微积分学的早期名称,由莱布尼茨和牛顿在17世纪60年代,在像巴罗和笛卡尔这样的数学家的工作基础上各自独立发展出来。它包括了微分演算
  • 管风琴参见参见参见管风琴 ·管风琴(英语:Pipe organ)是一种流传于欧洲的大型气鸣式键盘乐器,也是世界上体积最大的乐器,距今已有2200余年的历史。管风琴通过送风设施送风,吹响音管,并配
  • Washington State University华盛顿州立大学(英文:Washington State University、简称WSU)是美国华盛顿州资助办理的一所研究型大学,也是该州的赠地大学。它的主校位于华盛顿州东部的普尔曼,而在斯波坎、三城
  • 尾随尾随是一种常见的社会工程学手法。通常是指尾随者利用另一合法受权者的识别机制,通过某些检查点,进入一个限制区域。该行为可能是合法或非法的、授权的或未经授权的,视情况而定
  • 嘻哈乌龙院《嘻哈乌龙院》是在《乌龙院四格漫画》的基础上制作的动画短片,在腾讯播出。华漫兄弟(天津)互动娱乐有限公司用Flash形式制作。总裁李儒奇说“国内的动漫产业往往只重视作品
  • 儒化儒化,即儒家化或儒教化,指受到儒家或儒教的意识型态影响,而产生的文化转变,在这个文化转变的过程中,培养出对于儒家意识型态的文化认同。自汉朝开始,儒家思想影响到中国文化的各层
  • 坐粮厅坐粮厅,应是机构,但通作官名,满,汉各一人,由各部院郎中、员外郎内简用,每二年更换一次。并有经承十八人。坐粮厅分设东,南,西,北四科及河税科,收支科,铜科,白粮科等单位,分掌验收漕粮及由
  • 亚洲运动会宣布开幕者列表亚奥理事会一共有五个综合性赛事分为亚洲运动会亚洲冬季运动会亚洲室内暨武艺运动会亚洲沙滩运动会亚洲青年运动会。从2005年开始几乎每一年都会有亚奥理事会赛事,赛会的开幕