差分隐私

✍ dations ◷ 2025-04-04 20:14:08 #密码学理论,信息隐私

差分隐私(英语:differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库(英语:Statistical database)查询时,最大化数据查询的准确性,同时最大限度减少识别其记录(英语:Row (database))的机会。

设想一个受信任的机构持有涉及众多人的敏感个人信息(例如医疗记录、观看记录或电子邮件统计)的数据集,但想提供一个全局性的统计数据。这样的系统被称为统计数据库。但是,提供有关数据的综合性统计也可能揭示一些涉及个人的信息。事实上,当研究人员链接两个或多个分别无害化处理的数据库来识别个人信息时,各种公共记录匿名化的特殊方法都失效了。而差分隐私就是为防护这类统计数据库脱匿名技术而形成的一个隐私框架。

举例来说,2006年10月,Netflix提出一笔100万美元(英语:Netflix Prize)的奖金,作为将其推荐系统改进达10%的奖励。Netflix还发布了一个训练数据集供竞选开发者训练其系统。在发布此数据集时,Netflix提供了免责声明:为保护客户的隐私,可识别单个客户的所有个人信息已被删除,并且所有客户ID已用随机分配的ID 替代。

Netflix不是网络上唯一的电影评级门户网站,其他网站还有很多,包括IMDb。个人可以在IMDb上注册和评价电影,并且可以选择匿名化自己的详情。德克萨斯州大学奥斯汀分校的研究员Arvind Narayanan(英语:Arvind Narayanan)和Vitaly Shmatikov将Netflix匿名化的训练数据库与IMDb数据库(根据用户评价日期)相连,能够部分反匿名化Netflix的训练数据库,危及到部分用户的身份信息。

卡内基梅隆大学的Latanya Sweeney(英语:Latanya Sweeney)将匿名化的GIC数据库(包含每位患者的出生日期、性别和邮政编码)与选民登记记录相连后,可以找出马萨诸塞州州长的病历。

MIT的De Montjoye等人引入了单一性(英语:Unicity distance)(意为独特性(英语:uniqueness))概念,显示出4个时空点、近似地点和时间就足以唯一性识别一个150万人流动数据库中的95%用户。该研究进一步表明,即使数据集的分辨率较低,这些约束仍然存在,即粗糙或模糊的流动数据集和元数据也只提供很少的匿名性。

至今为止,比较知名的采用差分隐私的应用如下:

相关

  • 异无腔动物门异无腔动物(Xenacoelomorpha)是包括异涡虫和无腔动物的简单生物。这种分类的依据是分子生物学资讯与衍徴。异无腔动物演化枝包含无腔动物与异涡虫,在演化树上的具体位置有多种
  • 米尔则亚耶夫沙夫卡特·米罗莫诺维奇·米尔济约耶夫(俄语:Шавкат Миромонович Мирзиёев;1957年7月24日-)是一位乌兹别克斯坦政治人物,现任乌兹别克斯坦总统。1996年
  • 国立高雄大学国立高雄大学(英语:National University of Kaohsiung,缩写:NUK),简称高大,位在中华民国台湾高雄市楠梓区,是一所2000年成立的国立大学。于2006、2007、2015~2016年荣获中华民国教育
  • 埃万杰利斯塔·托里切利埃万杰利斯塔·托里切利(意大利语:Evangelista Torricelli,又译托里拆利,1608年10月15日-1647年10月25日),意大利物理学兼数学家,以发明气压计而闻名。气压单位托(torr)以他的名字命名
  • 南蒂罗尔考古学博物馆南蒂罗尔考古学博物馆(德语:Südtiroler Archäologiemuseum; 意大利语:Museo archeologico dell'Alto Adige)是意大利北部南蒂罗尔首府博尔扎诺一个专业的考古学博物馆。博物馆
  • 2015年德国羽毛球黄金大奖赛2015年德国羽毛球黄金大奖赛为第58届德国羽毛球公开赛,是2015年世界羽联大奖赛的其中一站。本届赛事于2015年2月24日至3月1日在德国米尔海姆RWE-Sporthalle举行,并获得尤尼克
  • 雄狮美术《雄狮美术》是台湾一本创刊于1971年3月的美术月刊,曾获得1976年金鼎奖,发行人为李贤文。初期是免费刊物,从第5期开始才改为一本新台币5元(一年订户新台币50元)。由于该本刊物在
  • 何占豪何占豪(1933年8月29日-),浙江诸暨人,中国音乐家。出生于浙江诸暨何家山头村的农民家庭,父为绍兴剧演员,自幼受越剧迷的祖母影响,爱好越剧。毕业于浙江省杭州高级中学。1950年考入浙
  • 乔治·安德鲁·赖斯纳小乔治·安德鲁·赖斯纳(George Andrew Reisner Jr. 1867年11月5日-1942年6月6日)是美国的一名专门研究古埃及和周边地区的学者,做过许多金字塔相关的研究。他出生于美国印第安
  • 家庭数据中心家庭数据中心(family data center),是由路由器厂商提出的一种云家庭概念,以狭义物联网的方式将家庭内电子产品通过无线(有线)网络设备构建出一个小型数据中心,数据中心包含各联网电