幽灵数据

✍ dations ◷ 2025-01-09 19:49:30 #幽灵数据

幽灵数据(英语:Ghost data), 是指从数据科学、统计学角度处理我们一般看不见的数据,量子成像或幽灵成像,“暗物质”或“暗能量”及其在计算机视觉领域中的新发现,甚至还包括与文物资料、经历等相关的认知数据。

在量子场论的术语中,幽灵(英语:Ghost_(physics))(ghost)、幽灵场(ghost field)或规范幽灵(gauge ghost)是规范场论中的非物理状态。在局部场超过多个物理自由度的情况下,必须使幽灵保持理论的不变性。在数据科学、统计学、计算机等术语中,幽灵数据包括为数字幽灵(digital ghost), 虚拟数据(如仿真数据、虚拟病人)、缺失数据、伪造数据、高度稀疏数据,及其他类似数据。令人容易联想到的是缺失数据。由于缺失机制(可忽略或不可忽略、随机缺失或非随机缺失等)的不同,处理方法也不尽相同。除了缺失数据,幽灵数据还包括其他看不见的数据。这些数据可能是因为部分人员能够感知而其他人不能感知的数据。

幽灵数据由John Sall和Dennis Lin教授率先在系列邀请报告中阐述。幽灵数据广泛存在于各种历史记录的数据中,包括记录的日记、照片、录音、视频,甚至存储在化石和文物等中的记忆信息。尽管这些文物仅记录部分表面特征,但是一部分人能感知其相关的更多的信息,而其他人不能感知到那些信息。能够感知更多信息的人就能构建部分并近似复制其整个生活过程。例如,在文物虚拟修复方面,数据科学家与文物专家的合作,能够能更多地存储其记录,并还原它们所携带的记忆信息。随着技术的进步,将能为原始生活提供完美复制品。

幽灵数据常包括幽灵成像、虚拟数据、缺失数据、伪造数据、仿真数据、“暗物质”、高度稀疏数据,及其他类似数据。令人容易联想到的是缺失数据。由于缺失机制的不同,处理方法也不尽相同。数据缺失可以分为随机缺失(missing at random, MAR)和非随机缺失(Missing not at random, MNAR)。缺失数据处理方法主要包括使用样本抽样推断、贝叶斯推断和似然法推断等。对于实验设计,随机完全区块设计也会遇到缺失问题。不完整均衡区块设计也可被当成随机完全区块设计带有缺失数据进行统计分析。


相关

  • 昆阳之战昆阳之战,是中国新朝于公元23年(地皇四年,更始元年)时发生的一场内战战役。以绿林军为主体的刘秀军,在昆阳县(今河南省叶县)大破新朝王莽四十余万主力部队。昆阳之战的结果不仅仅直
  • 09I型核潜艇09I型核潜艇(北约代号:“汉级”,英文:)是中华人民共和国研制的第一种核潜艇,1970年起陆续建成服役,共建造5艘,部署在中国人民解放军海军北海舰队。目前该型艇仍有三艘在役。中国核
  • 第5太阳周期第5太阳周期是从1755年开始纪录太阳黑子活动以来的第5个太阳周期 。这个周期开始于1798年5月,结束于1810年12月,持续了12.6年。在这个周期内的最大平滑黑子数(超过12个月期间
  • 黑森-卡塞尔伯国方伯国 黑森-卡塞尔伯国(德语:Landgrafschaft Hessen-Kassel),或称黑森-卡塞尔方伯国,简称黑森-卡塞尔,是神圣罗马帝国其中一个邦国。作为伯国,黑森-卡塞尔实际上直接辖属帝国皇帝(
  • 震旦构造期震旦构造期,简称震旦期,是元古宙震旦纪至古生代早寒武世(6.80-5.13亿年前)之间的构造期,在此期间,在今中国及周边地区发生了震旦运动或称震旦事件。震旦期是以震旦纪命名的。震旦
  • 孟菲斯·德佩孟菲斯·德佩(荷兰语:Memphis Depay,1994年2月13日-)是一名荷兰足球运动员,司职边锋、中锋及辅锋,目前效力于法甲俱乐部里昂。2012年,由于其父亲几乎不曾出现在他的生活中,所以孟菲斯
  • 我们的动物邻居《我们的动物邻居》是一部2019年中国大陆纪录片,是第四届北京纪实影像周的开幕影片。本片展现了北京城中各种动物如:雨燕、乌鸦、鸊鷉的生存实况。
  • 黄薇 (1964年)黄薇(1964年-),北京人,中国电视节目主持人、演员,现为中国中央电视台主持人,亦作为特型演员多次扮演邓颖超。毕业于中国传媒大学。1964年,黄薇出生于北京市的一个高级干部家庭,他的父
  • 戈瓦戈瓦(1922年-1992年),全名戈瓦扎木苏,笔名道润梯步、甲乙木,男,蒙古族,内蒙古奈曼旗人,中国历史学家、翻译家、教育家,曾任中国史学会理事。
  • 塞尔索·埃斯基韦尔塞尔索·埃斯基韦尔(西班牙语:Celso Esquivel,1981年3月20日-),巴拉圭男子足球运动员,司职后卫。他曾代表巴拉圭国奥队参加2004年夏季奥林匹克运动会足球比赛,获得一枚银牌。Template:2004年美洲杯足球赛巴拉圭队阵容