文化组学

✍ dations ◷ 2025-06-08 11:09:48 #计算语言学,2010年代创造的新词语

文化组学(英语:culturomics)是指通过电子化文本的量化分析研究人类行为与文化趋势的计算词典学(英语:computational lexicology)方法。研究者对海量数字档案进行数据挖掘以研究人们使用的语言与词汇,进而揭示其中反应出来的文化现象。“文化组学”一词是2010年创造的新词,由英文中的“文化”(culture)与“组学”(omics)二词合并而成,当年《自然》上发表的《通过海量电子化书籍对文化进行量化分析》()一文首次提出了该词。论文的作者为哈佛大学学者让-巴蒂斯特·米歇尔(Jean-Baptiste Michel)与埃雷兹·利柏曼·埃登(Erez Lieberman Aiden)。

米歇尔与埃登还参与了Google实验室的项目Google Ngram Viewer(英语:Google Ngram Viewer)。这个项目通过n元语法(n-gram)分析Google图书中的数据,以展示语言中的文化模式随时间的变化。

相关

  • 印度尼西亚2019冠状病毒病印度尼西亚疫情,介绍在2019新型冠状病毒疫情中,在印度尼西亚发生的情况。截至24日,目前共有新增确诊个案107例,累积确诊病例升至686例。 印度尼西亚政府发言人尤
  • 低纬纬度(φ)是地球表面一个点的南北地理位置的表示法。纬度与经度通常一起使用以确定地表上某点的精确位置。纬度是一个角度,其范围从赤道的0度到南北极的90度。在英文文本中,纬度
  • 塔尔图大学塔尔图大学(爱沙尼亚语:Tartu Ülikool;拉丁语:Universitas Tartuensis)位于爱沙尼亚塔尔图,由瑞典国王古斯塔夫二世于1632年设立。她是欧洲最古老的大学之一,具有超过380年的历史,2
  • 截角三角化四面体截角三角化四面体是一种凸多面体,共有16个面,由五边形和六边形所组成,其中五边形有四种,每种有三个,并以四面体边和面之关系排列,原属于四面体顶点的部分则为六边形这是构造一个截
  • 易危物种易危物种(英文:Vulnerable species,多写作为VU)是世界自然保护联盟濒危物种红色名录中其中一个保护现状分类。其指现存一些快成为濒危物种的生物,例如是受到环境因素的影响及在中
  • 黄辉祥黄辉祥(印尼语:Michael Bambang Hartono,1939年10月2日-),印度尼西亚(印尼)华裔商人、运动员。他在1963年父亲黄渭源(英语:Oei Wie Gwan)逝世后与胞弟黄辉聪(英语:Robert Budi Hartono)继
  • 索德诺木曾杜·额尔登索德诺木曾杜·额尔登(Содномзундуйн Эрдэнэ,Sodnomzundui Erdene,1963年-)生于蒙古国乌兰巴托市,蒙古国政治人物。1984年毕业于综合军事学院。1994年获得敖特
  • 周法尚周法尚(556年-614年),南朝陈、北周、隋朝大臣,字德迈,汝南郡安成(今河南省汝南县)人。南朝陈大臣周炅的次子,陈武帝的外孙。年十八,为始兴王陈叔陵中兵参军,随即加封伏波将军。陈太建八
  • 边贡《边尚书华泉公像》,现藏山东省博物馆边贡(1476年-1532年),字廷实,号华泉,山东济南府历城县(今属济南市)人。明朝官员、诗人、文学家。弘治丙辰进士,累官南京户部尚书。边贡文学成就卓
  • 艾成艾成(英文名:Eison,1982年5月13日-),本名蔡艾成,马来西亚华人,出生于马来西亚砂拉越州古晋,马来西亚男歌手,三立电视与台视《超级偶像》第一季踢馆者及第二季总冠军。曾于2004年发行个