文化组学

✍ dations ◷ 2025-12-03 02:02:09 #计算语言学,2010年代创造的新词语

文化组学(英语:culturomics)是指通过电子化文本的量化分析研究人类行为与文化趋势的计算词典学(英语:computational lexicology)方法。研究者对海量数字档案进行数据挖掘以研究人们使用的语言与词汇,进而揭示其中反应出来的文化现象。“文化组学”一词是2010年创造的新词,由英文中的“文化”(culture)与“组学”(omics)二词合并而成,当年《自然》上发表的《通过海量电子化书籍对文化进行量化分析》()一文首次提出了该词。论文的作者为哈佛大学学者让-巴蒂斯特·米歇尔(Jean-Baptiste Michel)与埃雷兹·利柏曼·埃登(Erez Lieberman Aiden)。

米歇尔与埃登还参与了Google实验室的项目Google Ngram Viewer(英语:Google Ngram Viewer)。这个项目通过n元语法(n-gram)分析Google图书中的数据,以展示语言中的文化模式随时间的变化。

相关

  • 全字母句包含有字母表中所有字母并且言之成义的句子称为全字母句(英语:pangram或holoalphabetic sentence,希腊语:pan gramma(意为“每一个字母”))。全字母句被用于显示字体和测试打字机。
  • 印第安纳印第安纳州(英语:State of Indiana)是美国的一个州,它的首府是印第安纳波利斯。印第安纳原意是印第安人的土地的意思。它的缩写是IN。在美国,一个来自印第安纳州的人不被称为印第
  • 管家基因管家基因(英语:housekeeping gene),又名持家基因、看家基因或家务基因,是指在生物体内所有细胞中都表达,并且为维持细胞基本生命活动所需而时刻都在表达的高度保守的基因。
  • 内容分发网络内容分发网络(英语:Content Delivery Network或Content Distribution Network,缩写:CDN)是指一种透过互联网互相连接的电脑网络系统,利用最靠近每位用户的服务器,更快、更可靠地将
  • 榕城区榕城区是中国广东省揭阳市的一个市辖区,位于广东省的东南部、榕江平原中部、榕江流域中段,是揭阳市的中心市区,是揭阳市人口最为稠密的地区。总面积为91.26平方公里,2011年末全
  • 邢台大地震邢台大地震发生于1966年3月8日5时29分,震中位于河北省邢台隆尧县东,震级达里氏6.8级。震源深度10千米,震中烈度为9度,同年3月22日在宁晋县东南分别发生了6.7级和7.2级地震各一次
  • 三奈山柰(学名:)亦称三柰、沙姜、番郁金、三藾、山辣、土麝香、埔姜花,是一种姜科山柰属的植物。山柰为多年生宿根草本植物,地下具块状根状茎,有香气,无地上茎;少数基生卵圆形叶,叶柄下延
  • 亚当·汪德鲁斯卡亚亚当·汪德鲁斯卡亚(德语:Adam Wandruszka,1914年8月6日-1997年7月9日),出生于乌克兰利沃夫的历史学家和新闻记者。汪德鲁斯卡亚曾在维也纳当地及德国科隆的大学担任教授,曾出版的
  • 刘知白刘知白(1915年11月24日-2003年8月14日),原名刘庭坦,中国水墨画画家。刘知白于1933年就读于苏州美术专科学校,并师从于苏州美专中国画系系主任顾彦平。顾家是中国有名的大收藏家族
  • 夏井一季夏井一季(1957年(昭和32年)5月13日 - )是居住在日本爱媛县松山市的俳句诗人・随笔家。