数据科学

✍ dations ◷ 2025-11-20 10:05:47 #数据科学
数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。1997年11月,吴建福 发表了题为“统计=数据科学?”的就任演讲, 因为他被任命为密歇根大学的 H. C.卡弗教授。 在这次演讲中,他将统计工作描述为数据收集、数据建模和分析以及决策制定的三部曲。 在他的结论中,他开创了“数据科学”(而非“计算机科学”)这个术语的现代用法,并提倡将统计学重命名为数据科学,而统计学家则应重命名为数据科学家。 后来,他发表了题为“统计=数据科学?”的演讲,作为他1998年的首个 P. C. 马哈拉诺比斯纪念演讲。 这些讲座是为了纪念印度科学家、统计学家和印度统计学院 (英语)创始人P. C. 马哈拉诺比斯 (英语)。2001年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《Data Science Journal》及《The Journal of Data Science》分别于2002年与2003年发行;2005年9月,美国国家科学基金会发表了《长存的数字数据收集:使21世纪的研究与教育成为可能》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师与程序员,跨学科专家,保管员以及专业注释者,图书馆员,档案馆员和其他人员,这些人对数字数据收集的成功管理至关重要。” 2008年 Jeff Hamerbatcher 与 DJ Patil circa 分别在 Facebook、LinkedIn 领导全球第一支数据科学团队,至此数据科学越来越被广泛流行,并应用到公共卫生、市场、金融、社会等各个领域。数据科学家这个职位的头衔则是1997年吴建福的报告 "Statistics = Data Science?"中首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并进行统计推断的统计学家。2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。2012年,数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

相关

  • 蚜虫包括10个科:蚜虫(英语:aphid,又称腻虫或蜜虫)是一类植食性昆虫,种类包括蚜总科(又称蚜虫总科,学名:Aphidoidea)下的所有成员。目前已经发现的蚜虫总共有十个科约4,400种,其中多数属于蚜
  • 营养营养(英语:nutrition)指食物中包含的热量及其他有利健康的成分。营养学是解释食物中营养素和其他物质与生物体的维持,生长,繁殖,健康和疾病相互作用的科学。人以及多数动物摄入食
  • 耐受免疫耐受(英语:immune tolerance或immunological tolerance)是指免疫系统对特定抗原的特异性无应答状态。免疫耐受包括天然免疫耐受与诱导免疫耐受。天然免疫耐受或自身耐受(sel
  • 青哌环素青哌环素(“Penimepicycline”和“mepicycline penicillinate”皆为其国际非专利药品名称)又称为“青哌四环素”或“青霉素V甲哌四环素”。青哌环素是一种能与tRNA结合,从而达
  • 密西西比河密西西比河(英语:Mississippi River),位于北美洲中南部,是北美最大的水系,流域面积约为300万平方千米。它也是北美最长的河流,源头在美国明尼苏达州西北部海拔446米的艾塔斯卡湖(英
  • 幼童幼儿也称为幼童,是人类发展的阶段之一。可能包括学步期(英语:toddlerhood)及之后,一直到学龄前的一段时间,此一阶段也常称为是玩耍期(Play age);是儿童阶段中较前期的部分。在心理学
  • 高压釜高压釜(英语:Autoclave,亦称为高壓滅菌釜、高压灭菌器、加压釜或加压灭菌器)是用水蒸汽的高温高压对物品进行灭菌处理的装备。通常的处理条件是在高压饱和蒸汽121摄氏度下处理15
  • 健忘性失忆症(Amnesia,来自希腊语ἀμνησία),又称失忆症候群(amnesic syndrome),是一种记忆混乱的疾病。简单来说就是丧失记忆,包含丧失部分记忆或丧失全部记忆。失忆症的成因包括器
  • 常染色体体染色体又称常染色体,是指染色体组中除性染色体之外的染色体。例如人类的23对染色体中,有22对是常染色体,余下的一对是X染色体和/或Y染色体组成的性染色体。
  • Saussure, Ferdinand de弗迪南·德·索绪尔(法语:Ferdinand de Saussure,1857年11月26日-1913年2月22日),生于日内瓦,瑞士语言学家。索绪尔是现代语言学之父,他把语言学塑造成为一门影响巨大的独立学科。他