数据科学

✍ dations ◷ 2024-12-22 13:59:26 #数据科学
数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。1997年11月,吴建福 发表了题为“统计=数据科学?”的就任演讲, 因为他被任命为密歇根大学的 H. C.卡弗教授。 在这次演讲中,他将统计工作描述为数据收集、数据建模和分析以及决策制定的三部曲。 在他的结论中,他开创了“数据科学”(而非“计算机科学”)这个术语的现代用法,并提倡将统计学重命名为数据科学,而统计学家则应重命名为数据科学家。 后来,他发表了题为“统计=数据科学?”的演讲,作为他1998年的首个 P. C. 马哈拉诺比斯纪念演讲。 这些讲座是为了纪念印度科学家、统计学家和印度统计学院 (英语)创始人P. C. 马哈拉诺比斯 (英语)。2001年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《Data Science Journal》及《The Journal of Data Science》分别于2002年与2003年发行;2005年9月,美国国家科学基金会发表了《长存的数字数据收集:使21世纪的研究与教育成为可能》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师与程序员,跨学科专家,保管员以及专业注释者,图书馆员,档案馆员和其他人员,这些人对数字数据收集的成功管理至关重要。” 2008年 Jeff Hamerbatcher 与 DJ Patil circa 分别在 Facebook、LinkedIn 领导全球第一支数据科学团队,至此数据科学越来越被广泛流行,并应用到公共卫生、市场、金融、社会等各个领域。数据科学家这个职位的头衔则是1997年吴建福的报告 "Statistics = Data Science?"中首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并进行统计推断的统计学家。2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。2012年,数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

相关

  • 浮力浮力是指物体在流体(液体和气体)中受到的力,方向与其所受重力相反。浮力来自各表面受流体(液体和气体)压力的差(合力)。浮力的单位是牛顿(N)。相传叙拉古赫农王让工匠替他做了一顶纯
  • 青霉素V青霉素V钾,英文名Phenoxymethylpenicillin Potassium(INN), 又名苯氧甲基青霉素。是于1947年研制而成的天然青霉素。
  • 黑色素黑色素是生物色素,是酪胺酸经过一连串化学反应所形成,动物、植物与原生生物都有这种色素。黑色素通常是以聚合的方式存在。在黑色素细胞中,酪氨酸经酪氨酸酶作用,羟化生成多巴,后
  • 中部Middle America,常译作“(美国的)心脏地带”“(美国的)小镇价值”“半个美国”“美国中产阶级”“中间美国”“中美”“中部美国”,是美式英语中的一句俗语,用于描述地理上的美国大
  • 辅助T细胞辅助T细胞(T helper cells, Th),又称为助手型T细胞,是一种T细胞(白细胞的一种),它的表面有抗原受体,可以辨识抗原提呈细胞的MHC-II类分子呈献的抗原片段。一旦受到抗原刺激,Th细胞就
  • InChI国际化合物标识(InChI,英语:International Chemical Identifier)是由国际纯粹与应用化学联合会和国家标准技术研究所联合制定的,用以唯一标识化合物IUPAC名称的字符串。国际化合
  • 菲利库迪岛菲利库迪岛是意大利的岛屿,位于西西里岛以北的提雷尼亚海,属于埃奥利群岛的一部分,长5.4公里、宽3.1公里,面积9.5平方公里,最高点海拔高度774米,2001年人口235。坐标:38°34′N 14
  • 西哥特人西哥特人(拉丁语:Visigothi),港、台译作西哥德人,是东日耳曼部落的两个主要分支之一,另一个分支是东哥特人。在民族大迁移时期,是摧毁罗马帝国的众多蛮族中的一个。公元4世纪西哥特
  • 自主自主权(希腊语:νόμος; αὐτονομία; αὐτόνομος,英语:Autonomy,直译为“法”、“自我设置并约束自我的法律”),也称自治权、自决权,是一种广泛存在于道德、政治
  • 联结主义联结主义是认知科学领域的一种方法,期望能够以人工神经网络 (ANN)来解释心灵现象。联结主义的中心原则是使用,简单且经常一致的单元互联网络,来描述心理现象。不同模型的联结及单