数据科学

✍ dations ◷ 2025-12-02 07:31:08 #数据科学
数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。1997年11月,吴建福 发表了题为“统计=数据科学?”的就任演讲, 因为他被任命为密歇根大学的 H. C.卡弗教授。 在这次演讲中,他将统计工作描述为数据收集、数据建模和分析以及决策制定的三部曲。 在他的结论中,他开创了“数据科学”(而非“计算机科学”)这个术语的现代用法,并提倡将统计学重命名为数据科学,而统计学家则应重命名为数据科学家。 后来,他发表了题为“统计=数据科学?”的演讲,作为他1998年的首个 P. C. 马哈拉诺比斯纪念演讲。 这些讲座是为了纪念印度科学家、统计学家和印度统计学院 (英语)创始人P. C. 马哈拉诺比斯 (英语)。2001年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《Data Science Journal》及《The Journal of Data Science》分别于2002年与2003年发行;2005年9月,美国国家科学基金会发表了《长存的数字数据收集:使21世纪的研究与教育成为可能》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师与程序员,跨学科专家,保管员以及专业注释者,图书馆员,档案馆员和其他人员,这些人对数字数据收集的成功管理至关重要。” 2008年 Jeff Hamerbatcher 与 DJ Patil circa 分别在 Facebook、LinkedIn 领导全球第一支数据科学团队,至此数据科学越来越被广泛流行,并应用到公共卫生、市场、金融、社会等各个领域。数据科学家这个职位的头衔则是1997年吴建福的报告 "Statistics = Data Science?"中首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并进行统计推断的统计学家。2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。2012年,数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

相关

  • 原生生物界超类群与门以及众多不同分类会包括的分类单元原生生物(学名:Protist,发音: /ˈproʊtᵻst/)统称真核生物域中,不属于植物、动物和真菌,一般个体微小、多数为单细胞、有细胞核和原生
  • 嘧啶嘧啶(拼音:mì dìng,注音:ㄇㄧˋ ㄉㄧㄥˋ,粤拼:mat6 ding6,音同“密定”、分子式:C4H4N2、IUPAC命名:Pyrimidine)为1,3-二氮杂苯,是一种杂环化合物。嘧啶由2个氮原子取代苯分子间位上
  • 双螺旋双股螺旋由两条螺旋曲线相互缠绕而成。自然界中最常见的双股螺旋是核酸DNA。
  • 球状蛋白质球状蛋白质是一类蛋白质,它与纤维状蛋白质和膜蛋白共同构成按分子性状和溶解性分出的三个蛋白质子类。球状蛋白质一般呈球状,结构紧密,溶于水,长/宽 ≤ 3~4。
  • 阿片酊鸦片酊(Laudanum),又称阿片酊或劳丹酊,为一种鸦片类止痛剂,是含10%质量浓度的鸦片粉的酊剂,相当于1%浓度的无水吗啡。鸦片酊为红褐色液体,味极苦。历史上曾用鸦片酊治疗各种疾病,但
  • 布鲁塞尔– 欧盟(灰色及浅绿色)– 比利时(灰色)布鲁塞尔(法语:Bruxelles;荷兰语:Brussel)是比利时的首都和最大的城市,也是欧洲联盟的主要行政机构所在地。布鲁塞尔市位于布鲁塞尔-首都大区
  • 斯巴达坐标:37°4′55″N 22°25′25″E / 37.08194°N 22.42361°E / 37.08194; 22.42361斯巴达(希腊语:Σπάρτη,英语:Sparta),城邦本身名为拉刻代蒙(Λακεδαίμων, Lakeda
  • 当归当归(学名:Angelica sinensis),属伞形科的一种植物。一般作为药用。多年生草本植物,高0.4~1米。茎直立,有纵直槽纹,无毛。二或三回三出式羽状复叶,小叶卵形,浅裂或有缺刻。开白色花,复
  • 主题词索引典(英语:thesaurus),也称为叙词表或类语辞典,同义词辞典,是主题分析的一种实作方法。所谓主题分析是指辨识某作品之知识内涵,分析其特性,并使用某些文字、代号描述其主题。主题
  • 高尔顿·威拉德·奥尔波特高尔顿·威拉德·奥尔波特(Gordon Willard Allport,1897年11月11日-1967年10月9日)是一位美国心理学家。他出生于印地安纳州Montezuma,是弟兄四人中最年轻的一个。他的一位兄长弗