数据科学

✍ dations ◷ 2025-06-27 16:30:00 #数据科学
数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。1997年11月,吴建福 发表了题为“统计=数据科学?”的就任演讲, 因为他被任命为密歇根大学的 H. C.卡弗教授。 在这次演讲中,他将统计工作描述为数据收集、数据建模和分析以及决策制定的三部曲。 在他的结论中,他开创了“数据科学”(而非“计算机科学”)这个术语的现代用法,并提倡将统计学重命名为数据科学,而统计学家则应重命名为数据科学家。 后来,他发表了题为“统计=数据科学?”的演讲,作为他1998年的首个 P. C. 马哈拉诺比斯纪念演讲。 这些讲座是为了纪念印度科学家、统计学家和印度统计学院 (英语)创始人P. C. 马哈拉诺比斯 (英语)。2001年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《Data Science Journal》及《The Journal of Data Science》分别于2002年与2003年发行;2005年9月,美国国家科学基金会发表了《长存的数字数据收集:使21世纪的研究与教育成为可能》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师与程序员,跨学科专家,保管员以及专业注释者,图书馆员,档案馆员和其他人员,这些人对数字数据收集的成功管理至关重要。” 2008年 Jeff Hamerbatcher 与 DJ Patil circa 分别在 Facebook、LinkedIn 领导全球第一支数据科学团队,至此数据科学越来越被广泛流行,并应用到公共卫生、市场、金融、社会等各个领域。数据科学家这个职位的头衔则是1997年吴建福的报告 "Statistics = Data Science?"中首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并进行统计推断的统计学家。2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。2012年,数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

相关

  • 医院医院是治疗和护理病人的机构,也兼做健康检查、疾病预防等。在越南语的汉越词,日语,韩语及台湾话等也称为病院。是由专业分工的医院职员通过医学检查、检验、治疗等设备提供医疗
  • 冥古宙冥古宙(Hadean),又称冥古代,是太古宙前的一个时期,可分为隐生代、盆地群代、酒神代和雨海代。开始于地球形成之初,结束于38亿年前,但依据不同的文献可能有不同的定义。冥古宙最初是
  • 活性物质原料药(英文:API, Active Pharmaceutical Ingredients),又称活性药物成分,由化学合成、植物提取或者生物技术所制备,但病人无法直接服用的物质,一般再经过添加辅料、加工,制成可直接
  • 口臭口臭指人张开口时发出的臭味,普遍视为一个表面的病征。其起因可以有很多种,大多来自口腔的问题,例如蛀牙和牙周病,亦有可能因为扁桃腺结石,或因为吃了味浓的食物(如蒜头、洋葱、肉
  • 呼吸频率过度换气综合症(英语:Hyperventilation syndrome,简称:HVS、 chronic hyperventilation syndrome (CHVS)、dysfunctional breathing hyperventilation syndrome),是由过快或过深的
  • 循证医学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学实证医学(英语:Evidence-based medicine
  • 人类解剖学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学人体解剖学(英语:anthropotomy或human a
  • 比较心理学异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
  • 实验心理学异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
  • 差分方程在数学上,递推关系(recurrence relation),也就是差分方程(difference equation),是一种递推地定义一个序列的方程:序列的每一项目是定义为前一项的函数。像户口调查映射(logistic map