首页 >
数据科学
✍ dations ◷ 2025-04-02 13:00:18 #数据科学
数据科学(英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。1997年11月,吴建福 发表了题为“统计=数据科学?”的就任演讲, 因为他被任命为密歇根大学的 H. C.卡弗教授。
在这次演讲中,他将统计工作描述为数据收集、数据建模和分析以及决策制定的三部曲。 在他的结论中,他开创了“数据科学”(而非“计算机科学”)这个术语的现代用法,并提倡将统计学重命名为数据科学,而统计学家则应重命名为数据科学家。
后来,他发表了题为“统计=数据科学?”的演讲,作为他1998年的首个 P. C. 马哈拉诺比斯纪念演讲。 这些讲座是为了纪念印度科学家、统计学家和印度统计学院 (英语)创始人P. C. 马哈拉诺比斯 (英语)。2001年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《Data Science Journal》及《The Journal of Data Science》分别于2002年与2003年发行;2005年9月,美国国家科学基金会发表了《长存的数字数据收集:使21世纪的研究与教育成为可能》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师与程序员,跨学科专家,保管员以及专业注释者,图书馆员,档案馆员和其他人员,这些人对数字数据收集的成功管理至关重要。”
2008年 Jeff Hamerbatcher 与 DJ Patil circa 分别在 Facebook、LinkedIn 领导全球第一支数据科学团队,至此数据科学越来越被广泛流行,并应用到公共卫生、市场、金融、社会等各个领域。数据科学家这个职位的头衔则是1997年吴建福的报告 "Statistics = Data Science?"中首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并进行统计推断的统计学家。2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。2012年,数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。
相关
- 职业过劳根据世界卫生组织,职业过劳(英语:Burnout)是一种由慢性工作压力导致的症候群,症状包含“精神耗尽、对工作的心里距离增加、对工作的负面感觉、以及工作效率的减少”。职业过劳不
- 痳疯分枝杆菌麻风杆菌也称为韩森氏杆菌,是一种可引起麻风病的分支杆菌,菌体呈短小棒状或稍弯曲,长约2-6µm,宽约0.2-0.6µm,抗酸染色呈红色(抗酸性),革兰氏染色呈阳性,好氧菌。于1873年由挪威医生
- 钪3d1 4s22,8,9,2蒸气压第一:633.1 kJ·mol−1 第二:1235.0 kJ·mol−1 第三:2388.6 kJ·mol−1 (主条目:钪的同位素钪(Scandium),其命名Scandium源自斯堪的纳维亚半岛的拉丁文名称Sc
- 氨基糖氨基糖是一类羟基被氨基取代的糖类。有些氨基糖的衍生物如:N-乙酰氨基葡萄糖和唾液酸等也常被归于此类。氨基糖苷类抗生素通常由氨基糖分子和非糖部分的苷元结合而成,是一类抑
- 奶母乳,又称人乳、人奶,为产后妇女乳房产生的乳水,用于哺育婴儿,世界卫生组织亦推荐用母乳哺育六个月以下的婴儿,乳汁内含有碳水化合物、蛋白质、脂肪、维生素、矿物质、脂肪酸和牛
- 畸胎瘤畸胎瘤(英语:Teratoma)是一种常见的卵巢肿瘤,来源于多能性生殖细胞,发病率占全部卵巢原发性肿瘤的15%。畸胎瘤主要为实心或囊心、被膜包覆的肿瘤,在肿瘤中可以看到许多类似正常的
- 腺体腺(亦称腺体,旧称䐃)指动物机体能够产生特殊物质的组织,这种物质主要为激素(荷尔蒙),激素通过血液输送到体内或外分泌腺。腺体的归类方式很多,可以依照组织所在部位、功能(作用)划分,解
- 东亚人种蒙古人种东亚型,是蒙古人种在中国、日本、朝鲜半岛的分支。可分别为北支、中支、南支三种。北支:有高而窄的脸和鼻子,狭窄,细长的头骨,身材中高。分为三种亚型:
- Porter, R.S.罗伊·波特(1946年12月31日-2002年3月3日,英语:Roy Porter),英国历史学家,以其在医学史上的大量研究成果成名。2001年自伦敦大学卫康医学史研究中心退休。退休不满一年即心脏病发辞
- 精神决定论精神决定论(Psychical determinism)认为人的行为变化除环境与生理因素外,某些心理因素才是具有决定性的影响。此心理因素为泛指个人的知觉、意识、潜意识、习惯与信仰等,在这