数据仓库

✍ dations ◷ 2025-09-02 13:21:17 #数据仓库
在计算机领域,数据仓库(英语:data warehouse,也称为企业数据仓库)是用于报告(英语:Business reporting)和数据分析的系统,被认为是商业智能的核心组件。 数据仓库是来自一个或多个不同源的集成数据的中央存储库。数据仓库将当前和历史数据存储在一起,用于为整个企业的员工创建分析报告。存储在仓库中的数据从运行系统(例如营销或销售)上传。这些数据可能会通过一个ODS数据库,并且可能需要进行额外操作的数据清理,以确保数据质量(英语:data quality),然后才能在数据仓库中用于报告。典型的基于提取、转换、加载(ETL)的数据仓库使用分级、数据集成和访问层来存放其关键功能。分级层或分级数据库存储从每个不同的源数据系统中提取的原始数据。集成层通过转换来自分级层的数据,将不同的数据集合在一起,通常将转换后的数据存储在ODS数据库中。然后将集成的数据转移到另一个数据库(通常称为数据仓库数据库),在这个数据库中,数据被分为层次组(通常称为维度),并被分成事实和聚合事实。事实和维度的组合有时被称为星型模式(英语:star schema)。访问层帮助用户检索数据。数据的主要来源被清理、转换、分类,并提供给管理人员和其他商业专业人员用于数据挖掘、在线分析处理、市场研究和决策支持。 然而,检索和分析数据、提取、转换和装载数据以及管理数据字典的方法也被认为是数据仓库系统的基本组成部分。许多数据仓库的文献都使用了这个更广泛的语境。因此,数据仓库的扩展定义包括商业智能工具(英语:business intelligence tools)、提取、转换和加载数据到存储库的工具,以及管理和检索元数据的工具。数据仓库是一种信息系统的数据存储理论,此理论强调利用某些特殊数据存储方式,让所包含的数据,特别有利于分析处理,以产生有价值的信息并依此作决策。利用数据仓库方式所存放的数据,具有一但存入,便不随时间而更动的特性,同时存入的数据必定包含时间属性,通常一个数据仓库皆会含有大量的历史性数据,并利用特定分析方式,自其中发掘出特定信息。数据仓库 ,由数据仓库之父W.H.Inmon于1990年提出,主要功能乃是将组织透过信息系统之在线交易处理(OLTP)经年累月所累积的大量数据,透过数据仓库理论所特有的数据存储架构,作一有系统的分析整理,以利各种分析方法如在线分析处理(OLAP)、数据挖掘(Data Mining)之进行,并进而支持如决策支持系统(DSS)、主管信息系统(EIS)之创建,帮助决策者能快速有效的自大量数据中,分析出有价值的信息,以利决策拟定及快速回应外在环境变动,帮助建构商业智能(BI)。一般来说,数据仓库可由关系数据库,或专为数据仓库开发的多维度数据库创建,若由多维度数据库创建而成,其架构可分为星状及雪花状架构,包含数个维度数据表,及一个事实数据表。数据仓库的建制不仅只是信息工具技术面的运用,在规划和运行面更需对产业知识、营销管理、市场定位、策略规划等相关条件有深入的了解,才能真正发挥数据仓库以及后续分析工具的价值,提升组织竞争力。Operational data store(ODS)、数据仓库和数据超市三者相同之处在于均不属于任一OLTP系统,并且都是以数据导向的设计而非流程(process)导向。相异之处在于,ODS的特性较著重于战术性查询,变动性大。数据仓库通常为企业层级,用来解答即兴式、临时性的问题。而数据超市则较偏向解决特定单位或部门的问题,部分采用维度模型(dimensional model)。数据仓库可以作为数据挖掘和OLAP等分析工具的数据源,由于存放于数据仓库中的数据,必需经过筛选与转换,因此可以避免分析工具使用错误的数据,而得到不正确的分析结果。数据挖掘和OLAP同为分析工具,其差别在于OLAP提供用户一便利的多维度观点和方法,以有效率的对数据进行复杂的查询动作,其默认查询条件由用户预先设置,而数据挖掘,则能由信息系统主动发掘数据源中,未曾被查觉的隐藏信息,和透过用户的认知以产生知识。数据挖掘(Data Mining)技术是经由自动或半自动的方法探勘及分析大量的数据,以创建有效的模型及规则,而企业透过数据挖掘更了解他们的客户,进而改进他们的营销、业务及客服的运作。 数据挖掘是数据仓库的一种重要运用。基本上,它是用来将你的数据中隐藏的信息挖掘出来,所以 Data Mining 其实是所谓的 Knowledge Discovery 的一部分,Data Mining 使用了许多统计分析与 Modeling 的方法,到数据中查找有用的特征(Patterns)以及关连性(Relationships)。 Knowledge Discovery 的过程对 Data Mining 的应用成功与否有重要的影响,只有它才能确保 Data Mining 能获得有意义的结果。

相关

  • 神经外科人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学神经外科,也常称作脑外科,是外科的一个
  • 方阵 (军事)方阵(英语:phalanx),是一种长方形的大规模军事阵法,通常完全由重步兵手持矛、长柄枪、萨里沙长矛或类似的武器所构成。该词特别用来描述古希腊战争中所使用的这种阵法,虽然古希腊
  • 有机溶剂当有机化合物作为溶剂时,这个有机物就简称为有机溶剂。常见的有机溶剂有乙醚、二氯甲烷、苯、四氯甲烷、氯仿等。在一些职业安全相关的法规中,所指的“有机溶剂”是指具有挥发
  • 线形动物门见内文线形虫动物门(学名:Nematomorpha),俗称铁线虫、马毛虫、马鬃虫或发形虫,是原口动物中一个拟寄生物的门,具有假体腔,但成虫没有排泄器官,消化道退化。线形虫动物门大约有250种
  • 1971年印巴战争印度 东巴基斯坦( 孟加拉国)3,843人阵亡 9,851人受伤 1 Frigate 1架海军飞机巴基斯坦宣称印度宣称9,000人阵亡 4,350人受伤 97,368人被俘 2 驱逐舰 1 扫雷舰 1 潜艇 3 巡
  • 洛比托洛比托(葡萄牙语:Lobito)为安哥拉本吉拉省的一个市镇,其名称源自于洛比托湾,位于本吉拉北方约35公里,于1905年,洛比托被设为本吉拉铁路于海岸的终点,此铁路经卢市(Luau)至刚果民主共
  • 杰马里·莱恩让-马里·莱恩(法语:Jean-Marie Lehn,1939年9月30日-),法国化学家,1987年诺贝尔化学奖获得者之一。他主要的研究领域是超分子化学 ,尤其是穴醚的合成。1901年:范托夫 | 1902年:费歇尔
  • 脂漏性皮肤炎脂溢性皮炎(Seborrhoeic dermatitis 或者 Seborrheic dermatitis (美式英语), seborrhea, 也叫做 Seborrheic eczema)是一种发生于皮脂溢出部位的慢性复发性皮炎。有两个好发
  • 哈尔滨地图出版社哈尔滨地图出版社是中华人民共和国的一家地图出版机构,隶属于黑龙江测绘地理信息局,拥有地图编制甲级测绘资质,是中国东北地区唯一的地图出版机构和国家甲级测绘资质单位。社址
  • 惠康基金会惠康基金会(英语:Wellcome Trust),中文亦称“惠康信托”、“维尔康基金”、“维康基金”或“卫尔康基金”,是英国最大的慈善基金会之一,致力于提高公民和动物的健康福利事业。维康