列式数据库

✍ dations ◷ 2025-01-31 17:12:45 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • 整合分析统计学上来说,元分析(meta-analysis,或译作后设分析、整合分析、综合分析、统合分析、荟萃分析)是指将多个研究结果整合在一起的统计方法。就用途而言,它是文献回顾的新方法。文
  • 肺容量肺容量是指呼吸周期中不同阶段肺中通过的气体容积。通过测定肺容积指标可判定患者是否患有各种呼吸道疾病。
  • 卡尔文循环卡尔文循环(英语:Calvin cycle,或简称卡氏循环,又译作开尔文循环)是由美国加州大学伯克利分校梅尔文·卡尔文、安德鲁·本森和詹姆士·巴沙姆 3 人发现。梅尔文·卡尔文于1961年
  • 4d5 5s22, 8, 18, 13, 2蒸气压((推断))第一:702 kJ·mol−1 第二:1470 kJ·mol−1 第三:2850 kJ·mol主条目:锝的同位素锝(拼音:dé,注音:ㄊㄚˇ,粤拼:dak1,台湾称
  • 五浊恶世五浊是一个佛教术语,指五种浑浊不净之法,包括劫浊、见浊、烦恼浊、众生浊、命浊,合称五浊。充满这五种不净的世界称为五浊恶世。劫浊:三灾起时,更相杀害,众生饥馑,种种疾病,此谓劫浊
  • 玉皇上帝玉皇上帝,通称玉皇大天尊,简称玉皇、玉帝,俗称玉皇大帝、天公,宋代尊称之为昊天玄穹玉皇上帝。玉皇上帝源自中国自古以来信仰的昊天上帝。中国人自从原始社会开始就崇敬“天”,最
  • 电分析化学法电化学分析是分析化学的重要组成部分。电化学分析法是利用测量样品的电位(potential)、电流和电阻(或导电度),以分析样品中待测物组成及浓度的方法。电化学分析法测定结果是
  • 北黎凡特方言黎凡特阿拉伯语(اللهجة الشامية),也叫东部阿拉伯语,是在黎凡特地区广泛使用的一种阿拉伯语变体。它是五种(一说六种)主要的阿拉伯语变体之一。与其他地方的阿拉伯语
  • 塞赫姆拉-何鲁希玛特·因提夫伊里奥特弗八世,又译因提夫八世。是埃及第十七王朝的一位国王,他在位期间正值第二中间期,当时埃及有第十七王朝和埃及第十五王朝共存。
  • 中国古籍中国古籍或中国古典典籍一般指的是“公元1911年(含)以前出版的书籍,包括抄本及刻本”。具体而言,可以说是以印刷或书写成“具有中国古典装帧形式(如包背装、线装、蝴蝶装等)、以研