列式数据库

✍ dations ◷ 2025-12-11 07:49:01 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • KK00-K14 口腔、涎腺和颌疾病K20-K31 食管、胃和十二指肠疾病K35-K38 阑尾疾病K40-K46 疝K50-K52 非感染性肠炎和结肠炎K55-K63 肠的其他疾病K65-K67 腹膜疾病K70-K77 肝疾病
  • 固体固体是物质存在的一种状态,是四种基本物质状态之一。与液体和气体相比,固体有固定的体积及形状,形状也不会随着容器形状而改变。固体的质地较液体及气体坚硬,固体的原子之间有紧
  • 面谈面谈或采访,是指一种涉及两名或以上人士的对话,由一方发问,并由另一方回答。面谈的其中常见的一种形式是面试,这是大部分企业在招聘员工过程中需要的一环。此外,面谈亦是新闻采访
  • 钥匙儿童钥匙儿童(英语:latchkey kid 或 latchkey child)是指常常一个人回家或在家、缺少家长监督的儿童;这些儿童的父母往往是工作到比较晚,因此他们经常放学后回到空无一人的家中。“钥
  • 噻丁环Trimethylene sulfide噻丁环(Thietane)是一种含硫的四元杂环化合物,化学式C3H6S。噻丁环可由碳酸丙二酯与硫氰化钾反应制得,该法产量不高:一个改进的方法是1,3-二溴丙烷与硫化钠
  • 胎动胎动 (fetal movement) 指的是胎儿自主性的运动。早于成孕8周,透过超音波扫描,我们可以观察到胎儿的四肢发展逐渐成熟,并且开始有手脚运动、身体转圈等活动。但由于这时胎儿太细
  • 奥加拉拉奥加拉拉(英语:Ogallala)是一个位于美国内布拉斯加州基斯县的城市。根据2010年美国人口普查,该地共人口4737人,而该地的面积约为13.00平方千米。同时该地也是基斯县的县治。奥加
  • 德克萨斯得克萨斯州(英语:State of Texas,/ˈtɛksəs/,当地 /ˈtɛksɪz/),简称得州或德州,是全美国土地面积和人口的第二大州(面积仅次于阿拉斯加州;人口次于加利福尼亚州)。得克萨斯州位于
  • 睢阳区睢阳区是中华人民共和国河南省商丘市的一个市辖区。面积913平方公里,2002年人口72万。国家历史文化名城商丘市的主体位于该区。约公元前11世纪,周成王三年,周公平定武庚叛乱后,
  • 1984年夏季奥林匹克运动会第二十三届夏季奥林匹克运动会(英语:the Games of the XXIII Olympiad,法语:les Jeux de la XXIIIe Olympiade),于1984年7月28日至8月12日在美国洛杉矶举行。本届奥运会被视为是奥