列式数据库

✍ dations ◷ 2025-09-07 03:03:52 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • 英国人英国人(British people)是指持有英国国籍的人或英国公民。 不列颠人(Britons)最初是指原居于不列颠群岛的凯尔特人,后为盎格鲁撒克逊人所使用而转为大不列颠岛上的盎格鲁撒克逊人
  • 海明威欧内斯特·米勒·海明威(英语:Ernest Miller Hemingway,1899年7月21日-1961年7月2日),美国记者和作家,他是20世纪最著名的小说家之一。海明威出生于美国伊利诺伊州芝加哥市郊区的奥
  • 罗马时代荷兰南部地区在古代被罗马人所占领,从公元前55年被凯萨所征服,到公元410年成为墨洛温王朝的一部分,一共历经四百余年,在罗马几年的统治之下,荷兰从此往后的生活以及文化层面深受
  • 更衣 (消歧义)更衣的意思有:
  • 主要分类废物的形态有很多种,它们包括:
  • 爱德华空军基地爱德华兹空军基地(英语:Edwards Air Force Base;IATA代码:EDW;ICAO代码:KEDW),美国著名空军基地之一,以降落航天飞机而闻名。爱德华兹空军基地位于美国的加利福尼亚州,离洛杉矶约150公
  • 奥托一世 (神圣罗马帝国)奥托一世(Otto I,912年11月23日-973年5月7日),东法兰克国王(936年—973年在位),神圣罗马帝国皇帝(962年加冕)。史称奥托大帝(Otto der Große)。东法兰克国王亨利一世之子,母为Ringlheim
  • 二氧化锝二氧化锝(化学式:TcO2)是锝的氧化物之一。它在酸性溶液中可以被Ce(IV)或碱性溶液中被H2O2氧化为高锝酸盐。碳酸钠或碳酸氢钠和热的六氯合锝(VI)酸钾反应,生成TcO2·2H2O,将其真空
  • 反键轨道原子轨道在线性组合成分子轨道时(即两个波函数相加得到的分子轨道),能量较高的分子轨道叫反键轨道(英语:Antibonding orbital)。反键轨道总是与成键轨道成对出现,其余为非键轨道。
  • 孙达尔甘杰乌帕齐拉孙达尔甘杰乌帕齐拉(孟加拉语:সুন্দরগঞ্জ,英语:Sundarganj Upazila)是孟加拉国戈伊班达县的一个乌帕齐拉,位于朗布尔专区的戈伊班达县。。据1991年孟加拉国人口普查(英语