列式数据库

✍ dations ◷ 2025-11-08 13:05:54 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • 囊肿性纤维化囊肿性纤维化(英语:cystic fibrosis,缩写作 CF),亦称为囊性纤维化、囊肿性纤维变性、囊肿纤维症、纤维性囊肿或囊纤维变性,是一种常见的遗传疾病,此病症最常影响肺脏,但也常发生于胰
  • 昏迷糖尿病昏迷为一种常见的内科急症,只有通过准确且有效的治疗才能让患者及时康复,相反,若不及时抢救亲者脑部缺氧瘫痪及会诱发各种并发症以至患者死亡。其确诊依赖于患者病史、
  • 片利共生偏利共生(英语:Commensalism,又称为偏利共栖现象)是两种生物间共生关系的一种。是指在生物界中,某两物种间的生态关系,其中一种的生物会因这个关系而获得生存上的利益,但是,另一方的
  • 罗汉松属罗汉松属(学名:Podocarpus)是罗汉松科下的一个属,为常绿乔木或灌木植物。该属共有约108种,分布于东亚和南半球的温带、亚热带和热带地区。
  • 塞姆人闪米特人(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Taamey
  • 大隈重信大隈重信(1838年3月11日-1922年1月10日),幼名八太郎,是日本武士(佐贺藩藩士)、政治家、教育家。从一位大勋位侯爵。曾任参议兼财务大臣、外务大臣(第3、4、11、14、29任)、农商务大臣
  • 花莲溪花莲溪位于台湾东部,属于中央管河川,为花莲县的主要河川之一,本身源流为光复溪,发源于拔子山,但整个水系的最远源头则为其最长支流万里溪 (万里桥溪)的源头,位于中央山脉白石山南侧
  • 进驻维希法国日军入侵法属印度支那(日语:仏印進駐),又名为越南远征、入侵法属中南半岛,是大日本帝国在第二次中日战争期间,为封锁中华民国及阻止美国通过海防至云南之中越铁路以运送军
  • 树林后村圳改修碑及水汴头坐标:24°58′49″N 121°25′33″E / 24.980201°N 121.425742°E / 24.980201; 121.425742树林后村圳改修碑及水汴头,位于新北市树林区水源街32巷,为(1917年)记载后村圳的沿革,
  • 盖茨堡演说《葛底斯堡演说》(英语:Gettysburg Address)是第16任美国总统亚伯拉罕·林肯最著名的演说,也是美国历史上为人引用最多之政治性演说。1863年11月19日,也就是美国内战中葛底斯堡战