列式数据库

✍ dations ◷ 2025-12-10 05:24:59 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • 凝血酶1a2c, 1a3b, 1a3e, 1a46, 1a4w, 1a5g, 1a61, 1abi, 1abj, 1ad8, 1ae8, 1afe, 1aht, 1ai8, 1aix, 1awf, 1awh, 1ay6, 1b5g, 1b7x, 1ba8, 1bb0, 1bbr, 1bcu, 1bhx, 1bmm, 1bmn
  • 胎毛毫毛或称胎毛是一种只有婴儿才有的体毛,它的功能与头发类似,但在婴孩八个月时就会逐渐消失,因为毫毛有此特性,故有家长把孩子带到订做毛笔的地方,把毫毛刮下制成毛笔,作为送给孩子
  • 拉沃斯拉夫·鲁日奇卡拉沃斯拉夫·斯捷潘·鲁日奇卡(克罗地亚语:Lavoslav Stjepan Ružička,1887年9月13日克罗地亚武科瓦尔 - 1976年9月26日瑞士),克罗地亚化学家,1939年获诺贝尔化学奖。鲁日奇卡生
  • 代谢网络代谢网络(英语:metabolic network)是完整的一决定细胞生理学和生物化学属性的整套代谢与物质过程。这些网络包含了代谢的化学反应以及指导这些反应的调整性相互作用。随着基因
  • 母系制度母系制度是以母系亲属为世系继承的亲属制度。采取母系制度的社会通常有母系继承制、从妻居、重视舅甥关系、从母居以及舅舅担任家长的情况。在母系社会中,原生家庭的子嗣被严
  • 汉中话汉中话,即通行于今陕西省汉中市境内的大部分地区的汉中方言。在汉语方言研究上,一般认为归属于西南官话中的成渝片(2010版称为川黔片),亦有个别分支属中原官话关中片。汉中地处陕
  • 冷战国际史项目冷战国际史项目(英文:The Cold War International History Project),是美国威尔逊国际学者中心于1991年成立的研究中心,并创办专业刊物《冷战国际史项目公报》(CWIHP Bulletin)。
  • 勒索勒索(Blackmail)是一种犯罪行为,透过威逼恐吓等行为从受害人意图获利。犯罪者通常手持把柄或黑材料以恐吓受害者,若受害人不服从犯罪者要求,犯罪者便会要胁公开相关黑材料。
  • 射频烧灼术射频烧灼术(Radiofrequency ablation,RFA),又称射频消融术。是使用中频率交流电流(350-500 kHz)产生热量,以烧灼心脏电传导系统 , 肿瘤或其他不正常的组织。经由导管(英语:catheter)进
  • 浊齿龈塞音浊齿龈塞音是辅音的一种,用于一些口语中。浊齿龈塞音、齿音和齿龈后音在国际音标的符号都是⟨d⟩,X-SAMPA音标的符号则是⟨d⟩。北京官话和粤语均无此音,只有/t/。吴语有此音,由