列式数据库

✍ dations ◷ 2025-04-27 16:11:13 #数据库,数据库管理系统

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。

数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表:

这个简单的表包括员工代码(EmpId), 姓名字段(Lastname and Firstname)及工资(Salary).

这个表存储在电脑的内存(RAM)和存储(硬盘)中。虽然内存和硬盘在机制上不同,电脑的操作系统是以同样的方式存储的。数据库必须把这个二维表存储在一系列一维的“字节”中,由操作系统写到内存或硬盘中。

列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

10:001,12:002,11:003,22:004;Smith:001,Jones:002,Johnson:003,Jones:004;Joe:001,Mary:002,Cathy:003,Bob:004;40000:001,50000:002,44000:003,55000:004; 

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。

001:10,Smith,Joe,40000;002:12,Jones,Mary,50000;003:11,Johnson,Cathy,44000;004:22,Jones,Bob,55000;

这只是一个简化的说法。此外,partitioning, 索引, 缓存机制, 视图, 联机分析多维数据集, 以及诸如 预写式日志 和 multiversion concurrency control 此类的事务系统都在现实的应用环境中发挥作用。一般来说, 侧重于联机事务处理 (OLTP) 的系统更适用行数据库, 而侧重于联机分析处理 的系统就必须在行数据库和列数据库中找到适当得平衡。

因为硬盘寻址时间相较于计算机上其他部件的运行速度来说不是一般的慢,所以常用相同工作负载下的硬盘访问性能来比较行数据库和列数据库。通常,顺序读取数据要比随机访问更快。而且,硬盘寻址时间的提升比起CPU速度的进步要慢得多 (参看 摩尔定律),在使用硬盘作为存储介质的系统上这种情况很可能还会持续一段时间。下面简单罗列了一些选择行数据库还是列数据库的权衡依据。当然,如果能够把数据全放在内存中,那么使用内存数据库性能会更好。

在实际应用中,面向行的数据存储架构更适用于OLTP-频繁交互事务的场景。面向列的数据存储架构更适用于OLAP-(如数据仓库)这样在海量数据((可能达到 terabyte规模))中进行有限复杂查询的场景。


列式数据库的代表包括:SAP HANA、Amazon Redshift、Sybase IQ、ParAccel、Sand/DNA Analytics、Vertica、Aster Data Systems和greenplum等。

相关

  • 拉丁民族拉丁民族原指古代定居意大利半岛中西部拉丁姆平原的部落民族。其先民为公元前一千年左右由欧洲大陆迁来的印欧人。使用印欧语系的拉丁语。现在泛指受拉丁语和罗马文化影响较
  • 急诊室 (电视剧)《急诊室》(英语:Casualty,风格化:Casual+y)是一部英国医疗剧,由杰瑞米·布洛克(英语:Jeremy Brock)和保罗·昂温(英语:Paul Unwin)创建,原监制为杰兰特·莫利斯(英语:Geraint Morris),自1986
  • 清廉指数清廉指数(英语:Corruption Perceptions Index,缩写:CPI)或译作腐败感知指数、清廉指数、清廉印象指数等,是透明国际自1995年起每年发布的评估,就世界各国民众对于当地腐败状况的主
  • 键长键长是两个成键原子A和B的平衡核间距离。它是了解分子结构的基本构型参数,也是了解化学键强弱和性质的参数。对于由相同的A和B两个原子组成的化学键:键长值小,键强;键的数目多,键
  • 瓦卢斯瓦卢斯(前46年-9年)又称瓦鲁斯,全名为普布利乌斯·昆克蒂利乌斯·瓦卢斯,是奥古斯都统治下罗马帝国的政治家和将军,因为在条顿堡森林战役而闻名。在这场战役中,瓦鲁斯被条顿领袖阿
  • 美林证券美林证券(Merrill Lynch)是世界最大的证券零售商和投资银行之一,总部位于美国纽约市。目前,美林集团在世界超过40个国家经营,为个人、机构投资者和政府客户提供多元化的金融服务:
  • 西乔丹市西乔丹 (West Jordan, Utah)是美国犹他州盐湖县的一个城市,位于盐湖谷西南部、约旦河西岸。面积80.0平方公里,2006年人口100,280人,是该州第四大城市。1849年开埠,1941年1月10日设
  • 1932年第三届冬季奥林匹克运动会(英语:the III Olympic Winter Games,法语:les IIIes Jeux olympiques d'hiver),于1932年2月4日至15日在美国纽约州的普莱西德湖举行,同时亦是首次由北美
  • 美国国民警卫队1903年 - 现今English colonial government militias: since December 13, 1636As "National Guard": since 1824 in New York, since 1903 nationwide美国国民警卫队(英语:Un
  • 弛缓 (核磁共振)弛缓或译作弛豫,在核磁共振(NMR)现象学上,针对磁化强度的演化分成两个面向:另外因为主磁场的局部不均匀,导致体积元素(voxel)内失相(dephase),使得x-y平面上实际的讯号衰减速度远