Spark RDD

✍ dations ◷ 2025-12-02 08:45:50 #Apache软件基金会项目

Spark RDD(英语:Resilient Distributed Dataset,弹性分布式数据集)是一种数据存储集合。只能由它支持的数据源或是由其他RDD经过一定的转换(Transformation)来产生。在RDD上可以执行的操作有两种转换(Transformation)和行动(Action),每个 RDD 都记录了自己是如何由持久化存储中的源数据计算得出的,即其血统(Lineage)。

相关

  • 健康食品痴迷症健康食品痴迷症(英语:orthorexia nervosa,又稱orthorexia)是美国医生 Steven Bratman 于1997年时提出的概念,指人们因过度追求健康饮食而表现出极端的饮食失调,症状包括身心焦虑、
  • 奥运奥林匹克运动会(希腊语:Ολυμπιακοί Αγώνες、法语:Jeux olympiques、英语:Olympic Games),简称奥运会、奥运,是国际目前最高等级的综合型体育赛事,由国际奥林匹克委
  • 王晓民王晓民(1946年5月13日-2010年3月)是二战后台湾第一个受社会广泛注目的植物人。1963年,王晓民在台湾省立台北第二女中担任管乐队指挥,于同年9月17日时骑脚踏车经过今台北市八德路
  • 吕后吕雉(?-前180年8月18日),字娥姁,汉高祖刘邦皇后。通称吕后,或称汉高后、吕太后、高皇后。东汉时光武帝改薄太后为高皇后,吕后为高后。山东单父(今单县)人,为汉高祖刘邦任亭长时所娶元配
  • 双角子宫双角子宫(Bicornuate uterus),是一类妇科发育障碍,为双侧分离的子宫内膜腔连于一个宫颈,系双侧副中肾管融合不良所致。主要包括两种类型,完全性双角子宫(两个子宫从宫颈内口处分开)
  • 柏柏尔语柏柏尔语(柏柏尔语:ⵜⴰⵎⴰⵣⵉⵗⵜ, ⵝⴰⵎⴰⵣⵉⵗⵝ)是一种非洲撒哈拉北部的语言,因为该地区长久以来一直受到阿拉伯帝国和土耳其帝国的控制,所以没有统一、标准的柏柏尔语言
  • 马蒂电台马蒂广播电视台(西班牙语:Radio y Televisión Martí)是美国政府创建的国有政治宣传机构,由美国国际媒体署管辖。广播节目于1985年5月20日开播,电视节目首播日期是1990年3月27日
  • 周唯中周唯中(英语:Matthew W. Chou),中华民国外交官。毕业于国立政治大学政治学系学士、公共行政所硕士,曾任驻南非大使馆二等秘书、外交部领事事务局科长、驻堪萨斯台北经济文化办事
  • 国立塞切尼图书馆国立塞切尼图书馆 (匈牙利语: Országos Széchényi Könyvtár) (OSZK),匈牙利首都布达佩斯市的一个国立图书馆,为匈牙利两个国立图书馆之一(另一个是德布勒森大学图书馆)。
  • 斯科茨代尔 (亚利桑那州)斯科茨代尔(英语:Scottsdale;奥哈姆语:Vaṣai S-vaṣonĭ;雅基语:Eskatel)位于美国亚利桑纳州的中南部,总面积约为477.7 平方公里,2012年统计人口数约为223,514人。据其官方宣称为“