Spark RDD

✍ dations ◷ 2025-02-23 21:30:55 #Apache软件基金会项目

Spark RDD(英语:Resilient Distributed Dataset,弹性分布式数据集)是一种数据存储集合。只能由它支持的数据源或是由其他RDD经过一定的转换(Transformation)来产生。在RDD上可以执行的操作有两种转换(Transformation)和行动(Action),每个 RDD 都记录了自己是如何由持久化存储中的源数据计算得出的,即其血统(Lineage)。

相关

  • 恐惧状态《恐惧状态》(英语:State of Fear),台湾译名《恐惧之邦》,是美国畅销书作家麦可·克莱顿出版于2004年的一部小说。该小说由哈泼·柯林斯出版社(HarperCollins)于12月7日出版。这部
  • 腕足动物见内文腕足动物门(学名:Brachiopoda)是动物界的一个门,属于底栖、有一对硬壳的触手冠海产动物。但与双壳类动物不同的是:其壳是上、下开合,而不是左、右开合。铰位在后背部,而前方
  • 莫斯科运河莫斯科运河(俄语:Канал имени Москвы,至1947年称莫斯科-伏尔加运河Канал Москва-Волга)是连接莫斯科河与俄罗斯欧洲部分的交通大动脉伏尔加河
  • 基质细胞基质细胞或基底层细胞可以是任何器官(比如子宫粘膜(子宫内膜)、前列腺、骨髓和卵巢)的结缔组织,它支持那个器官实质细胞的功能。成纤维细胞、免疫细胞、周细胞、内皮细胞和炎症细
  • 甲磺酸酯甲磺酸酯(mesylate、甲磺酸、甲磺酸盐)在化学上是指所有的"甲磺酸"(CH3SO3H)盐或酯。在盐里,甲磺酸酯是以"CH3SO3−"的阴离子形式存在的。当辩证医药品所含有的基(官能团和自
  • 泰国历泰国历是泰国目前使用的历法,泰国原来使用的历法和傣历(中国傣族的历法)相同,1888年泰国国王朱拉隆功改革历法,采用格里历,但以曼谷建城,即公元1782年为纪元,以建城日4月6日为每年开
  • 美国疾控中心美国疾病控制与预防中心(英语:Centers for Disease Control and Prevention,缩写为CDC)是美国卫生与公众服务部所属的一个机构,总部设在乔治亚州亚特兰大。作为美国联邦政府行政
  • 灰海豹灰海豹(学名:Halichoerus grypus)是海豹科中其中一个主要物种,主要分布于北大西洋一带的海岸。它们是海豹科中的一种大型海豹,亦是灰海豹属(Halichoerus)中的唯一成员。它们亦有另
  • 张传烱张传炯(1928年10月23日-),中华民国神经暨器官间传导生理学以及药理学专家,中央研究院院士。张传炯出生于台湾省屏东县,先后毕业于国立台湾大学理学院化学系、日本东京大学药学系。
  • 卡默尔河畔诺伊堡卡默尔河畔诺伊堡(德语:Neuburg an der Kammel)是德国巴伐利亚州的一个市镇。总面积37.91平方公里,总人口3167人,其中男性1610人,女性1557人(2011年12月31日),人口密度84人/平方公里