Alluxio是一个开源的虚拟分布式文件系统( Virtual Distributed File System, VDFS)。 Alluxio最初起源于一个叫Tachyon的研究项目,它是加州大学伯克利分校AMPLab实验室由师从Scott Shenker教授和Ion Stoica教授的李浩源博士的博士论文课题 。Alluxio位于大数据栈中的计算和存储之间。它为计算框架提供了数据抽象层,使得应用能够通过一个共同的接口连接底层不同的存储系统。这个软件是以Apache License的开源协议进行发布的。
2019年, 首届数据编排峰会在位于加州山景城的计算机历史博物馆举办。众多业界巨擘介绍了他们在构架数据编排平台方面的观点和经验。数据分析、机器学习和人工智能等一系列数据驱动型应用能够通过Alluxio提供的API(例如Hadoop HDFS API, S3 API, FUSE API)高速交互访问底层多种存储系统中的数据。另外,Alluxio之上还能够运行多种流行的计算框架,包括Presto, Apache Spark,Apache Hive, 以及Tensorflow等。
Alluxio能够部署在私有环境,云环境(例如Microsoft Azure, AWS, Google Cloud Platform),或者混合云环境中。它可以直接运行在物理机之上或者类似于Kubernetes, Docker, Apache Mesos的容器化环境当中。
Alluxio最初由李浩源于2013年在加州大学伯克利分校AMP实验室创建并在2014年进行了开源。直至2018年,Alluxio开源项目已经有超过1000名贡献者,从这个数据来看Alluxio已经成为了数据生态系统中最为活跃的项目之一。
以下是一些使用Alluxio的知名企业的名录列表: