Spark简介
什么是Spark?
Apache Spark是用于大规模数据处理的快速(fast)和通用(general)引擎,由加州伯克利分校AMP(Algorithms、Machines and People Lab,在算法、机器和人之间通过大规模集成来展现大数据的应用平台)实验室开发的大数据处理框架。
Spark提供了大数据处理的一站式解决方案,以Spark Core为基础推出了Spark SQL、Spark Streaming、MLlib、GraphX、SparkR等组件。整个Spark生态体系称为BDAS,即:伯克利数据分析栈。