xclxcl 2020-02-22
Apache Spark运行工作载荷在100倍速以上。
Apache Spark的组件包括:Spark SQL、Spark Streaming、MLib、GraphX。
Apache Spark应用模式:standalone、cluster mode, on EC2, on Hadoop YARN, on Mesos, or on Kubernetes。
Apache Spark可存取数据: Access data in HDFS, Alluxio, Apache Cassandra, Apache HBase, Apache Hive, and hundreds of other data sources。
Apache Spark主页: http://spark.apache.org/