Apache Spark 官方文档中文版,个人翻译学习使用,以Python语言为主 Apache Spark是一个快速的,用于海量数据处理的通用引擎。 Spark 概述 编程指南 快速开始 RDD编程指南 Spark SQL编程指南 Spark Streaming 编程指南 MLlib GraphX Programming Guide API 文档 部署指南 集群模式概述 Submitting Applications 部署模式 Spark Standalone Mesos YARN kubernetes 更多 Spark 配置 Monitoring and Instrumentation Spark调优 作业调度 Spark 安全 硬件配置 构建 Spark Spark RDD(Resilient Distributed Datasets)论文