热门排行
简介
本书由Spark开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
Spark快速大数据分析 目录
第1章 Spark数据分析导论 1
第2章 Spark下载与入门 7
第3章 RDD编程 21
第4章 键值对操作 41
第5章 数据读取与保存 63
第6章 Spark编程进阶 87
第7章 在集群上运行Spark 101
第8章 Spark调优与调试 123
第9章 Spark SQL 141
第10章 Spark Streaming 161
第11章 基于MLlib的机器学习 187