热门排行
简介
Spark高级数据分析(第2版)是使用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱进的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。
目录
第1章 大数据分析 1
第2章 用Scala 和Spark 进行数据分析 8
第3章 音乐推荐和Audioscrobbler数据集 37
第4章 用决策树算法预测森林植被 58
第5章 基于K均值聚类的网络流量异常检测 84
第6章 基于潜在语义分析算法分析维基百科 104
第7章 用GraphX分析伴生网络 124
第8章 纽约出租车轨迹的空间和时间数据分析 151
第9章 基于蒙特卡罗模拟的金融风险评估 170
第10章 基因数据分析和BDG项目 190
第11章 基于PySpark和Thunder的神经图像数据分析 211