热门排行
简介
Spark作为新兴的、应用范围最为广泛的大数据处理开源框架引起了广泛的关注,它吸引了大量程序设计和开发人员进行相关内容的学习与开发,其中 MLlib是 Spark框架使用的核心。本书是一本细致介绍 Spark MLlib程序设计的图书,入门简单,示例丰富。 本书分为 12章,从 Spark基础安装和配置开始,依次介绍 MLlib程序设计基础、MLlib的数据对象构建、MLlib中 RDD使用介绍,各种分类、聚类、回归等数据处理方法,最后还通过一个完整的实例,回顾了前面的学习内容,并通过代码实现了一个完整的分析过程。 本书理论内容由浅而深,采取实例和理论相结合的方式,内容全面而详尽,讲解细致直观,适合 Spark MLlib初学者、大数据分析和挖掘人员,也适合高校和培训学习相关专业的师生教学参考。
Spark MLlib机器学习实践 目录
第1章星星之火
第2章Spark安装和开发环境配置
第3章RDD详解
第4章MLlib基本概念
第5章协同过滤算法
6章MLlib线性回归理论与实战
第7章MLlib分类实战
第8章决策树与保序回归
第9章MLlib中聚类详解
第10章MLlib中关联规则
第11章数据降维
第12章特征提取和转换
第13章MLlib实战演练——鸢尾花分析