热门排行
简介
本书是一本R语言入门读物,它旨在帮助读者迅速构建起与数据分析相关的知识体系,并学习如何使用R软件实现数据分析方法。无论有无编程基础或数学基础,本书都能帮助读者成长为一名合格的数据分析师。本书全面介绍了来自统计分析、机器学习、人工智能等领域的多种数据分析算法,在讲解与之相关的R代码时,还讨论了这些算法的原理、优缺点与适用背景。本书按照由易到难的原则组织章节主题,读者将获得*好的阅读体验。通过阅读本书,读者将对R语言在数据分析领域的应用有一个全面的认识。这种认识不被特定行业所局限,任何行业的读者都能利用本书介绍的数据分析方法解决本行业的数据分析问题。
目录
版权页
前言
第1章 R的基本介绍
1.1 强大的R
1.2 R语言在大数据中的应用
1.3 R的安装与启动
1.4 R的向量、矩阵和数组
1.5 R的列表和数据框
1.6 R数据文件的载入和载出
1.7 向R中安装包
第2章 原始数据的探索与预处理
2.1 度量数据集的集中程度
2.2 度量数据集的分散程度
2.3 创建一个数值摘要表
2.4 异常值的观测与说明
2.5 缺失值的填补与处理
第3章 R的数据可视化
3.1 plot()函数和常用的图形参数
3.2 经典的基础图形及用途
3.3 将图形组合起来
3.4 更多的高水平作图函数
3.5 更多的常用作图命令
第4章 R中参数的估计和检验
4.1 使用R进行点估计和区间估计
4.2 与正态总体有关的参数检验
4.3 列联表与独立性检验
4.4 几种检验数据分布的函数
4.5 对非正态总体的区间估计和检验
第5章 R中的方差分析
5.1 方差分析模型的建立
5.2 单因素方差分析
5.3 多因素方差分析
5.4 秩检验和协方差分析
第6章 R中的相关分析和回归分析
6.1 多种相关系数的度量和分析
6.2 线性回归分析及其常规参数
6.3 使用逐步回归筛选自变量
6.4 哑变量和逻辑回归
第7章 更高级的数据可视化
7.1 基础图形的拓展与延伸
7.2 有关多元分布函数的特殊图形
7.3 建立最简单的3D图形
7.4 如何让图形更美观
7.5 更多的绘图包和系统
第8章 R中的聚类分析和判别分析
8.1 几种聚类分析的异同
8.2 使用R实现KNN聚类
8.3 使用R实现系统聚类
8.4 使用R实现快速聚类
8.5 几种判别分析模型综述
第9章 R中的主成分分析和因子分析
9.1 主成分分析的实现与应用
9.2 因子分析的初次构建与完善
9.3 对因子分析模型进行修正
9.4 在降维分析的基础上进行回归分析和聚类分析
第10章 R中的广义线性回归模型
10.1 一般的广义线性回归模型
10.2 Logistic线性回归模型
10.3 泊松回归分析模型
10.4 广义线性模型的交叉验证
第11章 R中的时间序列模型
11.1 将数据转换为时间序列格式
11.2 分解时间序列并检验时间序列的自相关性
11.3 探究时间序列的自相关性
11.4 构建时间序列并预测
第12章 R中的最优化问题
12.1 最优化问题简述
12.2 黄金分割法
12.3 牛顿最优化方法
12.4 最快上升法
12.5 R中的最优化函数
第13章 使用R绘制地理信息图形
13.1 绘制世界、国家、省市地图
13.2 向地图中添加颜色
13.3 向地图中添加标签和线条
13.4 使用其他格式的文件优化地图
第14章 使用R构建支持向量机
14.1 构建一个简单的支持向量机
14.2 优化支持向量机的参数
14.3 比较支持向量机与Logistic回归的优劣
14.4 比较支持向量机和KNN聚类算法的优劣
第15章 实现更高效的流程控制和高级循环
15.1 R中的流程控制
15.2 R中的for循环、while循环和repeat循环
15.3 apply家族中的循环函数
15.4 更多的高级循环函数
第16章 R代码的调试与优化
16.1 R代码的常见信息与警告
16.2 R代码中的错误与错误处理方法
16.3 调试R代码
16.4 向量化编程方法
第17章 构建电影评分预测模型
17.1 获取数据并探索
17.2 利用recommenderlab包处理数据
17.3 建立模型并评估
第18章 贝叶斯垃圾邮件过滤器模型
18.1 贝叶斯模型中的条件概率
18.2 复杂的数据预处理过程
18.3 利用occurrece值构造分类器
反侵权盗版声明