Python人工智能之波士顿房价数据分析

2021-11-06 09:40:04 作者：mind_programmonkey

买房应该是大多数都会要面临的一个选择，当前经济和政策背景下，未来房价会涨还是跌？这是很多人都关心的一个话题。今天分享的这篇文章，以波士顿的房地产市场为例，根据低收入人群比例、老师学生数量等特征，利用 Python 进行分析，不求买房但求技术

【人工智能项目】机器学习热门项目-波士顿房价

在这里插入图片描述

1.数据概览分析

1.1 数据概览

本次提供：

train.csv,训练集；
test.csv,测试集；
submission.csv 真实房价文件；

训练集404行数据，14列，每行数据表示房屋以及房屋周围的详细信息，已给出对应的自住房平均房价。要求预测102条测试数据的房价。

1.2 数据分析

通过学习房屋以及房屋周围的详细信息,其中包含城镇犯罪率，一氧化氮浓度，住宅平均房间数，到中心区域的加权距离以及自住房平均房价等等,训练模型,通过某个地区的房屋以及房屋周围的详细信息，预测该地区的自住房平均房价。

回归问题，提交测试集每条数据对应的自住房平均房价。评估指标为均方误差mse。

2. 项目总体思路

2.1 数据读取

数据集：波士顿房间训练集.csv (404条数据)
数据集字段如下:
CRIM：城镇人均犯罪率。
ZN：住宅用地超过 25000 sq.ft. 的比例。
INDUS：城镇非零售商用土地的比例。
CHAS：查理斯河空变量（如果边界是河流，则为1；否则为0）。
NOX：一氧化氮浓度。
RM：住宅平均房间数。
AGE：1940 年之前建成的自用房屋比例。
DIS：到波士顿五个中心区域的加权距离。
RAD：辐射性公路的接近指数。
TAX：每 10000 美元的全值财产税率。
PTRATIO：城镇师生比例。
B：1000（Bk-0.63）^ 2，其中 Bk 指代城镇中黑人的比例。
LSTAT：人口中地位低下者的比例。
MEDV：自住房的平均房价，以千美元计。

在这里插入图片描述