python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Matplotlib折线图

Matplotlib实战之折线图绘制详解

作者:databook

折线图是一种用于可视化数据变化趋势的图表,它可以用于表示任何数值随着时间或类别的变化,本文主要介绍了如何利用Matplotlib实现折线图的绘制,感兴趣的可以了解下

折线图是一种用于可视化数据变化趋势的图表,它可以用于表示任何数值随着时间或类别的变化。

折线图由折线段和折线交点组成,折线段表示数值随时间或类别的变化趋势,折线交点表示数据的转折点。

折线图的方向表示数据的变化方向,即正变化还是负变化,折线的斜率表示数据的变化程度。

1. 主要元素

折线图主要由以下四个元素组成:

2. 适用的场景

折线图适用于以下分析场景:

3. 不适用的场景

折线图不适用于以下分析场景:

4. 分析实战

4.1. 数据来源

数据来源国家统计局公开数据,已经整理好的csv文件在:databook.top/nation/A03

本次分析使用其中的 A0301.csv 文件(总人口数据)。

下面的文件路径 fp 要换成自己实际的文件路径。

import pandas as pd
fp = "d:/share/A0301.csv"
df = pd.read_csv(fp)
df

4.2. 数据清理

首先看看 zbCN 字段中有多少种不同的人口统计类别。

df.groupby(by="zbCN").count()

这个数据集中一共有5种不同维度的人口统计:

按照类别,将它们分离成5个不同的数据集,为了绘制折线图做准备。

groups = df.groupby(by="zbCN")
dict_group = {}
for g in groups:
    dict_group[g[0]] = g[1]
for k, v in dict_group.items():
    print("key = {}, value type = {}".format(k, type(v)))

groupby 函数按照 by 参数指定的字段将数据集分组,每个group是一个二元的元组。

第一个元素是用来分组的字段值,第二个元素是分组之后的数据集。

4.3. 分析结果可视化

拆分好数据集之后,最就是可视化展示。

首先封装一个函数,用来显示2个数据:(直接使用上面分割好的数据集dict_group

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
from matplotlib.ticker import MultipleLocator
%matplotlib inline
#为了显示中文
matplotlib.rcParams["font.sans-serif"] = ["Microsoft YaHei Mono"]
matplotlib.rcParams["axes.unicode_minus"] = False
#根据key显示两个数据集
def draw(key1, key2):
    with plt.style.context("seaborn-v0_8"):
        fig = plt.figure()
        ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
        ax.xaxis.set_major_locator(MultipleLocator(4))
        ax.xaxis.set_minor_locator(MultipleLocator(2))
        data = dict_group[key1]
        ax.plot(data["sjCN"], data["value"], "b--o", label=key1)
        data = dict_group[key2]
        ax.plot(data["sjCN"], data["value"], "g:d", label=key2)
        ax.legend()

首先看下男女人口的变化趋势:

key1 = "女性人口(万人)"
key2 = "男性人口(万人)"
#男性人口和女性人口的变化趋势
dict_group[key1] = dict_group[key1].sort_values("sj")
dict_group[key2] = dict_group[key2].sort_values("sj")
draw(key1, key2)

看这个趋势变化,男女人口的差距长期都在几千万上下,所以找不到女朋友也许不是你的责任 : )

再看看城镇和乡村的人口变化。

key1 = "乡村人口(万人)"
key2 = "城镇人口(万人)"
#乡村人口和城镇人口的变化趋势
dict_group[key1] = dict_group[key1].sort_values("sj")
dict_group[key2] = dict_group[key2].sort_values("sj")
draw(key1, key2)

从图中可以看出,1994年左右,乡村人口开始进入城镇;

2010年左右,城镇人口开始超越乡村人口,且人口差距越来越大。

折线图最适合的场景就是展示这类有趋势变化的数据。

到此这篇关于Matplotlib实战之折线图绘制详解的文章就介绍到这了,更多相关Matplotlib折线图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文