python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python制作热力图

Python制作热力图的详细代码

作者:可持续编码

想象一下,你的数据不再是冰冷的数字表格,而是一幅充满生命力的彩色画卷——每个数字都有了自己的颜色,数据的高低起伏一目了然,因此本文给大家介绍了Python制作热力图的详细代码,需要的朋友可以参考下

引言

想象一下,你的数据不再是冰冷的数字表格,而是一幅充满生命力的彩色画卷——每个数字都有了自己的颜色,数据的高低起伏一目了然。

热力图,正是这种让数据“看得见”的强大工具。它通过颜色的深浅变化来展示数据的分布和大小关系,能让我们直观地发现数据中的热点区域异常点潜在模式,特别适合展示相关性矩阵、地理分布或时间序列数据。

01 工具准备:为数据上色

在Python的世界里,制作热力图主要靠三个强大工具:MatplotlibSeabornPyecharts。它们各有特色,像不同画风的画家,都能帮你把数据变成美丽的图画。

安装这些工具非常简单。打开你的终端或命令行窗口,输入以下命令:

pip install matplotlib seaborn pandas numpy pyecharts

这行命令会帮你安装绘图所需的全部核心库。其中,Pandas负责高效读取和处理数据,就像一位数据管家;而NumPy则擅长处理多维数组,为热力图提供“颜料”。

02 数据读取:从文件到代码

学会了调色,接下来我们要获取“颜料”——数据。通常,数据会以文件的形式存在,最常见的是CSVExcel格式。下面是用Pandas读取它们的方法:

import pandas as pd

# 读取CSV文件
df_csv = pd.read_csv('your_data.csv')

# 读取Excel文件  
df_excel = pd.read_excel('your_data.xlsx', sheet_name='Sheet1')

如果你的数据是制表符分隔的TSV文件,还可以使用pd.read_csv('file.tsv', sep='\t')

在实际操作中,数据往往不会“完全听话”。这时你需要先进行一些简单的预处理,比如用df.head()查看前几行数据,用df.info()了解数据的基本情况,或用df.dropna()删除包含缺失值的行。

03 三种画法:热力图的实现方法

工具箱已经准备就绪,现在来学习三种主要的绘制方法。

基础方法:使用Matplotlib绘制

Matplotlib是Python绘图的基础库,就像画画用的铅笔和直尺。它提供了绘制热力图的核心功能。

import matplotlib.pyplot as plt
import numpy as np

# 生成模拟数据
data = np.random.rand(10, 10)  # 创建一个10行10列的随机数组

# 绘制热力图
plt.figure(figsize=(8, 6))  # 设置图形大小
plt.imshow(data, cmap='viridis', interpolation='nearest')
plt.colorbar()  # 添加颜色条
plt.title('Matplotlib热力图示例')
plt.show()

这里的关键是imshow()函数,其中cmap参数指定了颜色映射方案。尝试把'viridis'换成'hot''coolwarm''YlGnBu',看看不同色彩带来的视觉效果。

优雅方法:使用Seaborn绘制

Seaborn基于Matplotlib,但提供了更美观、更高层次的接口,可以说是数据可视化的“美图秀秀”

import seaborn as sns

# 使用Seaborn生成随机数据
data = sns.randn(100, 10)

# 绘制热力图
plt.figure(figsize=(10, 8))
sns.heatmap(data, annot=True, fmt=".1f", cmap='coolwarm')
plt.title('Seaborn热力图示例')
plt.show()

Seabornheatmap()函数功能非常强大:annot=True会在每个格子里显示数值;fmt=".1f"控制数值格式为保留一位小数。

交互方法:使用Pyecharts绘制

如果你的热力图需要嵌入网页,或者想要添加交互功能,Pyecharts是理想的选择。

from pyecharts import options as opts
from pyecharts.charts import HeatMap
import random

# 生成模拟数据
data = []
for i in range(24):
    for j in range(7):
        data.append([j, i, random.randint(0, 100)])

# 创建热力图
heatmap = (
    HeatMap()
    .add_xaxis(['周一', '周二', '周三', '周四', '周五', '周六', '周日'])
    .add_yaxis(
        "热度",
        list(range(24)),
        data,
        label_opts=opts.LabelOpts(is_show=False),
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="一周热度分布"),
        visualmap_opts=opts.VisualMapOpts(min_=0, max_=100),
    )
)
heatmap.render("heatmap_example.html")  # 保存为HTML文件

这个例子创建了一个交互式的网页热力图,显示一周7天、24小时的热度分布。将鼠标悬停在格子上,可以看到具体数值。

04 美化调整:让热力图更专业

掌握了基本画法后,下面来看看如何让热力图变得更专业、更易读。

优化布局与颜色

# 专业热力图设置示例
plt.figure(figsize=(12, 10))

# 绘制热力图,添加更多参数
sns.heatmap(data,
            annot=True,           # 显示数值
            fmt=".2f",           # 数值格式
            cmap='YlGnBu',       # 颜色方案
            linewidths=0.5,      # 单元格边线宽度
            linecolor='white',   # 边线颜色
            cbar_kws={'label': '数值大小'})  # 颜色条标签

# 优化标签显示
plt.xticks(rotation=45, ha='right')  # x轴标签旋转45度
plt.yticks(rotation=0)
plt.title('优化后的热力图示例', fontsize=16, pad=20)
plt.xlabel('X轴标签')
plt.ylabel('Y轴标签')
plt.tight_layout()  # 自动调整布局
plt.show()

调整颜色映射方案

不同的颜色映射适用于不同的数据类型:

05 实战案例:电商用户行为分析

现在,让我们通过一个完整的实战案例,将前面学到的知识融会贯通。假设我们有一份电商平台的用户点击数据,想要分析用户在不同时间对不同页面的访问热度。

第一步:数据准备与读取

import pandas as pd

# 读取数据(假设是CSV格式)
df = pd.read_csv('user_clicks.csv')

# 查看数据前几行
print(df.head())

# 查看数据基本信息
print(df.info())

第二步:数据处理与转换

我们需要将原始数据转换为适合绘制热力图的格式:

# 提取需要的数据列(假设数据包含time, page_url, clicks等列)
clicks_by_time_page = df.groupby(['hour', 'page_url'])['clicks'].sum().reset_index()

# 数据透视:将长格式转换为宽格式
heatmap_data = clicks_by_time_page.pivot(index='page_url', columns='hour', values='clicks')

# 标准化处理(可选,使颜色对比更明显)
heatmap_data_normalized = (heatmap_data - heatmap_data.min()) / (heatmap_data.max() - heatmap_data.min())

第三步:绘制热力图

import seaborn as sns
import matplotlib.pyplot as plt

# 设置中文字体(如果需要显示中文)
plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial']
plt.rcParams['axes.unicode_minus'] = False

# 创建热力图
plt.figure(figsize=(14, 10))
sns.heatmap(heatmap_data_normalized,
            cmap='YlOrRd',
            annot=False,  # 数据多时不显示具体数值
            linewidths=0.5,
            cbar_kws={'label': '标准化点击量'})

# 添加标题和标签
plt.title('电商平台用户点击热力图(按页面和时间)', fontsize=18, pad=20)
plt.xlabel('小时', fontsize=14)
plt.ylabel('页面URL', fontsize=14)

# 调整x轴刻度
hours = list(range(24))
plt.xticks(ticks=[i+0.5 for i in hours], labels=hours, rotation=0)

plt.tight_layout()
plt.savefig('user_clicks_heatmap.png', dpi=300, bbox_inches='tight')
plt.show()

第四步:热力图解读

通过观察生成的热力图,我们可以得出一些有价值的洞察:

如果你需要更高级的功能,如自动调整字体大小以适应数据维度,可以参考中提到的动态可视化技术。

06 高级技巧与最佳实践

掌握了基础知识后,让我们看看一些能让你的热力图更上一层楼的技巧。

三维热力图: 对于空间数据,可以创建三维热力图来展示数据在三维空间中的分布。例如,分析不同高度无人机分布,物流无人机集中在50-100米(蓝色区域),而载人飞行器分布在200-300米(红色区域)。

动态热力图: 使用PlotlyPyecharts创建交互式热力图,允许用户缩放、悬停查看数值、筛选数据。

大数据优化: 当数据量很大时,可以采用以下优化策略:

多图组合: 将热力图与其他图表结合,提供更全面的视角:

从这张基础的热力图中,我们可以清晰看到数据的高低分布。颜色的深浅变化直观地揭示了数据的热点区域冷点区域,这正是热力图最核心的价值所在。

色彩不只是装饰,它是数据的另一种语言。当你掌握了热力图的绘制技巧,就多了一种与数据对话的方式。

这个世界上的数据,无论是网页点击、销售额变化,还是气温分布,都等待着被赋予颜色,被真正“看见”。

以上就是Python制作热力图的详细代码的详细内容,更多关于Python制作热力图的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文