Python 数据可视化pyecharts的使用详解
作者:木偶Roy
什么是pyecharts?
pyecharts 是一个用于生成 Echarts 图表的类库。
echarts是百度开源的一个数据可视化 JS 库,主要用于数据可视化。pyecharts 是一个用于生成 Echarts 图表的类库。实际上就是 Echarts 与 Python 的对接。
使用 pyecharts可以生成独立的网页,也可以在 flask , Django中集成使用。
pyecharts包含的图表
- Bar(柱状图/条形图)
- Bar3D(3D 柱状图)
- Boxplot(箱形图)
- EffectScatter(带有涟漪特效动画的散点图)
- Funnel(漏斗图)
- Gauge(仪表盘)
- Geo(地理坐标系)
- Graph(关系图)
- HeatMap(热力图)
- Kline(K线图)
- Line(折线/面积图)
- Line3D(3D 折线图)
- Liquid(水球图)
- Map(地图)
- Parallel(平行坐标系)
- Pie(饼图)
- Polar(极坐标系)
- Radar(雷达图)
- Sankey(桑基图)
- Scatter(散点图)
- Scatter3D(3D 散点图)
- ThemeRiver(主题河流图)
- WordCloud(词云图)
用户自定义
- Grid 类:并行显示多张图
- Overlap 类:结合不同类型图表叠加画在同张图上
- Page 类:同一网页按顺序展示多图
- Timeline 类:提供时间线轮播多张图
pyecharts安装
pip install pyecharts
这里要专门说明一下,自从 0.3.2 开始,为了缩减项目本身的体积以及维持 pyecharts 项目的轻量化运行,pyecharts 将不再自带地图 js 文件。如用户需要用到地图图表(Geo、Map),可自行安装对应的地图文件包。
否则在用到这两个包的时候,并能完整的显示地图效果。
全球国家地图:echarts-countries-pypkg(1.9MB): 世界地图和 213 个国家,包括中国地图
中国省级地图:echarts-china-provinces-pypkg(730KB):23 个省,5 个自治区
中国市级地图:echarts-china-cities-pypkg(3.8MB):370 个中国城市
Windows下通过已下的pip命令进行安装
pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echarts-china-cities-pypkg
Linux下通过以下的pip命令进行安装
sudo pip3 install echarts-countries-pypkg sudo pip3 install echarts-china-provinces-pypkg sudo pip3 install echarts-china-cities-pypkg sudo pip3 install echarts-countries-pypkg sudo pip3 install echarts-china-provinces-pypkg sudo pip3 install echarts-china-cities-pypkg
相关函数、参数说明
先介绍一些可能会用到的基本函数:
- add() 主要方法,用于添加图表的数据和设置各种配置项
- show_config() 打印输出图表的所有配置项
- render() 默认将会在根目录下生成一个 render.html 的文件,支持 path 参数,设置文件保存位置,如 render(r"e:my_first_chart.html"),文件用浏览器打开。
默认的编码类型为 UTF-8,在 Python3 中是没什么问题的,Python3 对中文的支持好很多。但是在 Python2 中,编码的处理是个很头疼的问题,暂时没能找到完美的解决方法,目前只能通过文本编辑器自己进行二次编码,我用的是 Visual Studio Code,先通过 Gbk 编码重新打开,然后再用 UTF-8 重新保存,这样用浏览器打开的话就不会出现中文乱码问题了。(这里是某位大佬遇到的问题,我直接复制过来了,供大家参考)
基本上所有的图表类型都是这样绘制的:
- chart_name = Type() 初始化具体类型图表。
- add() 加数据及配置项。
- render() 生成 .html 文件。
基本图表使用实例
Bar(柱状图/条形图)
from pyecharts import Bar bar =Bar("我的第一个图表", "这里是副标题") bar.add("服装", ["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"], [5, 20, 36, 10, 75, 90]) bar.show_config() bar.render()
from pyecharts import Bar bar =Bar("x 轴和 y 轴交换") bar.add("商家A", attr, v1) bar.add("商家B", attr, v2, is_convert=True) bar.render()
说明:如下代码,atf_tb1属性是并不会显示在图表中的
bar = Bar() bar.add('格式化',["atf_tb1","shop"],[10,50]) bar.add("范围", ["shop"], [120]) bar.render()
可以看到atf_tb1并没有加载到图表中,说明并不支持这么使用
Pie(饼图)
from pyecharts import Pie attr =["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"] v1 =[11, 12, 13, 10, 10, 10] pie =Pie("饼图示例") pie.add("", attr, v1, is_label_show=True) pie.show_config() pie.render()
WordCloud(词云图)
from pyecharts import WordCloud name =['Sam S Club', 'Macys', 'Amy Schumer', 'Jurassic World', 'Charter Communications', 'Chick Fil A', 'Planet Fitness', 'Pitch Perfect', 'Express', 'Home', 'Johnny Depp', 'Lena Dunham', 'Lewis Hamilton', 'KXAN', 'Mary Ellen Mark', 'Farrah Abraham', 'Rita Ora', 'Serena Williams', 'NCAA baseball tournament', 'Point Break'] value =[10000, 6181, 4386, 4055, 2467, 2244, 1898, 1484, 1112, 965, 847, 582, 555, 550, 462, 366, 360, 282, 273, 265] wordcloud =WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render()
词云图的形状可以通过shape参数来选择
wordcloud =WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[30, 100], shape='diamond') wordcloud.show_config() wordcloud.render()
Geo(地理坐标系)
from pyecharts import Geo data =[("海门", 9), ("鄂尔多斯", 12), ("招远", 12), ("舟山", 12), ("齐齐哈尔", 14), ("盐城", 15)] geo =Geo("全国主要城市空气质量", "data from pm2.5", title_color="#fff", title_pos="center", width=1200, height=600, background_color='#404a59') attr, value =geo.cast(data) geo.add("", attr, value, type="effectScatter", is_random=True, effect_scale=5) geo.show_config() geo.render()
这里也要先说明一点因为echarts里面有的地点可能没有,一旦添加了没有的在这里面,将会生成一个空的图。
有四个解决办法:
一是最简单的把不存在删掉;
二是到百度地图api里把找不到的地方的经纬度加进原始的包里(这个办法大家可以参看这位大佬的博客https://www.jb51.net/article/163958.htm);
三是如果你的数据在地图中并没有坐标城市,可以通过geo_cities_coords 自己进行添加,GeoLine图同样如此
#!/usr/bin/env python # -*- coding:utf-8 -*- # Author: jyroy from pyecharts import Geo if __name__ == '__main__': list_city_name=["100,30-1","130,40-2"] list_num = [["value1","value2"],["value3"]] geo_cities_coords = {"100,30-1":[100,30],"130,40-2":[130,40]} geo = Geo("Geo 实例") geo.add("",list_city_name, list_num, geo_cities_coords=geo_cities_coords) geo.render()
四是如果你是批量的导入导入数据(类似从数据库中),异常数据并不想插入到地图中去,可以通过try...except...来清除这少部分的异常数据,如下代码,这是我自己遇到的问题的想到的一个解决办法,data是我从数据库中得到的字典
当然如果数据量比较大的话,这样做效率可能不高,给大家一个参考吧
for n, m in data.items(): #data是我从数据库中读取的城市的字典数据 list_1 = [] list_2 = [] list_1.append(n) list_2.append(m) try: geo.add("", list_1, list_2, visual_range=[0, 3000], visual_text_color="#fff", symbol_size=15, is_visualmap=True) except Exception as e: pass
当然如果数据量比较大的话,这样做效率可能不高,给大家一个参考吧这是我的项目里一部分的数据得到的结果,我拿了7万多条数据来做的测试,感觉效果还ok
Line(折线/面积图)
from pyecharts import Line attr =["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"] v1 =[5, 20, 36, 10, 10, 100]v2 =[55, 60, 16, 20, 15, 80] line =Line("折线图示例") line.add("商家A", attr, v1, mark_point=["average"]) line.add("商家B", attr, v2, is_smooth=True, mark_line=["max", "average"]) line.show_config() line.render()
line =Line("折线图-面积图示例") line.add("商家A", attr, v1, is_fill=True, line_opacity=0.2, area_opacity=0.4, symbol=None) line.add("商家B", attr, v2, is_fill=True, area_color='#000', area_opacity=0.3, is_smooth=True) line.show_config() line.render()
写在后面
因为我在用的过程中都是结合数据库批量处理的,所以就不把我写的全都放上了,这有上面地图那里第三个解决办法放了一部分我自己的代码,其他的都是网上常见的一些测试用例。
这里都是基础的介绍(我认为可能常用的一些图表),想了解更多的关于pyecharts的,就不推荐其他人的博客了,都大同小异,大家还是移步官网 http://pyecharts.org/#/zh-cn/ ,因为这是个开源的项目,pyecharts也是三个人一直在维护的,官网内容非常丰富,而且有中文版。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。