python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python AutoViz数据集可视化

python AutoViz库一行代码实现可视化数据集

作者:程序员小寒

这篇文章主要介绍了python AutoViz库一行代码实现可视化数据集实例探索,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python AutoViz数据集可视化库

今天给大家分享一个神奇的 python 库,AutoViz

https://github.com/AutoViML/AutoViz 

通过这个库,只需一行代码即可可视化任何大小的数据集!

另外,你可以通过设置将这些交互式图表保存为 HTML 文件。

借助 AutoViz,你可以轻松快速地为数据生成富有洞察力的可视化效果。无论你是数据分析的初学者还是专家,AutoViz 都可以帮助你探索数据并发现有价值的见解。

动机

创建 AutoViz 的动机源于对更高效、用户友好且自动化的数据可视化方法的需求。

可视化数据是数据分析过程中的关键步骤,因为它可以帮助用户理解数据中的模式、趋势和关系。

然而,创建富有洞察力的可视化可能非常耗时,并且需要各种绘图库和技术的专业知识。

AutoViz 通过提供易于使用的自动化解决方案来解决这些挑战,以最少的努力生成有意义的可视化。

总之,AutoViz 背后的动机是使数据可视化更加高效、易于访问和自动化,使用户能够快速从数据中获得有价值的见解,并专注于制定数据驱动的决策。

安装

可以直接使用 pip 进行安装。

pip install autoviz 

导入库

import pandas as pd 
import numpy as np 

#加载Autoviz 
from autoviz import AutoViz_Class 
%matplotlib inline 

AV = AutoViz_Class()

加载数据

你可以使用自己的数据集,我这里使用的是汽车数据集,如果需要可以私信我获取。

filename = "Cars Data.csv"
target_variable = "Horsepower"

可视化

下面,我们通过一行代码,来执行可视化。

dft = AV.AutoViz(
    filename,
    sep=",",
    depVar=target_variable,
    dfte=None,
    header=0,
    verbose=2,
    lowess=False,
    chart_format="svg",
    max_rows_analyzed=500,
    max_cols_analyzed=20,
    save_plot_dir=None
)

首先,你可以得到一份包括各个字段的数据质量报告。

你还可以看到不同的可视化效果,如下图所示。

你还可以将图表格式保存为 HTML,以实现交互式可视化。

当你单击文件时,你将被重定向到一个页面,该页面允许你进行动态和交互式可视化。

如果你只想查看数据质量问题,你可以通过如下代码来实现。

from autoviz import data_cleaning_suggestions
data_cleaning_suggestions(df)

自动修复

你可以使用 AutoViz 中的 FixDQ 自动修复数据质量问题。

from autoviz import FixDQ
fixdq = FixDQ()

可以快速查看问题(重复行的示例)

fixdq.detect_duplicates(df)

如果你想要快速修复,只需编写一行代码即可!

fixdq.fit_transform(df)

AutoViz 是一个优秀的库,它不仅允许以交互式和动态的方式可视化数据,而且除了提供快速修复之外还显示数据质量问题。

以上就是python AutoViz库一行代码实现可视化数据集的详细内容,更多关于python AutoViz数据集可视化的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文