使用Dataframe.info()显示空值与类型信息
作者:路明非Re
这篇文章主要介绍了使用Dataframe.info()显示空值与类型信息,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
Dataframe.info()显示空值与类型信息
使用Dataframe.info()默认不带参数只显示摘要信息
如果想显示空值信息与类型信息
testData.info(verbose = True, null_counts=True)
其中verbose代表是否显示类型信息,null_counts代表是否显示空值统计信息。
这两个参数在探索性分析中非常有用。
然后推荐使用missingno包进行缺失值的可视化。
将DataFrame.info()存储为变量
日常工作中,通常使用它来查看数据的基本统计信息(如索引、列数、列名、数据量、数据类型、缺失值、内存等)
其语法结构如下:
DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
问题
在使用中,想将其输出的统计信息作为一个变量存储,并且运行时,不打印出来(该函数默认是将统计信息打印出来)
处理
可通过设置参数buf来满足需求,实例如下:
存储为字符串
import pandas as pd # 构建数据集 int_values = [1, 2, 3, 4, 5] # 整数 text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon'] # 字符串 float_values = [0.0, 0.25, 0.5, 0.75, 1.0] # 浮点 df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values}) # 存储为字符串 import io buf = io.StringIO() # 创建一个StringIO,便于后续在内存中写入str df.info(buf=buf) # 写入 s = buf.getvalue() # 读取
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。