pandas读取excel统计空值数量错误的解决方法

 更新时间:2024年04月02日 11:07:21   作者:想当运维的程序猿  
pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,本文主要介绍了pandas读取excel统计空值数量错误的解决方法,感兴趣的可以了解一下

Python客栈送红包、纸质书

问题: pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下

1
2
3
4
5
6
import pandas as pd
 
df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是0个

excel数据长这样,B2是一个空格,希望得到空值为2的结果

在这里插入图片描述

问题分析:

读取excel后的df是这样

在这里插入图片描述

使用applymap剔除空格后的df是这样

在这里插入图片描述

读取excel后的df的值(df.values)

在这里插入图片描述

使用applymap剔除空格后的df的值(df.values)

在这里插入图片描述

可以看到,在applymap方法处理后

值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)

pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到

解决: 将’'和’nan’全部替换为np.nan,isnull就可以统计到

1
2
3
4
5
6
7
8
9
import numpy as np
import pandas as pd
 
df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
df[df == ''] = np.nan
df[df == 'nan'] = np.nan
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是2个

到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

 

蓄力AI

微信公众号搜索 “ 脚本之家 ” ,选择关注

程序猿的那些事、送书等活动等着你

原文链接:https://blog.csdn.net/qq_33218097/article/details/129978507

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 reterry123@163.com 进行投诉反馈,一经查实,立即处理!

相关文章

  • python如何选取excel文件满足特定条件的行

    python如何选取excel文件满足特定条件的行

    这篇文章主要介绍了python如何选取excel文件满足特定条件的行问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-03-03
  • Python笔记之facade模式

    Python笔记之facade模式

    这篇文章主要为大家详细介绍了Python笔记之facade模式,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-11-11
  • 利用Python实现生成颜色表(color chart)

    利用Python实现生成颜色表(color chart)

    在做色彩相关的算法分析时候,经常需要使用规则的颜色表来进行辅助,本文就来利用numpy和opencv生成颜色表并保存为图片,需要的可以参考一下
    2023-05-05
  • 对Python中内置异常层次结构详解

    对Python中内置异常层次结构详解

    今天小编就为大家分享一篇对Python中内置异常层次结构详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • pycharm命令终端运行python文件以及传递参数方式

    pycharm命令终端运行python文件以及传递参数方式

    这篇文章主要介绍了pycharm命令终端运行python文件以及传递参数方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • conda查看、创建、删除、激活与退出环境命令详解

    conda查看、创建、删除、激活与退出环境命令详解

    在不同的项目中经常需要conda来配置环境,这样能够实现不同版本的python和库的随意切换,并且减少了很多不必要的麻烦,下面这篇文章主要给大家介绍了关于conda查看、创建、删除、激活与退出环境命令的相关资料,需要的朋友可以参考下
    2023-05-05
  • pytorch常见的Tensor类型详解

    pytorch常见的Tensor类型详解

    今天小编就为大家分享一篇pytorch常见的Tensor类型详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • python目标检测非极大抑制NMS与Soft-NMS

    python目标检测非极大抑制NMS与Soft-NMS

    这篇文章主要weidajia 介绍了python目标检测非极大抑制NMS与Soft-NMS实现过程,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • Python 列表中的删除操作之del、remove 和 pop 的区别

    Python 列表中的删除操作之del、remove 和 pop 的区别

    在Python中,列表(list)是一种非常灵活的数据结构,它允许我们存储一系列的元素,在删除元素时,我们可以使用三种不同的方法:del、remove 和 pop,每种方法都有其特定的用途和行为,了解它们的区别可以帮助我们更有效地使用列表,感兴趣的朋友跟随小编一起看看吧
    2024-05-05
  • Python交换变量

    Python交换变量

    Python美味第一顿,来个方便快捷的变量交换!为什么是Python?!因为Python中交换变量不需要临时变量!
    2008-09-09

最新评论