关于Python中的空值问题及解决
作者:芊欣欲
背景
python中有许多表示空值的方式,本文对不同的空值表达方式从类型、等值性、语法方面进行归纳总结
1. None 介绍
None是python中独有的特殊数据类型,它不同于空列表、空字符串、空Series等,它是一个特殊的存在,表示什么都没有。
类型
NoneType
2. NaN和np.nan 介绍
NaN(not a number)是属于numpy和pandas下的专有数据类型,不是python原生的。
np.nan在import numpy as np
后可以使用,而NaN需要额外from numpy import NaN
类型
float
语法
由于np.nan和NaN的等值性比较特殊,NaN == NaN会return false,所以判断一个值是否为空需要调用pandas活着numpy包中的api,具体语法如下:
对于整体的Series或者Dataframe判断是否为空:isnull()
对于单独的某个值判断:np.isnan()
3. Null 介绍
NULL是C语言中表示空值的主要表现方式,而Python中没有Null,在python中的等位替换为None
4. NaT 介绍
NaT是numpy和pandas中一种特殊的空值,类似于NaN中var = np.nan的方式对变量赋NaT,该变量只会出现在python连接数据库读取数据的情况下(未找到相关官方资料,如有不对之处请指正),如果数据库中的数据类型是timestamp等与时间相关的类型,而其中又没有数据的话,用python读取后可能为此类型。
类型
datetime
非时间标量值
语法
判断是否为空的语句(对单个值而不是dataframe):np.isnat()
注意:对NaT执行x.tz_localize(None)
等时区转换的操作不会报错。
5. 等值性
在python中等值性不太稳定,总体来说None的表现比NaN稳定,推荐优先考虑None或者空字符串。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。