Pandas实现某列删除None值
作者:羊肉串儿加点辣
文章指出表格中的None分为空值和字符串两种类型,处理时需先将字符串"None"替换为pandas的nan,再通过dropna()函数删除空值,以确保数据清洗的准确性
首先应该判断自己表格中的None的类型
表格中None有两种情况:
- (1)空值类型的None。
- (2)字符串类型的None,是真实存在的。
处理空值类型的None
df.dropna(how='all')#删除所有内容均为缺失值的行 df.dropna(axis=1) #丢弃有缺失值的列 df.dropna(axis=1, how = 'all') #丢弃所有列中所有值均缺失的列 df.dropna(axis=0, subset=['datetime', 'values'])#丢弃datetime和values这两列中有缺失值的行
处理字符串类型的None
可以先将“None”值replace为pandas可读取的空值
如nan,然后再用dropna()去掉即可
df.replace(to_replace='None', value=np.nan).dropna()
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。