python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python pandas布尔索引

Python数据分析pandas之布尔索引使用详解

作者:YiYa_咿呀

这篇文章主要为大家介绍了Python数据分析pandas之布尔索引使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

正文

&:与
|:或

不同条件需要用()括起来

import pandas as pd
# 构造字典数据
dic = {
    "name":["shanjialan","shanyanhong","luckyapple"],
    "age":[21,23,12],
    "hobby":["sports","music","programming"]
}
# dataframe读取字典
df = pd.DataFrame(dic)

# 简单判断
print(df[df["age"]>18])
print(df[df["name"].str.len()>10])
# 复杂判断
print(df[(df["age"]>18)&(df["age"]<22)])

pandas字符串的方法

pandas 缺失数据的处理

pd.isnull(df):df每个数据是否为空的bool矩阵

pd.notnull(df):df每个数据是否不为空的bool矩阵

缺失数据包括np.nan/None

import pandas as pd
import numpy as np
# 构造字典数据
dic = {
    "name":["shanjialan","shanyanhong","luckyapple","hunvibe","chenwenhao"],
    "age":[21,23,0,np.nan,21],
    "hobby":["sports","music","programming","eating","basketball"]
}
# dataframe读取字典
df = pd.DataFrame(dic)
print(pd.isnull(df))
print(pd.notnull(df))

缺失值的处理方法:删除或者填充

print(df.dropna(how='any',axis=0,inplace=False))
print(df["age"].fillna(value=df['age'].mean()))

注意:在pandas中出现nan进行求均值等操作会默认为0,和在numpy中不同

处理0值

t[t==0]=np.nan

以上就是Python数据分析pandas之布尔索引使用详解的详细内容,更多关于Python pandas布尔索引的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文