python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > pandas通过特定列的值多条件去筛选数据及contains方法

python pandas轻松通过特定列的值多条件去筛选数据及contains方法的使用

作者:达达爱吃肉

这篇文章主要介绍了python pandas轻松通过特定列的值多条件去筛选数据及contains方法的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas 轻松筛选数据

通过特定列的值去筛选

import pandas as pd
import numpy as np
 
a=np.array([['北京','北方','一线','非沿海'],['杭州','南方','二线','非沿海'],['深圳','南方','一线','沿海'],['烟台','北方','三线','沿海']])
df1=pd.DataFrame(a,index=[1,2,3,4],columns=['城市','地理','级别','是否沿海'])
print(df1)
df2=df1.copy()

我们先来筛选初来所有的一线二二线城市

df1[(df1['级别'].isin (['一线','二线']))]

相同,如果我们取反的话就可以筛选出不在一线和二线城市的记录

多条件去

df1[((df1['级别'].isin (['一线','二线']))&(df1['是否沿海'].isin(['沿海'])))]

这样就可以轻松的选择特定行数据了,如果是要删除特定行,只需要取反就可以了

df1[~((df1['级别'].isin (['一线','二线']))&(df1['是否沿海'].isin(['沿海'])))]

这就等于是删除了特定行

通过contains对数据进行筛选

比如我们去筛选级别在一线和二线的城市信息

df1[df1['级别'].str.contains("一线|二线",na=False)]

同样我们可以通过取反把在一线二线城市的信息全部筛选掉:

至于多条件就可以使用上述同样的方法

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文