pandas如何修改特定的值
作者:道航不高
这篇文章主要介绍了pandas如何修改特定的值问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
map、apply映射
map和apply都是用于映射的,map一般用于Series对象,而apply用于DataFrame对象。
简答的讲:
- 就是如果要对某一列数据进行映射,map和apply都可以;
- 但是如果要对多列数据同时进行映射或者一个映射关系中涉及多个列作为自变量,就只能用apply而不能用map。
所以很多观点认为apply比map更好用。
实际上map也有独特之处:
- 例如:
- 要针对某一列进行字典映射时,map函数可以直接接受字典,而apply就不支持字典类型参数。
上代码对比:
"""用map实现字典映射""" df = pd.DataFrame({"姓名":["大宝","二狗","三炮","四眼","五福"],"工龄":[3,5,2,1,None],"奖金":[200,300,100,100,None]}) change = {"大宝":"张三", "二狗":"李四", "三炮":"王五", "四眼":"赵六", "五福":"宋七"} df["姓名"] = df["姓名"].map(change) # 注意:用map做字典映射的时候,字典的键必须包含Series所有的非重复值,否则没在字典键没有描述到的值也会被默认修改成最后一个键的值 def fun(x): return x + 1 df["工龄"] = df["工龄"].map(fun) # 不论map还是apply,都是只传函数名不加括号调用
"""apply可以映射多个参数的函数""" def func(x,num): return x + x * num def foo(x,y): if x >= 3: return x * y else: return x * y / 2 df["次月奖金"] = df["奖金"].apply(func,args=(0.1,),axis=1) #args用于接收额外的参数,以元组类型传递。axis默认等于0 df["年终奖"] = df.apply(lambda df: foo(x=df["工龄"],y=df["奖金"]),axis=1) # 个人推荐用法 df[["奖金","次月奖金","年终奖"]].apply(sum,axis=0) #对每列求和
根据某些特定条件修改列的值
df.loc[df["工龄"]<2,"年终奖"] = 500 # 其本质是根据特定条件找到符合条件的索引重新赋值 # 注意使用上述用法的前提是DataFrame的索引必须是连续不间断的。若索引不连续,可以先用reset_index()将索引转换成列,这样就会默认生成新的索引
用指定值填充空值
df.fillna({"工龄":1,"奖金":df["工龄"]*100},inplace=True)
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。