在Pandas中更改DataFrame中的值

 更新时间:2023年08月18日 14:25:14   作者:程旭员  
这篇文章主要介绍了在Pandas中更改DataFrame中的值方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Pandas如何更改DataFrame中的值

1.构造DataFrame

import pandas as pd
import numpy as np
dates = pd.date_range('20200315', periods = 5)
df = pd.DataFrame(np.arange(20).reshape((5,4)), index = dates, columns = ['A','B','C','D'])
print(df)
#输出
             A   B   C   D
2020-03-15   0   1   2   3
2020-03-16   4   5   6   7
2020-03-17   8   9  10  11
2020-03-18  12  13  14  15
2020-03-19  16  17  18  19

2.运用loc、iloc更改值

我们可以利用索引或者标签确定需要修改值的位置。

df.loc['20200318','C'] = 20200318     #标签索引
df.iloc[2,3] = 20200318    #数字索引
print(df)
#输出
             A   B         C         D
2020-03-15   0   1         2         3
2020-03-16   4   5         6         7
2020-03-17   8   9        10  20200318
2020-03-18  12  13  20200318        15
2020-03-19  16  17        18        19

3.运用条件判断更改值

如果现在的判断条件是这样, 我们想要更改B中的数, 而更改的位置是取决于 C的. 对于C大于6的位置. 更改B在相应位置上的数为0.

df.B[df.C>6] = 0    #C字段中大于6的那些行在B字段中全都设为0
print(df)
#输出
             A  B         C         D
2020-03-15   0  1         2         3
2020-03-16   4  5         6         7
2020-03-17   8  0        10  20200318
2020-03-18  12  0  20200318        15
2020-03-19  16  0        18        19

4.在DataFrame中添加一列

如果对整列做批处理, 加上一列 ‘E’, 并将 E 列全改为 NaN, 如下:

df['E'] = np.nan
print(df)
#输出
             A   B   C   D   E
2020-03-15   0   1   2   3 NaN
2020-03-16   4   5   6   7 NaN
2020-03-17   8   9  10  11 NaN
2020-03-18  12  13  14  15 NaN
2020-03-19  16  17  18  19 NaN

用上面的方法也可以加上 Series 序列(但是长度必须对齐)。

df['F'] = pd.Series([11,22,33,44,55],index = pd.date_range('20200315',periods = 5))
print(df)
#输出
             A   B   C   D   E   F
2020-03-15   0   1   2   3 NaN  11
2020-03-16   4   5   6   7 NaN  22
2020-03-17   8   9  10  11 NaN  33
2020-03-18  12  13  14  15 NaN  44
2020-03-19  16  17  18  19 NaN  55

pandas Dataframe批量修改值

在使用dataframe的时候 有时候会碰到需要批量修改数据的时候,今天主要说明两种情况

一.使用iloc对某几行某几列进行全部修该

二.对数据进行判定后,相互+/-/*某个数,使用内置函数

1.使用iloc对数据进行批量修改

使用iloc最简单的就是将数据批量修改为某个特定的值以下是我随便写入的数据

在这里插入图片描述

现在将[‘d’,‘e’]列,[2,3,4]行的数据全部修改为0

import pandas as pd
data = pd.read_excel('some_chaneg.xlsx')
data1 = data
data1.iloc[2:5,3:] = 0
data1

.iloc用法[],先行后列,并且都是不包含最后一个元素,例如取[2,3,4]就是[2:5],列同样遵循此规则

2.对数据进行判定后,相互+/-/某个数

*第一种方法:使用内置函数where函数

Series.where(cond, other=nan, inplace=False, axis=None, level=None, errors='rais',...)

解释下来就是如果cond为真,则保持原来的值,否则替换为other,这里的condother参数由我们自己写入控制

# data2为data数据的一部分
data2 = data.iloc[0:,1:]
print(data2)
data2.where(data2>25, data2+5,inplace=True)

data2原数据

跑完之后的数据

选取data2中<25的数据,全部加上5

第二种方法:使用mask函数

mask和where刚好相反

mask(cond, other=nan)
  • where:替换条件(condition)为False处的值
  • mask:替换条件(condition)为True处的值

还是以data2举例

data2.mask(data2<25, data2+5, inplace=True)

mask函数

第三种方法:replace函数

replace可以替换文本值,也可以使用字典替换多个值,

也可以使用正则表达式嵌套方法,替换很多不同的值

替换文本值

# 替换文本值
data3 = data
data3.replace('wange', 'sheng', inplace=True)
data3

原数据

替换后

替换多个值

将所有的0和1互换

# 替换多个值# 将所有的0和1互换data3.replace({<!-- -->1:0,0:1},inplace&#61;True)
# 替换多个值
# 将所有的0和1互换
data3.replace({1:0,0:1},inplace=True)

原数据

替换之后

运用正则表达式

将所有含英文字母的全部变成Anonymous

# 切记使用正则表达式的时候,一定要添加上regex=True
data3.replace('[a-zA-Z]+','Anonymous',regex=True,inplace=True)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python学习之读取配置文件

    python学习之读取配置文件

    这篇文章主要介绍了python学习之读取配置文件,文章基于python的相关资料展开对主题的详细介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-04-04
  • python计算机视觉opencv矩形轮廓顶点位置确定

    python计算机视觉opencv矩形轮廓顶点位置确定

    这篇文章主要为大家介绍了python计算机视觉opencv矩形轮廓顶点位置确定,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 使用Python开发个京东上抢口罩的小实例(仅作技术研究学习使用)

    使用Python开发个京东上抢口罩的小实例(仅作技术研究学习使用)

    这篇文章主要介绍了使用Python开发个京东上抢口罩的小实例(仅作技术研究学习使用),需要的朋友可以参考下
    2020-03-03
  • Python 中 Pandas 文件操作和读取 CSV 参数详解

    Python 中 Pandas 文件操作和读取 CSV 参数详解

    CSV 又称逗号分隔值文件,是一种简单的文件格式,以特定的结构来排列表格数据,这篇文章主要介绍了Python 之 Pandas 文件操作和读取 CSV 参数详解,需要的朋友可以参考下
    2023-03-03
  • Python3模拟登录操作实例分析

    Python3模拟登录操作实例分析

    这篇文章主要介绍了Python3模拟登录操作,结合实例形式分析了Python3模拟登陆验证、判断、文件读写等相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • pyhton中__pycache__文件夹的产生与作用详解

    pyhton中__pycache__文件夹的产生与作用详解

    这篇文章主要介绍了pyhton中__pycache__文件夹的产生与作用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • python中Pytest常用的插件

    python中Pytest常用的插件

    这篇文章主要介绍了python中Pytest常用的插件,Pytest是Python的一种单元测试框架,与unittest相比,使用起来更简洁、效率更高,也是目前大部分使用python编写测试用例的小伙伴们的第一选择了
    2022-06-06
  • 利用pandas按日期做分组运算的操作

    利用pandas按日期做分组运算的操作

    这篇文章主要介绍了利用pandas按日期做分组运算的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python脚本去除文件的只读性操作

    Python脚本去除文件的只读性操作

    这篇文章主要介绍了Python脚本去除文件的只读性操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • 关于对python中进程的几个概念理解

    关于对python中进程的几个概念理解

    进程由程序,数据和进程控制块组成,是正在执行的程,程序的一次执行过程,是资源调度的基本单位,下面这篇文章主要给大家介绍了关于对python中进程的几个概念理解,需要的朋友可以参考下
    2021-10-10

最新评论