python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Pandas iloc[]和loc[]

Pandas中iloc[]和loc[]的实现示例

作者:人工干智能

Pandas中的iloc[]和loc[]是数据索引的核心方法,主要区别在于索引依据,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

iloc[]和loc[]是Pandas中用于数据索引/切片的核心方法,核心区别在于索引依据不同:iloc基于“整数位置”,loc基于“标签(行索引名/列名)”。以下分点对比并结合实例说明:

一、区别对比

维度iloc[](integer location)loc[](label location)
索引依据行/列的整数位置(从0开始计数)行的索引名、列的列名(标签)
切片规则左闭右开(如0:2仅包含位置0、1)包含终点(如'a':'c'包含标签a、b、c)
支持的索引类型整数、整数列表、整数切片、布尔数组标签、标签列表、标签切片、布尔数组
适用场景按数据的“物理顺序”取数(不管行/列标签)按数据的“逻辑标签”取数(依赖行/列的命名)

注:Pandas 的 “列标签” 和 “行标签” 分别对应 DataFrame.columns 和 DataFrame.index。而机器学习中的 “样本标签”是指样本的目标值(label / 目标变量),二者不同。
注:iloc和loc都支持可调用对象(callable)(比如df.loc[lambda df: df[‘列名’]>0])

二、实例演示(构造带自定义标签的DataFrame)

先创建一个行索引为自定义标签的DataFrame(避免默认整数索引,更易体现区别):

import pandas as pd

data = pd.DataFrame(
    data={'数学': [90, 85, 78], '英语': [88, 92, 75]},
    index=['张三', '李四', '王五']  # 行标签(非默认整数)
)
print("原始DataFrame:")
print(data)

输出:

    数学  英语
张三  90  88
李四  85  92
王五  78  75

1. iloc取单行/loc取单列

2. iloc取多行/loc取多列(切片)

3. 取特定行+列(二维索引)

4. 布尔索引(按条件取数)

两者都支持布尔数组,但loc更常用(直接关联标签):

# 条件:数学分数>80
mask = data['数学'] > 80

# iloc:先获取满足条件的行位置,再取数
data.iloc[mask.values]  # mask.values是布尔数组,对应行位置
# 输出:
#    数学  英语
# 张三  90  88
# 李四  85  92

# loc:直接用布尔数组取数(更直观)
data.loc[mask]
# 输出同iloc

三、注意点

  1. 若DataFrame用默认整数行索引(如0、1、2),iloc[0]loc[0]结果可能相同,但逻辑本质不同:iloc[0]是“取位置0”,loc[0]是“取标签为0的行”;
  2. iloc的切片不包含终点(如0:3取0、1、2),loc的切片包含终点(如0:3取标签0、1、2、3),这是最易踩坑的差异;
  3. 实际场景中:
    • 若需要按“数据的物理顺序”取数(如“前5行”),用iloc
    • 若需要按“行/列的命名”取数(如“取‘张三’的成绩”),用loc

测试:看你是否能读懂这句程序:

numerical_df.loc[numerical_df['A'] < numerical_df['B'], 'A'] = 100

到此这篇关于Pandas中iloc[]和loc[]的实现示例的文章就介绍到这了,更多相关Pandas iloc[]和loc[]内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文