Numpy 数组索引的实现
作者:岳来
数组索引是指使用方括号([])来索引数组值,numpy提供了比常规的python序列更多的索引工具。除了按整数和切片索引之外,数组可以由整数数组索引、布尔索引及花式索引。下面逐一学习。
一、整数索引
这种机制有助于基于 N 维索引来获取数组中任意元素。 每个整数数组表示该维度的下标值。 当索引的元素个数就是目标ndarray的维度时,会变得相当直接。
import numpy as np >>> s = np.arange(27).reshape(3,3,3) >>> s array([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]]]) >>> s[1] array([[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]) >>> s[1][1] array([12, 13, 14]) >>> s[1][1][1] 13
二、切片索引
原理:切片操作是指抽取数组的一部分元素生成新数组。对 python 列表进行切片操作得到的数组是原数组的副本,而对 Numpy 数据进行切片操作得到的数组则是指向相同缓冲区的视图。如果想抽取(或查看)数组的一部分,必须使用切片语法,也就是,把几个用冒号( start:stop:step )隔开的数字置于方括号内。为了更好地理解切片语法,还应该了解不明确指明起始和结束位置的情况。如省去第一个数字,numpy 会认为第一个数字是0;如省去第二个 数字,numpy 则会认为第二个数字是数组的大索引值;如省去后一个数字,它将会被理解为1,也就是抽取所有元素而不再考虑间隔。
2.1、一维数组切片
同python 中list 切片
>>> s1 = np.array([3, 8, 6, 9, 0]) >>> s1 array([3, 8, 6, 9, 0]) >>> s1[3] 9 >>> s1[1:3] array([8, 6]) >>> s1[-1] 0 >>> s1[2:] array([6, 9, 0]) >>> s1[:4] array([3, 8, 6, 9]) >>> s1[:] array([3, 8, 6, 9, 0])
2.2、多维数组切片
>>> s2 = np.arange(12).reshape(3,4) >>> s2 array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) >>> s2[1] array([4, 5, 6, 7]) >>> s2[1][:1] array([4]) >>> s2[1][:3] array([4, 5, 6])
三、整数数组索引
数组作为索引的一大优势,便是可以将索引得到的结果组织成自己想要的形状。
输出结果的shape与索引数组的shape相同,而输出中各个元素的取值,便是由各个索引数组对应位置的值作为index索引得到。
3.1、 一维数组的整数数组索引
>>> x = np.arange(10,1,-1) >>> x array([10, 9, 8, 7, 6, 5, 4, 3, 2]) >>> x[np.array([3, 3, 1, 8])] array([7, 7, 9, 2]) >>> x[np.array([[0,1][2,3]])] array([[10, 9], [ 8, 7]])
3.2、多维数组的整数数组索引
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2])] # 获取数组的第0行和第2行 array([[ 0, 1, 2, 3, 4], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2]),np.array([1,3])] # 获取数组第0行的第二个元素和第2行的第四个元素 array([ 1, 13]) >>> a[np.array([1,2])] array([[ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) # 获取数组a[np.array([[0,2])] 的第一行的第二个元素和第二行的第四个元素... >>> a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])] array([[ 1, 13], [ 5, 12]])
每一个索引数组单独控制一个维度。例如对于 a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],此时np.array([[0,2],[1,2]])控制输出的对应位置的行索引,np.array([[1,3],[0,2]])]控制输出的对应位置的列索引。行列索引组织在一起,便可以得到输出的每个位置的索引。
具体地,对于a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],
由于np.array([[0,2],[1,2]])的shape为(2, 2),因此输出是一个(2,2)的矩阵。
在左上位置,行索引为0,列索引为1,值为1;
在右上位置,行索引为2,列索引为3,值为13;
在左下位置,行索引为0,列索引为1,值为5;
在右下位置,行索引为2,列索引为2, 值为12。
因此输出的矩阵即为,array([[1, 13],[5, 12]])。
充分利用"广播"机制,以及对于维度数量的省略,使得以数组作为索引的方式有更加灵活的应用,例如:
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2]),3] array([ 3, 13]) >>> a[np.array([0,2])] array([[ 0, 1, 2, 3, 4], [10, 11, 12, 13, 14]])
在上例中,a[np.array([0,2]),3] 便可以广播为 a[np.array([0,2]),np.array([3,3])],从而化为我们熟悉的形式。而 a[np.array([0,2])] 通过省略一个维度,达到索引该维度全体数据的效果。
四、布尔索引
bool数组可以通过直接指出保留的值(True)与舍弃的值(False),来构建输出的数组。
bool数组的shape需要与被索引的数组(的前若干个维度)shape严格对齐。
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> b = a > 10 >>> b array([[False, False, False, False, False], [False, False, False, False, False], [False, True, True, True, True]]) >>> a[b] array([11, 12, 13, 14])
使用bool 值获取数组元素
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([True])] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 1 >>> a[np.array([True, False])] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 2 >>> a[np.array([True, False,False])] array([[0, 1, 2, 3, 4]]) >>> a[np.array([False, False,False])] array([], shape=(0, 5), dtype=int64) >>> a[np.array([False, False,True])] array([[10, 11, 12, 13, 14]]) >>> a[np.array([True, True,True])] array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([False, False,True]),np.array([True,False,True,False,True])] array([10, 12, 14])
五、花式索引
花式索引指的是利用整数数组进行索引。
花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。
对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素,如果目标是二维数组,那么就是对应下标的行。
花式索引跟切片不一样,它总是将数据复制到新数组中。
>>> a = np.arange(12)**2 >>> a array([ 0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121]) >>> i = np.array( [ 1,1,3,8,5 ] ) >>> i array([1, 1, 3, 8, 5]) >>> a[i] array([ 1, 1, 9, 64, 25]) >>> j = np.array( [ [ 3, 4], [ 9, 7 ] ] ) >>> j array([[3, 4], [9, 7]]) >>> a[j] array([[ 9, 16], [81, 49]])
当被索引的数组是多维数组时,将按照它的第一轴进行索引的
>>> p = np.arange(27).reshape(3,3,3) >>> p array([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]]]) >>> l = np.array([[0, 2, 1],[1,2,1]]) >>> p[l] array([[[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]], [[[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]]]) >>> c = np.array([0,0,0]) >>> p[c] array([[[0, 1, 2], [3, 4, 5], [6, 7, 8]], [[0, 1, 2], [3, 4, 5], [6, 7, 8]], [[0, 1, 2], [3, 4, 5], [6, 7, 8]]])
参考文档
1、https://blog.csdn.net/qq_45759562/article/details/109249685
2、https://zhuanlan.zhihu.com/p/427216184
3、http://t.zoukankan.com/lavender1221-p-12651442.html
4、https://www.runoob.com/numpy/numpy-advanced-indexing.html
到此这篇关于Numpy 数组索引的实现的文章就介绍到这了,更多相关Numpy 数组索引内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!