解读Numpy中的排序(sort,argsort)
作者:EvanForEver
这篇文章主要介绍了关于Numpy中的排序(sort,argsort),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
Numpy中的排序(sort,argsort)
按索引排序
>>import numpy as np >>x=np.array([[0,12,48],[4,14,18],[1,7,99]]) #灵活应用索引和切片实现按索引的排序 #倒序的实现(普通列表也可用reverse实现,numpy则没有这个方法) >>x[::-1] array([[ 1, 7, 99], [ 4, 14, 18], [ 0, 12, 48]]) #指定顺序的实现(传入用于指定顺序的整数列表或ndarray即可) >>x[[2,0,1]] array([[ 1, 7, 99], [ 0, 12, 48], [ 4, 14, 18]]) >>x[[2,0,1],[0,2,1]] #只是截取部分元素,并不符合排序要求 array([ 1, 48, 14]) >>x[[2,0,1]][:,[0,2,1]] array([[ 1, 99, 7], [ 0, 48, 12], [ 4, 18, 14]]) >>x[np.ix_([2,0,1],[0,2,1])] #np.ix_函数将两个一维数组转化为用于选取方形区域的索引器 array([[ 1, 99, 7], [ 0, 48, 12], [ 4, 18, 14]])
按值大小排序
ndarray.sort(axis=-1, kind='quicksort', order=None)
或者:
ndarray.sort(axis=-1, kind='quicksort', order=None)
参数 | 描述 |
---|---|
axis | 排序沿数组的(轴)方向,0表示按行,1表示按列,None表示展开来排序,默认值为-1,表示沿最后的轴排序 |
kind | 排序的算法,提供了快排'quicksort'、混排'mergesort'、堆排'heapsort', 默认为‘quicksort' |
order | 排序的字段名,可指定字段排序,默认为None |
>>import numpy as np >>x=np.array([[0,12,48],[4,18,14],[7,1,99]]) >>np.sort(x) array([[ 0, 12, 48], [ 4, 14, 18], [ 1, 7, 99]]) >>np.sort(x,axis=1) array([[ 0, 12, 48], [ 4, 14, 18], [ 1, 7, 99]]) >>x.sort() array([[ 0, 12, 48], [ 4, 14, 18], [ 1, 7, 99]]) >>dt = np.dtype([('name', 'S10'),('age', int)]) >>a = np.array([("Mike",21),("Nancy",25),("Bob", 17), ("Jane",27)], dtype = dt) >>np.sort(a, order = 'name') array([(b'Bob', 17), (b'Jane', 27), (b'Mike', 21), (b'Nancy', 25)], dtype=[('name', 'S10'), ('age', '<i4')]) >>np.sort(a, order = 'age') array([(b'Bob', 17), (b'Mike', 21), (b'Nancy', 25), (b'Jane', 27)], dtype=[('name', 'S10'), ('age', '<i4')])
numpy.argsort(a, axis=-1, kind='quicksort', order=None)
对数组沿给定轴执行间接排序,并使用指定排序类型返回数据的索引数组。 这个索引数组用于构造排序后的数组。
参数类似于sort(),不作说明
>>import numpy as np >>> x = np.array([3, 1, 2]) >>> a=np.argsort(x) >>a #升序 #argsort函数返回的是数组值从小到大的索引值,[3, 1, 2]从小到大为[1,2,3],期对应的索引为[1,2,0] array([1, 2, 0]) >>np.argsort(-x) #降序 array([0, 2, 1], dtype=int64) >>x[a] #以排序后的顺序重构原数组 array([1, 2, 3]) #二维数组 >>x=np.array([[0,12,48],[4,18,14],[7,1,99]]) >>a1=np.argsort(x) >>a1 array([[0, 1, 2], [0, 2, 1], [1, 0, 2]], dtype=int64) #以排序后的顺序重构原数组,注意与一维数组的形式不一样 >>np.array([np.take(x[i],x[i].argsort())for i in range(3)]) array([[ 0, 12, 48], [ 4, 14, 18], [ 1, 7, 99]]) >>x[x[:,2].argsort()] #按照第三列对行进行排序 array([[ 4, 18, 14], [ 0, 12, 48], [ 7, 1, 99]]) >>x.T[x.T[:,2].argsort()].T #按照第三行对列进行排序 array([[12, 0, 48], [18, 4, 14], [ 1, 7, 99]]) >>x[:,x[2].argsort()] #还可以这样写 array([[12, 0, 48], [18, 4, 14], [ 1, 7, 99]])
lexsort(keys, axis=-1)
lexsort()根据键值的字典序进行排序,支持对数组按指定行或列的顺序排序,间接排序,不修改原数组,返回索引。一般对一维数组使用argsort()。
默认按最后一行元素有小到大排序, 返回最后一行元素排序后索引所在位置。
参数 | 描述 |
---|---|
'axis' | 数组排序时的基准,axis=0,按行排列;axis=1,按列排列 |
'keys' | 排序的参照物包括数组或包含N维的的元组,默认值为最后一行,(如果为二维数组则指最后一列) |
>>import numpy as np >>x=np.array([[0,12,48],[4,18,14],[7,1,99]]) >>np.lexsort(x) array([1, 0, 2], dtype=int64) #返回索引值 >>a=np.array([1,5,1,4,3,4,4]) >>b=np.array([9,4,0,4,0,2,1]) >>> ind=np.lexsort((b,a)) >>ind #将长度相同的a,b组合,再根据a值的大小进行排序,再考虑b值 array([2, 0, 4, 6, 5, 3, 1], dtype=int64) >>list(zip(a[ind],b[ind])) [(1, 0), (1, 9), (3, 0), (4, 1), (4, 2), (4, 4), (5, 4)] >>> c=[[1,5,1,4,3,4,4],[9,4,0,4,0,2,1]] >>> np.lexsort(c) # 此种情况与先b后a的情况一致 array([2, 4, 6, 5, 3, 1, 0], dtype=int64) #其他方法 #按最后一列顺序排序 >>x[np.lexsort(x.T)] array([[ 4, 18, 14], [ 0, 12, 48], [ 7, 1, 99]]) #按最后一列逆序排序 >>x[np.lexsort(-x.T)] array([[ 7, 1, 99], [ 0, 12, 48], [ 4, 18, 14]]) #按第一列顺序排序 >>x[np.lexsort(x[:,::-1].T)] array([[ 0, 12, 48], [ 4, 18, 14], [ 7, 1, 99]]) #按最后一行顺序排序 >>x.T[np.lexsort(x)].T array([[12, 0, 48], [18, 4, 14], [ 1, 7, 99]]) #按第一行顺序排序 >>x.T[np.lexsort(x[::-1,:])].T array([[ 0, 12, 48], [ 4, 18, 14], [ 7, 1, 99]])
numpy 数组排序np.sort()、np.argsort()
np.sort(a, axis=-1, kind=‘quicksort', order=None)
将指定轴上的每一个元素都按照从小到大的顺序排列。
Params:
- axis:默认是-1,即最大维度,二维数组就是轴1,三维数组就是轴2。
- kind:排序规则,有三个选项,如下,使用默认的就好
kind | speed | worst case | work space | stable |
---|---|---|---|---|
‘quicksort’ | 1 | O(n^2) | 0 | no |
‘mergesort’ | 2 | O(n*log(n)) | ~n/2 | yes |
‘heapsort’ | 3 | O(n*log(n)) | 0 | no |
- order:指定排序的规则。
举例:
arr = np.array([[7,3,9], [9,0,8]]) np.sort(arr,axis=0) array([[7, 0, 8], [9, 3, 9]])
指定axis=0,把每一列按照从小到大排列。
np.sort(arr,axis=1) array([[3, 7, 9], [0, 8, 9]])
指定axis=1,把每一行按照从小到大排列。
np.argsort(a, axis=-1, kind=‘quicksort', order=None)
返回的是数组值从小到大排序的索引值。就是把数组升序排序,然后看看各个元素在原来数组中的索引值,看看排在第一小的数在原来数组的哪个位置。形状与传入数组相同。
参数使用同上。
举例:
这里我们举一个简单的例子,万变不离其宗。
ind = np.argsort([4,3,5,6,0],axis=0) ind array([4, 1, 0, 2, 3], dtype=int64)
附图解释。每个数字排序时,它的index也随着数值走。最后返回其原来的index。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。