Python数据清洗工具之Numpy的基本操作
作者:行秋即离
1. Numpy(Numberical Python)
Anaconda中已经集成了NumPy,可以直接使用。如果想要自行安装的话,可以使用流行的Python
包安装程序 pip 来安装 NumPy,目前使用的是Anaconde的环境进行学习和使用这个库
1.1 这库的安装方法
CMD :pip install numpy
或者使用清华源的镜像库:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
(直接复制可用)
如果想查看这个库的版本:
import numpy as np np.__version__
其实很多其他库也可以用这个方法进行查看库的版本
2.Numpy的基础操作
Numpy的操作对象是一个ndarray,所以在使用这个库进行计算的时候需要将数据进行转化
2.1 数组的创建:np.arrary()
np.array 可以把 list,tuple或者其他的序列模式的数据转创建为 ndarray,默认创建一个新的
ndarray
我们会发现原来数据里面有int, float型的数据都被转换成相同的类型了,统一转变成float型的数据了,因为Numpy是要求array里面的数据类型是一致的
2.2 N维数组的创建
Numpy不仅可以生成一维数组,也可以生成多维数组。
比如,可以生成如下的二维数组:
2.3 常用数组
2.4 线性数组的生成
2.5 数组的运算
数组的运算时对应位置的元素进行简单的四则运算
这里需要注意的是,数组x和数组y的元素个数是相同的(两者均是元素个数为3的一维数组)
当两者元素个数相同时,可以对各个元素进行算术运算。如果元素个数不同,则会报错,所以保
持元素个数一致非常重要。
此外,Numpy数组不仅可以进行对应元素的算术运算,还可以和单一的数值(标量)组合起来进
行运算(这个功能也被称为广播,后面会详细介绍),比如:
会把数据转成数组默认的float的数据类型
2.6 数组的形状变换
我们先定义一个数组
如果数组的量级比较大,对于计算的时候只知道其他的一个维度数字,则可以使用下面的-1,作为占位符,会自动帮你补齐另外一个维度的信息
除此之外,还有一种比较常用的数组拉平方法, m.flatten()以及m.ravel(),这两种方法类似
3. 数组的索引
可以将这个二维的数组看成一个矩阵,3行四列, 通过数字的下标索引进行提取数字,这里的切片操作还是左闭右开的
4.广播功能
术语广播是指 NumPy 在算术运算期间处理不同形状的数组的能力。
广播可以简单理解为用于不同大小数组的计算(加、减、乘、除等)的一组规则。
如果数组的形状相同,则对相应元素逐个计算,但是如果数组的维度不相同,就需要用到广播机制
Numpy的广播遵循一组严格的规则:
规则1:如果两个数组的维度数不相同,那么小维度数组的形状将会在最左边补1规则2:如果两个数组的形状在任何一个维度上都不匹配,那么数组的形状会沿着维度为1的维度扩展以匹配另外一个数组的形状规则3:如果两个数组的形状在任何一个维度上都不匹配并且没有任何一个维度为1,则会引 发异常无法广播
到此这篇关于Python数据清洗工具之Numpy的基本操作的文章就介绍到这了,更多相关Python数据清洗内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!