pandas实现读取文件常用方法与参数
作者:trayvontang
文章介绍了Pandas处理数据时常用的读写参数,包括header设置表头行、usecols选择列、names重命名列,以及读写文件时的格式、索引、表单名称等关键选项,适用于CSV和Excel文件操作
常用方法
df = pd.read_excel() df = pd.read_csv() df.to_csv() df.to_excel()
header
header默认为0,表示第一行是表头,如果header设置为None表示没有表头
header也可以是其他整数n,表示n+1行是表头,并且前n行的数据并不会读取
usecols
需要选择哪些列,默认None
- None,读取所有列
- int,读取第几列
- list,int列表,表示读取这个列表中的列
- string,excel的方式读取,例如:"A:F"表示A到F列,"A,D,E:H"表示A和D和E到H列
names
对读取的列重命名
也可以读取数据之后再重命名:
df = pd.read_csv('data.csv') df.columns = ['A','B','C']
或者:
df = pd.read_csv('data.csv') df.rename(columns = {'A':'AN','B':'BN','C':'CN'})
其他读取文件常用参数
sheet_name
:读Excel的时候读取指定名称的表单,也可以是索引,默认0index_col
:指定索引列,int类型nrows
:读取哪些行skiprows
:跳过哪些行keep_default_na
:是否保留空值,默认Truedtype
:设置列的类型,例如,{‘a’: np.float64, ‘b’: np.int32}
写文件的常用参数
float_format
:写浮点数的格式,’%.0f’columns
:列名称header
:是否输出表头,默认Trueindex
:是否输出索引,默认True
对于csv文件还可以设置:
sep
:设置分隔符,默认","mode
:设置写入模式,默认"w"
对于Excel还可以设置:
sheet_name
:表单名称,默认"Sheet1"
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。