Python利用pandas计算多个CSV文件数据值的实例
作者:卒迹
下面小编就为大家分享一篇Python利用pandas计算多个CSV文件数据值的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件
pip install pandas import pandas as pd import glob,os,sys input_path='./' output_fiel='pandas_union_concat.csv' all_files=glob.glob(os.path.join(input_path,'sales_*')) all_data_frames=[] for file in all_files: data_frame=pd.read_csv(file,index_col=None) total_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).sum() average_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).mean() data={ 'filename':os.path.basename(file), 'total_sales':total_sales, 'average_sales':average_sales } all_data_frames.append(pd.DataFrame(data,columns=['filename','total_sales','average_sales'])) data_frame_concat=pd.concat(all_data_frames,axis=0,ignore_index=True) data_frame_concat.to_csv(output_fiel,index=False)
以上这篇Python利用pandas计算多个CSV文件数据值的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。