python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Pandas快速合并多excel表格

Pandas快速合并多张excel表格的两种方法

作者:Dr.sky_

最近学习了python遍历目录,下面这篇文章主要给大家介绍了关于Pandas快速合并多张excel表格的两种方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

前言

最近用Pandas合并表格,发现效率非常高,现总结以下两种方法:

一、Excel表格命名存在规律的情况下

import pandas as pd
path = 'C:/Users/admin/Downloads/'  #excel表格所在文件路径
df = [] #创建一个空的列表
for i in range(1,11):   #excel表格的名字里面包含1-10
    path = path + 'excel表格名称{}.xlsx'.format(i)
    df.append(pd.read_excel(path))  #读取文件夹下所有excel文件
df_concat = pd.concat(df) #excel文件合并
df_concat.to_excel('C:/Users/admin/Downloads/合并结果.xlsx',index=None) #合并结果存储

二、Excel表格文件名不规律的情况下

1.首先将所有excel表格放到一个文件夹下面

2.用pandas进行合并

import pandas as pd
import os
path = 'C:/Users/admin/Downloads/'  #excel表格所在文件路径
df = [] #创建一个空的列表
for filename in os.listdir(dirs):   #获取文件夹下所有excel表格
    if filename.endwith('.xlsx'):
        path = dirs+filename
        df.append(pd.read_excel(path))  #读取文件夹下所有excel文件
df_concat = pd.concat(df) #excel文件合并
df_concat.to_excel(dirs+'{}.xlsx'.format('合并结果'),index=None) #合并结果存储

三、身份证号合并乱码解决

对身份证号码合并的时候,会因为编码方式出现乱码,通过表格存储过程中编码方式也无法解决,下面提供一种方式可以完美解决。

data = pd.read_excel('C:/Users/admin/Downloads/file.xlsx',index=None,converters={'身份证号码':str})
#data['身份证号码'] = data['身份证号码'].apply(lambda x:"\t"+x)
data.to_excel('需要保存的文件路径/file.xlsx',encoding='gbk',index=None)

总结

到此这篇关于Pandas快速合并多张excel表格的两种方法的文章就介绍到这了,更多相关Pandas快速合并多excel表格内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文