使用python的pandas批量合并Excel
原创今天分享一个利用 Pandas
进行数据分析的小技巧,也是之前有粉丝在后台进行提问的,即如何将多个 pandas.dataframe
保存到同一个 Excel
中。
其实只需要灵活使用 pandas
中的 pd.ExcelWriter()
方法即可!
假设现在我们有 df1 df2 df3
三个 dataframe
,需要将它们保存到同一个 Excel
的不同 sheet
中,只需要先创建一个 ExcelWriter
对象,然后不停写入就行
df1 = pd.read_csv(东京奥运会奖牌数据.csv)
df2 = pd.read_excel("TOP250.xlsx")
df3 = pd.read_excel("2020年中国大学排名.xlsx")
writer = pd.ExcelWriter(test.xlsx)
df1.to_excel(writer,sheet_name="df1",index=False)
df2.to_excel(writer,sheet_name="df2",index=False)
df3.to_excel(writer,sheet_name="df3",index=False)
writer.save()
是不是和常见的文件读写 with
方法类似,我们也可以使用同样的方法
with pd.ExcelWriter("test1.xlsx") as xlsxwriter:
df1.to_excel(xlsxwriter,sheet_name="df1",index=False)
df2.to_excel(xlsxwriter,sheet_name="df2",index=False)
df3.to_excel(xlsxwriter,sheet_name="df3",index=False)
得到的结果是一样的,可以将多个 df
保存到一个Excel中
这个方法虽然简单好用,但是如果要保存的 df
太多了,一个一个手动去读取再手动去保存就显得十分麻烦,另外我们希望 sheet
是文件名,如果手动复制粘贴,就更麻烦了。
这时, 办公自动化 系列的文章就发挥作用了,我们先简单拿来一个小脚本「获取指定目录下的全部Excel文件名」
import os
def getfile(dirpath):
filelist = []
for root,dirs,files in os.walk(dirpath):
for file in files:
if file.endswith("xlsx") or file.endswith("csv"):
filelist.append(os.path.join(root,file))
return filelist
执行一下,可以看到指定目录下的全部 Excel
文件名
下面要做的,我想不用多说了「循环读取,自动保存」
filelist = getfile(/Users/liuzaoqi/Desktop/zaoqi/2022公众号文章/如何保存多个df)
writer = pd.ExcelWriter(test.xlsx)
for file in filelist:
if file.endswith("xlsx"):
df = pd.read_excel(file)
else:
df = pd.read_csv(file)
df.to_excel(writer,sheet_name=file.split(/)[-1].split(.)[0],index=False)
writer.save()
现在,当前目录下的全部Excel就自动合并到一个 Excel
中的不同 sheet
中,并且sheet名是对应的文件名
如果你对本文的内容感兴趣,不妨拿走代码试一下,如果你还有 pandas
相关问题,欢迎在评论区留言。
版权声明
所有资源都来源于爬虫采集,如有侵权请联系我们,我们将立即删除