只需10行代码就能对Excel文件进行批量去重~转载
原创今天我将与大家分享:如何实现不同Excel文件重复数据消除和重写文件将进行重复数据消除和重写文件重复数据消除和重写文件将进行重复数据消除和重写~
01
去重
我们使用Pandas库的drop_duplicates(subset=None, keep=‘first’, inplace=False)功能来对Excel文件中的重复项将被删除。文件中的重复项将被删除。文件中的重复项将被删除。将从文件中删除重复项。
其中,subset参数表示指定的列标志,默认情况下,当每行记录相同时,该标志被识别为重复行。keep=‘’有‘first’、‘last’和‘False‘,即在删除重复行时,请保留first还是last或全部删除,缺省参数为‘或全部删除,缺省参数为’first’;inplace=‘’有True和Flase这是指直接更换还是保留副本?,默认值是Flase。
01
读取Excel
import pandas as pd
df = pd.read_excel(全部.xlsx)
02
选定列重复数据消除要消除重复数据的选定列要取消加权的选定列
df.drop_duplicates([用户名称])
其中第2、3属性所在行中的用户名0、1该行已复制,因此将被删除。该行是重复的,因此将被删除。该行被复制,因此被删除。
03
保存最后一份重复数据保存最后一份重复数据保存最后一份重复数据
df.drop_duplicates([用户名称],keep=last)
因为我们设定保存最后一份重复数据保存最后一份重复数据保存最后一份重复数据,所以删除了第0、1行数据。
04
保存Excel
df.to_excel(去重后.xlsx)
02
批量获取Excel文件
在上面的内容中,我们已经学习了如何为一个Excel文件去重了,但读文件名的时候还是需要手工录入,文件多的话还要一一录入,不仅麻烦,而且也不符合自动化办公自动化办公室的名称。因此,我们需要找到一种方法来获取该目录中的所有文件Excel文件。
这里我们使用这里我们使用Pathlib库,获得所有库,获得所有xlsx格式化文件。格式化文件。
path = K:自动化办公自动化办公室
将所有文件存储在此目录中将所有文件存储在该目录中将此目录中的所有文件存储到files在列表中,代码如下所示。
files = []
p = Path(src_path)
for x in p.iterdir():
if PurePath(x).match(*.xlsx):
files.append(x)
03
小结
批量对Excel文件重复数据消除的想法是。文件重复数据消除的理念是
-
得到所有得到的所有得到的所有Excel归档并将其存储在列表中。将其归档并存入清单中。文件放入列表中。列表中的文件。
-
按顺序循环浏览文件列表并执行重复数据消除。
-
每次对文件执行重复数据消除后,都会执行保存。在每次重复数据消除后执行保存。
-
本文仅供学习之用,不作其他用途。
新年终于到了,给我们讲讲我们的新行动吧
我们的金融交流队伍成立了,新的一年已经到来,大家齐心协力提高金融技能,相互协商取暖,交流信息。 去年没有抓住新能源大腿去年没有抓住新能源大腿去年没有抓住新能源大腿 公司错过了一大波红利,显然信息缺口有多重要,如何把握热点,如何完善整体财务策略,如何降低子风险,如何控制头寸,都需要研究。今年冲进一个小分队,一起做大计划。
目前群里有一些基金高手,如果您有兴趣,可以在后台进入。 小助手 找到他加入,暗号。找他加入,暗号。 基金
(小助手可能不会时不时地开始群确认,先找小助手)
推荐阅读:
入门: 最完整的零基学习最全面的零基学习最完整的零基学习Python的问题 | 从零开始学习从零基础学习从零基础学习8个月的Python | 实战项目 |学Python这是捷径,这是捷径,这是捷径
干货:爬行豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析最佳球员分析 | 从万众期待到口碑惨败!唐探3令人失望 | 笑新伊田图龙记笑新伊田图龙记笑新伊田图龙记 | 谜语之王回答灯谜之王灯谜之王谜语之王 |用Python人山人海素描图人山人海素描图人山人海 Dishonor太火了,我用机器学习做了一个迷你推荐系统电影
趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行Python日常酷跑游戏日常酷跑游戏日常酷跑游戏!
AI: 会写诗的机器人会写诗的机器人会写诗的机器人 | 给图片上色给图片上色给图片上色 | 预测收入 | 《耻辱》太火了,我用机器学习做了一部迷你推荐系统电影
小工具: Pdf转Word易于修复表单和水印!易于处理的表单和水印!轻松修复桌子和水印!易于修复的形式和水印! | 一键把html将页面另存为网页另存为网页另存为pdf!| 再见PDF提款费!提款费!提款费!提款费用! | 用90构建最强大的代码行构建最强大的代码行构建最强大的代码行PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一个固定的低成本机票提醒!制作一张别针的低价机票提醒! |60代码行做了一个语音墙纸切换,天天见女士!
年度弹出文案年度弹出文案年度爆炸性文案
-
1). 卧槽!Pdf转Word用Python轻松搞定 !
-
2).学Python闻起来好香!我用100一行代码做了一个网站,帮助人们做了一行代码,做了一个网站,帮助了人们做了一行代码,帮助了人们PS旅行图片赚鸡腿吃旅行图片赚鸡腿
-
3).第一次播放量过亿,火爆全网,我分析了《波妹》,发现了这些秘密
-
4). 80一行行代码!使用Python让救济金做正确的事做做的人做好事的人A梦分身
-
5).你必须掌握的东西你必须掌握20个python代码,简短而紧凑,永无止境的有用代码,简短而甜蜜,永无止境的有用的代码,简短而紧凑,永无止境的使用代码,简短而甜蜜,永无止境的用途
-
6). 30个Python古怪技能集古怪小贴士收藏古怪技能集
-
7). 我总结的80《菜鸟学习专页》《菜鸟学习专页》《菜鸟学习》Python精选干货.pdf》,都是干货
-
8). 再见Python!我要学Go了!2500词深度分析词深度分析词深度分析 !
-
9).发现一只舔狗的福利!这Python爬虫神器太酷了,不能自动下载女孩的照片
点击阅读原文点击查看点击点击阅读点击阅读原文点击查看200个Python案例!
版权声明
所有资源都来源于爬虫采集,如有侵权请联系我们,我们将立即删除