Linux 拨号vps windows公众号手机端

python怎么删除csv中重复的数据

lewis 8年前 (2017-08-19) 阅读数 7 #程序编程
文章标签 python

你可以使用pandas库来操作和处理csv文件,删除重复数据的方法如下:

首先,导入pandas库:

import pandas as pd

然后,使用read_csv()函数读取csv文件并将其保存为一个DataFrame对象:

df = pd.read_csv("data.csv")

接下来,使用drop_duplicates()函数删除重复的数据行:

df.drop_duplicates(inplace=True)

最后,将处理后的数据保存为新的csv文件:

df.to_csv("new_data.csv", index=False)

完整的代码如下所示:

import pandas as pd

df = pd.read_csv("data.csv")
df.drop_duplicates(inplace=True)
df.to_csv("new_data.csv", index=False)

这样就可以删除csv文件中的重复数据了。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门