在Python项目中如何有效地应用duplicated()函数

作者

猪帅

发布时间:2024-09-12 18:40:51

阅读量:213

在Python项目中，要有效地应用duplicated()函数，首先需要了解这个函数是属于哪个库的

以下是使用Pandas库中的duplicated()函数的示例：

import pandas as pd

data = {'A': [1, 2, 2, 3], 'B': [4, 5, 5, 6]}
df = pd.DataFrame(data)
print("原始DataFrame:")
print(df)

输出：

原始DataFrame:
   A  B
0  1  4
1  2  5
2  2  5
3  3  6

duplicates = df.duplicated()
print("重复的行：")
print(duplicates)

输出：

重复的行：
0    False
1    False
2     True
3    False
dtype: bool

unique_df = df[~duplicates]
print("去除重复行后的DataFrame:")
print(unique_df)

输出：

去除重复行后的DataFrame:
   A  B
0  1  4
1  2  5
3  3  6

通过这种方式，你可以有效地在Python项目中应用duplicated()函数来识别和处理重复数据。