maxframe.dataframe.Series.drop_duplicates#

Series.drop_duplicates(keep='first', inplace=False, ignore_index=False, method='auto', default_index_type=None)#

返回去除重复值后的 Series。

参数:
  • keep ({'first', 'last', False}, default 'first') -- 处理去除重复值的方法: - 'first' : 保留第一次出现的值,去除其余重复项。 - 'last' : 保留最后一次出现的值,去除其余重复项。 - 'any' : 随机保留一个出现的值,去除其余重复项。 - False : 去除所有重复项。

  • inplace (bool, default False) -- 如果为 True,则就地执行操作并返回 None。

返回:

去除重复值后的 Series。

返回类型:

Series

参见

Index.drop_duplicates

Index 上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Series.duplicated

Series 上的相关方法,用于指示 Series 中的重复值。

示例

生成一个包含重复条目的 Series。

>>> import maxframe.dataframe as md
>>> s = md.Series(['lame', 'cow', 'lame', 'beetle', 'lame', 'hippo'],
...               name='animal')
>>> s.execute()
0      lame
1       cow
2      lame
3    beetle
4      lame
5     hippo
Name: animal, dtype: object

通过 'keep' 参数可以更改重复值的选择行为。'first' 值保留每组重复条目的第一次出现,默认的 keep 值是 'first'。>>> s.drop_duplicates().execute() 0 lame 1 cow 3 beetle 5 hippo Name: animal, dtype: object 参数 'keep' 的值 'last' 保留每组重复条目的最后一次出现。>>> s.drop_duplicates(keep='last').execute() 1 cow 3 beetle 4 lame 5 hippo Name: animal, dtype: object

参数 'keep' 的值 False 会丢弃所有重复条目。将 'inplace' 的值设置为 True 会就地执行操作并返回 None

>>> s.drop_duplicates(keep=False, inplace=True)
>>> s.execute()
1       cow
3    beetle
5     hippo
Name: animal, dtype: object