maxframe.dataframe.Series.drop_duplicates#
- Series.drop_duplicates(keep='first', inplace=False, ignore_index=False, method='auto', default_index_type=None)#
返回去除重复值后的 Series。
- 参数:
keep ({'first', 'last',
False}, default 'first') -- 处理去除重复值的方法: - 'first' : 保留第一次出现的值,去除其余重复项。 - 'last' : 保留最后一次出现的值,去除其余重复项。 - 'any' : 随机保留一个出现的值,去除其余重复项。 -False: 去除所有重复项。inplace (bool, default
False) -- 如果为True,则就地执行操作并返回 None。
- 返回:
去除重复值后的 Series。
- 返回类型:
参见
Index.drop_duplicatesIndex 上的等效方法。
DataFrame.drop_duplicatesDataFrame 上的等效方法。
Series.duplicatedSeries 上的相关方法,用于指示 Series 中的重复值。
示例
生成一个包含重复条目的 Series。
>>> import maxframe.dataframe as md >>> s = md.Series(['lame', 'cow', 'lame', 'beetle', 'lame', 'hippo'], ... name='animal') >>> s.execute() 0 lame 1 cow 2 lame 3 beetle 4 lame 5 hippo Name: animal, dtype: object
通过 'keep' 参数可以更改重复值的选择行为。'first' 值保留每组重复条目的第一次出现,默认的 keep 值是 'first'。>>> s.drop_duplicates().execute() 0 lame 1 cow 3 beetle 5 hippo Name: animal, dtype: object 参数 'keep' 的值 'last' 保留每组重复条目的最后一次出现。>>> s.drop_duplicates(keep='last').execute() 1 cow 3 beetle 4 lame 5 hippo Name: animal, dtype: object
参数 'keep' 的值
False会丢弃所有重复条目。将 'inplace' 的值设置为True会就地执行操作并返回None。>>> s.drop_duplicates(keep=False, inplace=True) >>> s.execute() 1 cow 3 beetle 5 hippo Name: animal, dtype: object