maxframe.dataframe.DataFrame.drop_duplicates#
- DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False, method='auto', default_index_type=None)#
返回移除重复行后的 DataFrame。
可以选择是否考虑某些列。索引(包括时间索引)将被忽略。
- 参数:
subset (column label or sequence of labels, optional) -- 仅考虑某些列来识别重复项,默认使用所有列。
keep ({'first', 'last', False}, default 'first') -- 确定保留哪些重复项(如果有的话)。-
first:保留第一次出现的,删除其余重复项。-last:保留最后一次出现的,删除其余重复项。-any:随机保留一个,删除其余重复项。- False:删除所有重复项。inplace (bool, default False) -- 是否就地删除重复项,或返回一个副本。
ignore_index (bool, default False) -- 如果为 True,结果轴将被标记为 0, 1, …, n - 1。
- 返回:
移除重复项后的 DataFrame,如果
inplace=True则返回 None。- 返回类型: