maxframe.dataframe.DataFrame.drop_duplicates#

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False, method='auto', default_index_type=None)#

返回移除重复行后的 DataFrame。

可以选择是否考虑某些列。索引(包括时间索引)将被忽略。

参数:
  • subset (column label or sequence of labels, optional) -- 仅考虑某些列来识别重复项,默认使用所有列。

  • keep ({'first', 'last', False}, default 'first') -- 确定保留哪些重复项(如果有的话)。- first:保留第一次出现的,删除其余重复项。- last:保留最后一次出现的,删除其余重复项。- any:随机保留一个,删除其余重复项。- False:删除所有重复项。

  • inplace (bool, default False) -- 是否就地删除重复项,或返回一个副本。

  • ignore_index (bool, default False) -- 如果为 True,结果轴将被标记为 0, 1, …, n - 1。

返回:

移除重复项后的 DataFrame,如果 inplace=True 则返回 None。

返回类型:

DataFrame