分组#

GroupBy 对象通过 groupby 调用返回:maxframe.dataframe.DataFrame.groupby()maxframe.dataframe.Series.groupby() 等。

索引、迭代#

函数应用#

GroupBy.apply(func, *args[, output_type, ...])

按组应用函数 func 并将结果合并在一起。

GroupBy.agg([func, method])

对分组数据使用一个或多个操作进行聚合。

GroupBy.aggregate([func, method])

对分组数据使用一个或多个操作进行聚合。

GroupBy.transform(f, *args[, dtypes, dtype, ...])

在每个组上调用生成具有相同索引的 DataFrame 的函数,并返回一个与原始对象具有相同索引且填充了转换值的 DataFrame

计算 / 描述性统计#

GroupBy.all(**kw)

GroupBy.any(**kw)

GroupBy.cumcount([ascending])

为每组中的每一项从 0 到该组长度减一编号。

GroupBy.cummax()

每组的累积最大值。

GroupBy.cummin()

每组的累积最小值。

GroupBy.cumprod()

每组的累积乘积。

GroupBy.cumsum()

每组的累积总和。

GroupBy.count(**kw)

GroupBy.expanding([min_periods, shift, ...])

返回一个扩展分组器,为每组提供扩展功能。

GroupBy.max(**kw)

GroupBy.mean(**kw)

GroupBy.median(**kw)

GroupBy.min(**kw)

GroupBy.rolling(window[, min_periods, ...])

返回一个滚动分组器,为每个分组提供滚动功能。

GroupBy.size(**kw)

GroupBy.sem(**kw)

GroupBy.std(**kw)

GroupBy.sum(**kw)

GroupBy.var(**kw)

以下方法在 SeriesGroupByDataFrameGroupBy 对象中都可用,但可能略有不同,通常 DataFrameGroupBy 版本允许指定 axis 参数,并且通常有一个参数用于指示是否限制应用于特定数据类型的列。

DataFrameGroupBy.count(**kw)

DataFrameGroupBy.nunique(**kw)

DataFrameGroupBy.cummax()

每组的累积最大值。

DataFrameGroupBy.cummin()

每组的累积最小值。

DataFrameGroupBy.cumprod()

每组的累积乘积。

DataFrameGroupBy.cumsum()

每组的累积总和。

DataFrameGroupBy.fillna([value, method, ...])

使用指定的方法填充 NA/NaN 值

DataFrameGroupBy.idxmax(**kw)

DataFrameGroupBy.idxmin(**kw)

DataFrameGroupBy.nunique(**kw)

DataFrameGroupBy.rank([method, ascending, ...])

提供每组内值的排名。

DataFrameGroupBy.sample([n, frac, replace, ...])

从每个组中返回随机样本项。

以下方法仅适用于 SeriesGroupBy 对象。

以下方法仅适用于 DataFrameGroupBy 对象。

DataFrameGroupBy.mf.apply_chunk(func[, ...])

按组应用函数 func 并将结果合并在一起。