DataFrame#
构造函数#
|
属性和底层数据#
轴
返回 DataFrame 中的 dtype。 |
|
|
返回每列的内存使用量(以字节为单位)。 |
返回表示轴数 / 数组维度的整数。 |
|
|
基于列的数据类型返回 DataFrame 列的一个子集。 |
转换#
|
将 pandas 对象转换为指定的 |
|
使用支持 |
|
尝试为对象列推断更好的数据类型。 |
索引、迭代#
访问行/列标签对的单个值。 |
|
|
返回前 n 行。 |
通过整数位置访问单个行/列对的值。 |
|
基于纯整数位置的索引选择。 |
|
|
在指定位置插入列到DataFrame。 |
通过标签或布尔数组访问行和列组。 |
|
|
替换条件为True的值。 |
|
返回并从frame中删除项。 |
|
使用布尔表达式查询DataFrame的列。 |
|
返回最后 n 行。 |
|
从Series/DataFrame返回交叉部分。 |
|
替换条件为False的值。 |
二元运算符函数#
|
获取dataframe与其他元素的加法(二元运算符 add)。 |
|
获取dataframe与其他元素的减法(二元运算符 subtract)。 |
|
获取DataFrame与其他元素的乘法(二元运算符 mul)。 |
|
获取DataFrame与其他元素的浮点除法(二元运算符 truediv)。 |
|
获取DataFrame与其他元素的浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 和 other 的整数除法,逐元素(二元运算符 floordiv)。 |
|
获取 DataFrame 和 other 的模运算,逐元素(二元运算符 mod)。 |
|
获取 DataFrame 和 other 的指数幂运算,逐元素(二元运算符 pow)。 |
|
计算 DataFrame 和 other 之间的矩阵乘法。 |
|
获取 DataFrame 和 other 的加法,逐元素(二元运算符 radd)。 |
|
获取 DataFrame 和 other 的减法,逐元素(二元运算符 rsubtract)。 |
|
获取 DataFrame 和 other 的乘法,逐元素(二元运算符 rmul)。 |
|
获取 DataFrame 和 other 的浮点除法,逐元素(二元运算符 rtruediv)。 |
|
获取 DataFrame 和 other 的浮点除法,逐元素(二元运算符 rtruediv)。 |
|
获取 DataFrame 和 other 的整数除法,逐元素(二元运算符 rfloordiv)。 |
|
获取 DataFrame 和 other 的模运算,逐元素(二元运算符 rmod)。 |
|
获取 DataFrame 和 other 的指数幂运算,逐元素(二元运算符 rpow)。 |
|
获取 DataFrame 和 other 的小于比较,逐元素(二元运算符 lt)。 |
|
获取 DataFrame 和 other 的大于比较,逐元素(二元运算符 gt)。 |
|
获取 DataFrame 和 other 的小于等于比较,逐元素(二元运算符 le)。 |
|
获取 DataFrame 和 other 的逐元素大于等于比较结果(二元运算符 ge)。 |
|
获取 DataFrame 和 other 的逐元素不等于比较结果(二元运算符 ne)。 |
|
获取 DataFrame 和 other 的逐元素等于比较结果(二元运算符 eq)。 |
|
与另一个 DataFrame 进行列方向组合操作。 |
|
使用 other 中相同位置的值更新空值元素。 |
函数应用、分组与窗口操作#
|
沿 DataFrame 的轴应用函数。 |
|
逐元素地对 DataFrame 应用函数。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
提供指数加权函数。 |
|
提供扩展变换操作。 |
|
使用映射器或按列 Series 对 DataFrame 进行分组。 |
|
逐元素地对 DataFrame 应用函数。 |
|
提供滚动窗口计算功能。 |
|
对自身调用 |
计算与描述性统计#
|
|
|
|
|
在输入阈值处修剪值。 |
|
|
|
计算列之间的成对相关性,排除 NA/null 值。 |
|
计算成对相关性。 |
|
计算列之间的成对协方差,排除 NA/null 值。 |
|
生成描述性统计信息。 |
|
元素的一阶离散差分。 |
|
评估一个描述 DataFrame 列操作的字符串。 |
|
|
|
|
|
|
|
|
|
获取沿选定轴的每个元素的众数。 |
|
统计请求轴上的不同观测值数量。 |
|
当前元素与前一个元素之间的百分比变化。 |
|
|
|
|
|
返回在请求轴上给定分位数的值。 |
|
沿轴计算数值数据的排名(从1到n)。 |
|
将 DataFrame 四舍五入到可变的小数位数。 |
|
|
|
|
|
|
|
|
|
重新索引 / 选择 / 标签操作#
|
为标签添加字符串 prefix 前缀。 |
|
为标签添加字符串 suffix 后缀。 |
|
使用指定的连接方法在轴上对齐两个对象。 |
|
选择一天中特定时间的值(例如,上午9:30)。 |
|
选择一天中特定时间之间的值(例如,上午9:00-9:30)。 |
|
从行或列中删除指定的标签。 |
|
返回删除重复行后的 DataFrame。 |
|
返回删除了请求的索引/列级别的 Series/DataFrame。 |
|
返回表示重复行的布尔 Series。 |
|
根据指定的索引标签对 DataFrame 的行或列进行子集选择。 |
|
返回前 n 行。 |
|
返回请求轴上最大值首次出现的索引。 |
|
返回请求轴上最小值首次出现的索引。 |
|
使 Series/DataFrame 符合新的索引,并可选择填充逻辑。 |
|
返回一个与另一个对象具有相同索引的对象。 |
|
更改轴标签。 |
|
为索引或列设置轴的名称。 |
|
重置索引,或其某一层级。 |
|
从对象的某个轴中返回随机样本。 |
|
为给定轴分配所需的索引。 |
|
使用现有列设置 DataFrame 的索引。 |
|
沿轴返回给定*位置*索引处的元素。 |
|
在某个索引值前后截断 Series 或 DataFrame。 |
缺失值处理#
|
删除缺失值。 |
|
使用指定方法填充 NA/NaN 值。 |
检测缺失值。 |
|
检测缺失值。 |
|
检测存在的(非缺失)值。 |
|
检测存在的(非缺失)值。 |
重塑、排序、转置#
|
将 DataFrame 从宽格式转换为长格式,可选择保留标识符。 |
|
返回按 columns 降序排列的前 n 行。 |
|
返回按 columns 升序排列的前 n 行。 |
|
返回由给定索引/列值组织的重塑后的 DataFrame。 |
|
创建一个类似电子表格的透视表作为 DataFrame。 |
|
使用输入顺序重新排列索引级别。 |
|
按任一轴上的值进行排序。 |
|
按标签(沿某一轴)对对象进行排序。 |
|
在 |
|
将指定的级别从列堆叠到索引。 |
|
解堆叠,也称为透视,将具有 MultiIndex 的 Series 转换为 DataFrame。 |
合并 / 比较 / 连接 / 合并#
|
将 other 的行追加到调用者的末尾,返回一个新对象。 |
|
为 DataFrame 分配新列。 |
|
与另一个 DataFrame 比较并显示差异。 |
|
连接另一个 DataFrame 的列。 |
|
使用数据库风格的连接合并 DataFrame 或命名的 Series 对象。 |
|
使用另一个 DataFrame 中的非 NA 值就地修改。 |
绘图#
DataFrame.plot 既是一个可调用方法,也是一个命名空间属性,用于特定形式的绘图方法 DataFrame.plot.<kind>。
|
绘制堆叠面积图。 |
|
垂直条形图。 |
|
绘制水平条形图。 |
|
绘制 DataFrame 列的箱线图。 |
|
使用高斯核生成核密度估计图。 |
|
生成六边形箱图。 |
|
绘制 DataFrame 列的直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制为折线图。 |
|
生成饼图。 |
|
创建具有不同标记点大小和颜色的散点图。 |
序列化 / IO / 转换#
|
从类似数组或字典的字典构造 DataFrame。 |
|
将结构化或记录型 ndarray 转换为 DataFrame。 |
|
将对象复制到系统剪贴板。 |
|
将对象写入逗号分隔值 (CSV) 文件。 |
|
将 DataFrame 转换为 Python dict |
|
将 DataFrame 转换为 JSON 字符串。 |
|
将 DataFrame 对象写入 MaxCompute (ODPS) 表。 |
|
|
|
将 DataFrame 写入二进制 parquet 格式,每个数据块都将被写入一个 Parquet 文件。 |
MaxFrame 扩展方法#
|
应用一个接受 pandas DataFrame 并输出 pandas DataFrame/Series 的函数。 |
|
将指定列中的值合并为键值表示的列。 |
|
将键值表示的列中的值提取为独立列。 |
|
对每一行应用给定函数,然后展平结果。 |
|
某些 DataFrame 上的 Map-reduce API。 |
|
使数据在整个集群中更加均衡。 |
|
对 DataFrame 或 Series 中的数据进行重排,使数据分布更加随机。 |
|
重新分块 DataFrame、Series 或 Index 数据。 |
DataFrame.mf 提供了 MaxFrame 特有的方法。这些方法是从 MaxCompute 的应用场景中整理而来,可以通过 DataFrame.mf.<function/property> 的方式进行访问。