maxframe.dataframe.Series.plot.kde#
- Series.plot.kde(*args, **kwargs)#
使用高斯核生成核密度估计图。
在统计学中,核密度估计 (KDE) 是一种非参数方法,用于估计随机变量的概率密度函数 (PDF)。此函数使用高斯核,并包含自动带宽确定。
- 参数:
bw_method (str, scalar or callable, optional) -- 用于计算估计器带宽的方法。可以是 'scott'、'silverman'、标量常数或可调用对象。如果为 None(默认),则使用 'scott'。更多信息请参见
scipy.stats.gaussian_kde。ind (NumPy array or int, optional) -- 估计 PDF 的评估点。如果为 None(默认),则使用 1000 个等间距点。如果 ind 是 NumPy 数组,则在传入的点上评估 KDE。如果 ind 是整数,则使用 ind 个等间距点。
weights (NumPy array, optional) -- Weights of datapoints. This must be the same shape as datapoints. If None (default), the samples are assumed to be equally weighted.
**kwargs -- 其他关键字参数请参见
DataFrame.plot()。
- 返回:
The matplotlib axes containing the KDE plot.
- 返回类型:
matplotlib.axes.Axes or numpy.ndarray of them
参见
scipy.stats.gaussian_kde使用高斯核的核密度估计表示。这是内部用于估计 PDF 的函数。
示例
给定一个从未知分布中随机采样的点序列,使用 KDE 自动确定带宽来估计其 PDF,并绘制结果,在 1000 个等间距点(默认)上进行评估:
可以指定标量带宽。使用较小的带宽值可能导致过拟合,而使用较大的带宽值可能导致欠拟合:
最后,ind 参数决定了估计 PDF 图的评估点:
对于 DataFrame,其工作方式相同:
可以指定标量带宽。使用较小的带宽值可能导致过拟合,而使用较大的带宽值可能导致欠拟合:
最后,ind 参数决定了估计 PDF 图的评估点: