maxframe.tensor.random.binomial#

maxframe.tensor.random.binomial(n, p, size=None, chunk_size=None, gpu=None, dtype=None)[源代码]#

从二项分布中抽取样本。

样本从具有指定参数的二项分布中抽取,n 次试验,成功概率为 p,其中 n 是大于等于 0 的整数,p 在区间 [0,1] 内。(n 可以输入为浮点数,但使用时会被截断为整数)

参数:
  • n (int or array_like of ints) -- 分布的参数,>= 0。也接受浮点数,但会被截断为整数。

  • p (float or array_like of floats) -- 分布的参数,>= 0 且 <=1。

  • size (int or tuple of ints, optional) -- 输出形状。如果给定的形状是,例如 (m, n, k),则抽取 m * n * k 个样本。如果 size 是 None``(默认),当 ``np 都是标量时返回单个值。否则,抽取 mt.broadcast(n, p).size 个样本。

  • chunk_size (int or tuple of int or tuple of ints, optional) -- 每个维度上的期望块大小

  • gpu (bool, optional) -- 如果为 True,则在 GPU 上分配张量,默认为 False

  • dtype (data-type, optional) -- 返回张量的数据类型。

返回:

out -- 从参数化的二项分布中抽取的样本,其中每个样本等于 n 次试验中的成功次数。

返回类型:

Tensor or scalar

参见

scipy.stats.binom

概率密度函数、分布或累积密度函数等。

备注

二项分布的概率密度为

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是试验次数,\(p\) 是成功的概率,\(N\) 是成功的次数。

在使用随机样本估计总体比例的标准误差时,正态分布效果良好,除非乘积 p*n <=5,其中 p = 总体比例估计值,n = 样本数量,此时使用二项分布代替。例如,15 人的样本中显示 4 人是左撇子,11 人是右撇子。则 p = 4/15 = 27%。0.27*15 = 4,因此在这种情况下应使用二项分布。

引用

示例

从分布中抽取样本:

>>> import maxframe.tensor as mt
>>> n, p = 10, .5  # number of trials, probability of each trial
>>> s = mt.random.binomial(n, p, 1000).execute()
# result of flipping a coin 10 times, tested 1000 times.

一个现实世界的例子。一家公司钻探了 9 口野猫油井,每口井的成功概率估计为 0.1。所有九口井都失败了。这种情况发生的概率是多少?

让我们对模型进行 20,000 次试验,并计算产生零个阳性结果的数量。

>>> (mt.sum(mt.random.binomial(9, 0.1, 20000) == 0)/20000.).execute()
# answer = 0.38885, or 38%.