我可能已经脑死亡了,但我的代码定义了一个使用Scipy.stats在Python中进行操作的对数正态类。
我的类看起来像这样:
LogNorm类:
def __init__(self, mean, sd, offset=0) :
# uses 'real' units -i.e., 100000, 15000 for mean and sdn
self.mean = mean
self.sd = sd
self.offset = offset
self.xvar_mu, self.xvar_sigma = get_base_mu_and_sigma(mean, sd)
self.mean = np.exp(self.xvar_mu + self.xvar_sigma**2.0/2.0) # reflect that change in the Y
self.sd = ((np.exp(self.xvar_sigma**2.0) - 1.0) *
(np.exp(2.0 * self.xvar_mu + self.xvar_sigma**2.0))) ** 0.5
self.RV = lognorm(s = self.xvar_sigma, scale = self.mean, loc = self.offset) # fozen
这里的想法是传入对数正态本身的平均值和sd。我为后人记录了这些(假设偏移量= 0.0,按照默认值)。然后我有一个辅助函数,它将这些映射到作为对数正态分布基础的正态分布的µ和sigma。该函数如下所示,如果有用的话:
def get_base_mu_and_sigma(mean, sd) :
mu = math.log(mean**2.0 / (sd**2.0 + mean**2.0)**0.5)
sigma = (math.log(1.0 + sd**2.0/mean**2.0))**0.5
return (mu, sigma)
这直接来自维基百科,看起来是对的(查看“算术时刻”部分的结尾):https://en.wikipedia.org/wiki/Log-normal_distribution
然后,'self.RV‘变成一个’冻结的‘RV,并有一堆内置/继承的函数(mean(),median(),var()等),这些函数与µ和sigma描述的对数正态相关。
我遇到的挑战是,当我创建这样一个对象,然后尝试检查均值和sd (通过方差的平方根),数字似乎不匹配。例如,使用mean = 110517.09和sd = 2210.34 (来自我的应用程序),当我随后执行以下代码时,我得到了不一致的结果:
p = rv1.RV.pdf(x)
print("rv1.mean, rv1.sd = " + str(rv1.mean) + " " + str(rv1.sd))
print("rv1.mean(), rv1.var()**0.5 = " + str(rv1.RV.mean()) + " " + str(rv1.RV.var()**0.5))
提供:
rv1.mean, rv1.sd = 110517.09180756475 2210.341836151173
rv1.mean(), rv1.var()**0.5 = 110539.19301602637 2210.783860320406
你知道我做错了什么吗?
发布于 2018-06-05 06:21:51
您使用self.mean
作为scipy.stats.lognorm
的scale
参数,但这是不正确的。引用自docstring for lognorm
对数正态随机变量
Y
的常见参数化是根据唯一的正态分布随机变量exp(X) = Y的平均值、mu
和标准差sigma
,使得X
(X)=Y。该参数化对应于设置s = sigma
和scale = exp(mu)
。
因此,当您通过调用lognorm
创建self.RV
时,scale
参数必须为np.exp(self.xvar_mu)
。(假设offset
为0。)
下面是一个使用您的函数get_base_mu_and_sigma
来转换参数的简化示例。
首先,下面是您使用的函数和示例值:
In [154]: def get_base_mu_and_sigma(mean, sd) :
...: mu = math.log(mean**2.0 / (sd**2.0 + mean**2.0)**0.5)
...: sigma = (math.log(1.0 + sd**2.0/mean**2.0))**0.5
...: return (mu, sigma)
...:
In [155]: mean = 110517.09180756475
In [156]: sd = 2210.341836151173
获取基础正态分布的参数:
In [157]: mu, sigma = get_base_mu_and_sigma(mean, sd)
创建一个scipy的lognorm
分布的实例,并验证该分布的均值和标准差是否与mean
和sd
匹配
In [158]: ln = lognorm(s=sigma, loc=0, scale=np.exp(mu))
In [159]: ln.mean()
Out[159]: 110517.09180756476
In [160]: ln.std()
Out[160]: 2210.341836151174
https://stackoverflow.com/questions/50685839
复制相似问题