在Python中生成具有指定边缘的copula相关样本_在mysql中添加具有相关子查询的自动生成列_在python matplotlib中基于数据集生成具有颜色梯度的网格 - 腾讯云开发者社区

python-3.x、scipy、statistics、normal-distribution

我想问的是，是否有任何流行的软件包，如: numpy，st等，有一个内置的函数来计算Z-得分，如果我已经知道临界值、平均值和st dev。我通常会这样做： def Zscore(xcritical, mean, stdev): return (xcritical - mean)/stdev #example: xcritical = 73.06 mean = 72 stdev = 0.5 zscore = Zscore(xcritical, mean, stdev) 稍后，我使用scipy.stats.norm.cdf计算x低于x临界值的概率。 import scipy.stat

浏览 0提问于2018-02-09得票数 6

回答已采纳

1回答

CDF/PDF图未显示

python、numpy、matplotlib、pandas、ipython

我可以从熊猫的数据中得到一个直方图，以显示良好。我还想在同一幅图上显示PDf/CDF的线状图。我的代码： import scipy.stats as stats from scipy.stats import norm samples=twentyandmiddle['age'] print samples.head(5) plt.hist(samples, bins=40, normed=True) #samples=samples[0] plt.plot(samples,norm.pdf(samples), 'r-', lw=5, alpha=0.6

浏览 0提问于2014-08-31得票数 0

回答已采纳

1回答

有没有来自scipy.stats的‘`norm`’方法的cythonized版本？

python、scipy、cython

我说的是scipy.stats中连续RV的主要公共方法：具体来说，from scipy.stats import norm然后使用 norm.ppf或norm.pdf 链接：有没有机会通过使用cython来优化norm.ppf()或norm.pdf()的速度？或者它已经优化了，或者不值得用cython来包装？

浏览 0提问于2015-09-03得票数 2

2回答

Python与Kolmogorov-Smirnov测试非‘规范’分布的问题

python、statistics、scipy

我相信答案很简单，但我不知道我做错了什么。我想测试我拥有的一些样本数据是否可以来自广义极值分布或皮尔逊类型3分布。由于某些原因，我无法让kstest(t1, 'genextreme')合作。但是，当我将其更改为norm时，它可以正常工作。请看下面的部分代码和错误： from scipy.stats import kstest from scipy.stats import ks_2samp import numpy as np import csv In [7]: from scipy.stats import genextreme In [8]: t1 = TP[

浏览 6提问于2015-10-12得票数 1

1回答

协方差矩阵在产生相关正态分布随机样本时如何影响输出？

scipy

The文档包含一个示例。完整的代码在问题的末尾。协方差矩阵： # The desired covariance matrix. r = np.array([ [ 3.40, -2.75, -2.00], [ -2.75, 5.50, 1.50], [ -2.00, 1.50, 1.25] ]) 我的问题是协方差矩阵中的每个值如何影响输出？也就是说，如果我想要构建只有2个变量或超过3个变量的样本数据集，如何确定我可以在协方差矩阵中使用哪些值？ """Example of generating corre

浏览 0提问于2019-01-24得票数 0

回答已采纳

2回答

对于相关分布抽样，是否有一种快速替代_norm_pdf的方法？

python、numpy、scipy、distribution、montecarlo

我已经为蒙特卡罗模拟拟合了一系列的SciPy连续分布，并希望从这些分布中获取大量样本。但是，我希望能够获取相关样本，例如i第四样本从每个分布中获取第90个百分位数。在这样做的过程中，我发现了SciPy性能中的一个怪癖： # very fast way to many uncorrelated samples of length n for shape, loc, scale, in distro_props: sp.stats.norm.rvs(*shape, loc=loc, scale=scale, size=n) # verrrrryyyyy slow way to take

浏览 0提问于2020-02-01得票数 5

回答已采纳

2回答

如何利用概率密度函数建立等仓宽等仓高直方图

python-3.x、matplotlib、histogram、probability-density

利用直方图生成一些随机数据来估计概率密度函数。我现在想要两个版本的直方图，即等边宽度和等边高度直方图。 # -*- coding: utf-8 -*- from scipy.stats import norm import matplotlib.pyplot as plt #import pandas as pd import numpy as np fig, ax = plt.subplots(1, 1) #Calculate a few first moments: mean, var, skew, kurt = norm.stats(moments='mvsk') #

浏览 2提问于2020-06-11得票数 2

回答已采纳

1回答

由多峰分布确定的单峰分布图

python、distribution、gaussian、multimodal

我使用来分析多模式分布。从GaussianMixture类中，我可以使用属性means_和covariances_访问均值和协方差。现在如何使用它们来绘制两个基本的单峰分布呢？我考虑使用，但不知道如何为loc和scale选择参数。所需的输出将类似于所附图所示。这个问题的示例代码是从答案中修改的。 import numpy as np import matplotlib.pyplot as plt from sklearn import mixture from scipy.stats import norm ls = np.linspace(0, 60, 1000) multi

浏览 4提问于2021-03-14得票数 1

回答已采纳

1回答

从分布获取百分位数

python、numpy、statistics、scipy.stats

如何获得从某个程序或实验中得到的分布的百分位数(例如，平均百分位数，或10%和90%百分位数)？在下面的示例中，我生成一个正态分布，只是为了说明。 from scipy.stats import norm x = np.linspace(1,10,1001) count = norm.pdf(x,5,1) 如果绘制为plt.plot(x,count)，这将是一个高斯曲线(对于这个特殊的例子)。请注意，这不是数据点，而是分布(可以通过x,count = plt.hist(data)获得)，所以我不能使用p10 = np.percentile(count,10)，但是我需要类似的东西，例如 p10

浏览 4提问于2022-02-18得票数 1

1回答

如何使用norm.ppf()查找z值？

python、scipy、statistics

我是python的新手，我不知道如何使用norm.ppf函数来回答这个问题，有人能帮我吗？我们的教授给了我们这句话来帮助我们回答家庭作业： import scipy.stats as stats print(stats.norm.ppf( q=0.5-0.341, loc=0, scale=1)) 这个问题问的是标准正态分布下的厄尔尼诺数据: ENSO指数ε给出的Pr(Z >=ε) = 0.1是多少？我完全不知所措，我该如何编辑这段代码来回答这个问题呢？

浏览 45提问于2021-02-21得票数 1

回答已采纳

1回答

从Laplace分布中提取出负倾斜密度的Laplace分布

python、numpy、scipy、kernel-density、skew

当我从平均为零的Laplace分布中画出图，并且从任何映射到正字形的分布中抽取比例时，所得到的经验分布都是负倾斜的，而不管抽奖的次数、比例和种子的分布。然而，对于大样本尺寸而言，对称性是可以预料的。请参阅以下两个可复制的示例例0： import numpy as np from scipy.stats import halfcauchy from scipy.stats import laplace lam_0 = halfcauchy.rvs(loc=0, scale=1, size=2000000, random_state=77) lap_0 = laplace.rvs(loc=0,

浏览 8提问于2022-11-10得票数 1

回答已采纳

1回答

你能把指数加权纳入分布拟合吗？

python、python-3.x、pandas、scipy、distribution

鉴于一些时间序列数据： np.random.seed(123) r = pd.Series(np.random.beta(a=0.5, b=0.5, size=1000), index=pd.date_range('2013', periods=1000)) 以及scipy.stats._continuous_distns._distn_names内部的分布 import scipy.stats as scs dists = scs._continuous_distns._distn_names 我希望能够建立一个新的分布，然后调用它的.ppf (百

浏览 2提问于2017-08-30得票数 0

回答已采纳

1回答

用Python模拟相关的对数规范

python、numpy、random、statistics

我遵循这个问题的答案，，但是我发现样本数据的边缘分布没有相同的均值和标准偏差。例如，考虑代码示例中下面的多元分布。如果我们将边沿标记为X、Y和Z，那么我希望(从样本数据中隐含的)比例尺和位置参数与输入数据匹配。然而，对于X，您可以看到下面的比例和位置参数是0.1000和0.5219。因此，规模是我们所期望的，但其位置却下降了4%。我在想，我用协方差矩阵做错了什么，但我似乎找不出哪里出了问题。我尝试将相关矩阵设置为恒等矩阵，然后将样本数据的位置和规模与输入的数据进行匹配。我的协方差矩阵一定出了问题，否则我又犯了一个根本错误。任何帮助都将不胜感激。如果问题不清楚，请告知。 import panda

浏览 5提问于2019-10-30得票数 0

回答已采纳

1回答

在使用scipy.stats.norm时，我一直遇到一个问题：“模块没有属性规范”。

python、scipy、pip、conda

我已经搜索了类似这篇文章的其他帖子，但都无济于事。我已经卸载了scipy，更新了conda，并重新安装了scipy。起初，我认为我不小心用pip升级了它，所以我删除了所有这些，并用conda重新安装了它。我仍然收到这个错误。我在google cloud data proc中做了同样的思考，以缩小错误的范围，以确定错误是否来自于我的设置，但我得到了相同的错误。下面是我试图运行的函数： def get_ci(value, cl, sd): loc = scs.stats.norm.ppf(1 - cl/2) rng_val = sci.norm.cdf(loc - value/sd)

浏览 54提问于2020-02-01得票数 0

回答已采纳

3回答

使用scipy在Python中实现多元正态CDF

python、scipy、normal-distribution、cdf

为了计算多变量正态分布的CDF，我遵循了示例(对于单变量情况)，但无法解释scipy产生的输出： from scipy.stats import norm import numpy as np mean = np.array([1,5]) covariance = np.matrix([[1, 0.3 ],[0.3, 1]]) distribution = norm(loc=mean,scale = covariance) print distribution.cdf(np.array([2,4])) 产生的输出为： [[ 8.41344746e-01 4.29060333e-04]

浏览 0提问于2015-06-01得票数 15

回答已采纳

1回答

以下数据的适当分布是什么

python、normal-distribution

我有以下示例数据。它看起来是正态分布的右半。假设数据是一篇博客文章的read时间。我想要做的是找出每篇博客文章在read时间方面的表现。对于正态分布，我会找到一个流行的mean和std，然后给出一个样本(博客)，找到博客的平均read时间，并计算样本均值的p值。但由于分布不像正态分布..我该怎么办？下面是数据。 tds_ = [28.965, 12.172, 17.042, 36.98, 20.323, 3.481, 18.43, 5.638, 20.763, 48.104, 8.015, 21.2, 48.122, 32.51, 16.87, 10.4

浏览 0提问于2021-01-25得票数 1

4回答

在python中实现Kolmogorov Smirnov测试

python、scipy、statistics、statistical-test

我有一个关于N个数字的数据集，我想测试它的正态性。我知道scipy.stats有一个，但是没有关于如何使用它和如何解释结果的例子。这里有谁能给我一些建议吗？根据文档，使用kstest返回两个数字，KS测试统计量D和p值。如果p值大于显着性水平(例如5%)，那么我们就不能拒绝数据来自给定分布的假设。当我通过从正态分布中抽取10000个样本进行测试时，我的测试是： import numpy as np from scipy.stats import kstest mu,sigma = 0.07, 0.89 kstest(np.random.normal(mu,sigma,10000),

浏览 5提问于2011-10-26得票数 30

回答已采纳

1回答

如何生成具有不同分布的相关变量的数据集？

matlab、dataset、stata、correlated

出于教学目的，我需要生成具有不同分布的相关随机变量的随机数据集。我在Stata中尝试过corr2data，但它不允许我指定要生成的变量的最大值和最小值，只允许指定均值、sd's和协方差矩阵。因此，我需要在生成数据后进行混乱的调整。其他各种细节让我对corr2data感到恼火。有没有一种更简单的用MATLAB来做这件事的方法？我对这个软件不像对Stata那样熟悉。

浏览 3提问于2014-02-04得票数 2

5回答

如何使用norm.ppf()？

python、python-3.x、scipy、statistics、confidence-interval

我不知道如何正确地使用这个功能，有人能解释一下吗？假设我有：平均数为172.7815 标准差4.1532 N= 50 (50个样本) 当我被要求使用norm.ppf()计算(95%)错误裕度时，代码是否如下所示？ norm.ppf(0.95, loc=172.78, scale=4.15) 还是看起来像这样？ norm.ppf(0.95, loc=0, scale=1) 因为我知道它在计算置信区间右边的曲线面积(95%，97.5%的etc...see图像)，但是当我有一个平均值和一个标准差时，我真的很困惑如何使用这个函数。

浏览 30提问于2020-03-16得票数 19

1回答

难以用Python绘制Beta发行版

python

考虑到一些措施，我试图创建一个beta发行版。给定最大值、最小值、平均值以及α和beta值，我如何调用beta.ppf或beta.pfd来生成适当的数据集？工作样本破碎样本 import matplotlib.pyplot as plt from scipy.stats import beta # # Set the shape paremeters # a = 2.8754 b = 3.0300 minv = 82.292 maxv = 129.871 mean = 105.46 # # Generate the value between # x = np.linspace(b

浏览 5提问于2022-10-21得票数 0