在aods3软件包中使用aodmlβ-二项式模型时产生的NaNs - 腾讯云开发者社区

r、lme4

我的数据是比率数据。所以我尝试用lme4()和二项式模型来分析它。这是我的代码： fate.reP = glmer(predated~type+(1|island),data=fate.rate,family="binomial") 下面是一组样本数据： type cluster tree predated B B7-1 1 0.48 B B7-1 2 0.66 B B7-2 3 0.18 M I63 8 0.55 M

浏览 7提问于2015-05-02得票数 0

回答已采纳

1回答

解决错误，为一天的良好开端

r、regression、panel

让我们考虑下面的数据 library(plm) library(pglm) data("EmplUK", package="plm") 我将添加一个0和1随机放置的新列。之后，我想执行logit随机效果模型。 df1<-EmplUK #adding 0's and 1's df1<-cbind(df1,'binary'=sample(0:1,1031,replace=T)) #Performing logit regression pglm(binary~output+wage, data=df1, family=

浏览 27提问于2020-12-04得票数 0

回答已采纳

1回答

“错误:无效分组因素规范”

r、mixed-models、poisson、random-effects

我试图为我正在分析的一些数据建立一个混合效应模型。在我决定将其中一个变量(国家因素)更改为随机效应(随机拦截)变量之前，它以前是一个固定的效应。问题是，当我运行它时，我会得到以下消息： “错误:无效分组因素规格，国家因素”。我在其他帖子中看到，这通常是NA条目的问题，但是我检查了模型中的所有变量，没有一个变量有NA条目。有人知道是什么导致了这个错误消息吗？将模型代码张贴在下面。 glmer( formula = as.numeric(wheezing_InD) ~ as.factor(mainfuel) + age_InD +

浏览 7提问于2022-04-11得票数 0

1回答

对beta-二项回归进行建模

r、statistics

假设这个简单的例子： treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2),labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),levels = c(1, 2, 3),labels = >c("none", "some", "marked")) numberofdrugs<

浏览 3提问于2011-06-14得票数 1

回答已采纳

1回答

MATLAB时间序列回归，处理NaNs

matlab

为了提供一个最小的例子(我想在许多应用程序中使用这个解决方案)，我在MATLAB中使用了regress函数。我在MATLAB中拥有的数据是(月)时间序列，然而，某些数据点在某些序列的开头是缺失的。假设Y是任意回归模型中的一个因变量，我想运行10个回归模型， $$Y_t=\alpha+X_{i，t-1}$$ 因此，我想运行9个模型，其中Y是因变量，每个模型--解释性变量--从$X_2$更改为$X_10$。为了澄清，我想运行9种模型(见图)，我遇到的问题是，我希望第一个使用Y(即data(:,1))和X2 (即数据(：，2))的模型使用前1000个观测值，但是对于X3，

浏览 0提问于2018-12-04得票数 1

回答已采纳

1回答

如何编写阻塞日志模型

r、statistics

我在R中编写了一个随机变量离散时间风险模型如下 (logit.full. <- glmer(event ~ + a1 + a2 + a3 + obsnum1 + obsnum2 + obsnum3 + (1 + obsnum1 + obsnum2 + obsnum3 | country_cluster), family=binomial("logit"), data=d

浏览 0提问于2013-08-28得票数 1

回答已采纳

1回答

H2O中负二项偏差的计算

glm、h2o

我一直在研究H2O中负二项式模型的偏差计算(第580/959行)，我很难解释为什么yr或ym为/are为0。 (yr==0||ym==0)?0:2*((_invTheta+yr)*Math.log((1+_theta*ym)/(1+_theta*yr))+yr*Math.log(yr/ym)) 偏差计算公式如下(来自)：就数学而言，除非yr和ym都是0，否则我看不出偏差是0。有没有人碰巧知道是否有一种特殊情况，当yr和ym都是/are 0时，需要将负二项式的偏差设置为0？谢谢!

浏览 4提问于2022-08-03得票数 1

2回答

GLM和带有statsmodel的Logit模型有什么不同？

python-3.x、machine-learning、logistic-regression、statsmodels、glm

谁能用统计模型解释一下广义线性模型和逻辑回归模型表之间的区别？为什么在执行逻辑回归时，两个模型得到的结果不同？

浏览 2提问于2020-06-28得票数 3

1回答

在R中用GEE对负二项分布数据进行任何更新？

目标:运行负二项分布的GEE来分析R中的数据集这个问题是问，但答案是~5年前，我不知道是否有新的发展。我总结我的数据，然后概述我如何试图找到一个解决方案。我的模型(成功地使用Poisson而不是使用包geeglm的负二项分布)： m1 <- geeglm(Diract ~ Dir*Rec + Year + offset(LnScan), family = poisson("log"), data = Direct, id = ID, corstr = "exchangeable") 数据为 Diract：区间结果变量，从董事

浏览 1提问于2018-03-03得票数 2

1回答

Laravel Nova在1个资源中显示2个CRUD表

laravel、laravel-nova

是否可以在单个资源中显示两个表，其中包含来自不同模型的CRUD操作？正如我现在所看到的，单个资源与1个模型相关，所以我在考虑自定义资源。我在哪里可以找到这类功能的实现描述？

浏览 1提问于2020-12-08得票数 0

1回答

解释Logistic回归中R如何编撰虚拟响应变量

r、logistic-regression

我是个新手，很难理解我的逻辑回归的结果。我的响应变量有两个值--“multiplex”和“subterraneus”。当在“microtus.train”数据帧上使用factor()函数时，我按该顺序得到“mutiplex和subterraneus”。在我对模型进行拟合并预测响应后，我很难理解这个概率意味着什么。这些概率是否意味着观察的概率是“地下”的？当我使用“对比(microtus.train$Group)”语句时，我得到了下面的表格。 > contrasts(microtus.train$Group) subterraneus multiplex

浏览 1提问于2017-12-10得票数 0

回答已采纳

1回答

glmnet对二进制数据模型(P=1或P=0)有什么作用

models、logistics、lasso-regression

我在二进制数据上运行以下弹性网络模型(1=bad，0=好)。有人知道glmnet默认适合哪种类型的模型: P(y=1)还是P(y=0)。有没有办法选择前者来适应模型。 cv.glmnet(x, y, family="binomial", type.measure="deviance", standardize=FALSE, nfolds=5, alpha=par)

浏览 6提问于2012-08-16得票数 1

1回答

一个非常复杂的组合任务已经困扰我7个月了

math、combinations、combinatorics

大约七个月前，我在一家大公司参加了一次面试。他们给了我这个任务来解决，在过去的7个月里，我似乎无法找到解决方案。这里的任务是：一些数据库有一个条目。有多少由A构成的B量(B < A)元素的组合(不重复)，对于任何给定的B(包含在这些A中)，不同的元素总是至少包含来自B (C/B)的X%的C条目(C < B)？包括获得所有它们的模式。简言之，我们需要：满足上述条件的组合数的计算公式列出所有这些的公式。(任何编程语言或只是详细的描述性和任何格式) 注意:这两者都是强制性的，因为它们需要在db中的一个单独的表中设置。在2小时后完全一无所知，我得到了一个简化的版

浏览 4提问于2015-06-25得票数 0

1回答

Logistic回归的GLM函数:默认的预测结果是什么？

r、regression、glm

我对R模型比较陌生，我遇到了GLM的建模功能。我对使用家庭“二项式”的Logistic回归感兴趣。我的问题是，当我的因变量可以接受两种可能的结果之一--比如“正”、“负”--计算估计值的默认结果是什么--该模型默认预测“正”或“负”结果的日志概率吗？此外，当因变量为 Yes或No 1或2 Pass或Fail 等等？是否有规则R选择此默认值？有办法手动覆盖它吗？请澄清。

浏览 5提问于2017-01-08得票数 3

1回答

在插入符号中使用rfe函数的二项式GLM特征选择

r、glm

可以使用插入符号包中的rfe函数在二项式GLM上进行特征选择吗？我想传递预测和预测的数据框架，并让它返回最好的模型和功能。如果没有，有没有其他我应该使用的包？

浏览 0提问于2012-09-11得票数 1

1回答

有办法在mgcv的gam函数中包含自相关结构吗？

r、modeling、binary-data、gam、mgcv

我正在使用r中的mgcv包构建一个模型。这些数据有一系列的度量(数据是在15分钟的时间间隔扫描期间收集的，但不连续，例如，一天可能有5次连续扫描，然后直到第二天才进行任何扫描，等等)。该模型具有二项响应、日随机效应、固定效应和三种平滑效应。我的理解是，REML是二项式模型的最佳拟合方法，但是这种方法不能使用二项式模型的gamm函数来指定。因此，我正在使用gam函数，以允许使用REML拟合。当我拟合模型时，我的剩余自相关时间为2(即30分钟)，用ACF和PACF图进行评估。所以，我们想在模型中包含一个自相关结构，但我的理解是，只有gamm函数，而不是gam函数，才允许包含这样的结构。我想知道我

浏览 17提问于2022-10-28得票数 2

回答已采纳

1回答

Tensorflow:如果梯度为Nan，不要更新

tensorflow、backpropagation

我在CIFAR-10上有一个很深的模型要训练。使用CPU的训练效果很好。但是，当我使用GPU支持时，它会导致一些批的渐变为NaNs (我使用tf.check_numerics检查了它)，并且这种情况发生的时间很随机，但时间足够早。我相信这个问题与我的GPU有关。我的问题是:如果至少有一个梯度有NaNs，并且强迫模型继续到下一批，那么是否可以不进行更新呢？编辑：也许我应该更详细地阐述我的问题。我就是这样应用梯度的： with tf.control_dependencies([tf.check_numerics(grad, message='Gradient %s check fai

浏览 4提问于2017-09-13得票数 1

1回答

具有非整数权值的JAGS回归模型

r、bayesian、jags

对于下面的logistic回归模型，我希望能够使用n(和y)的非整数值从后验样本。在这类模型中，当部分数据可用或希望降低重量时，就会出现这种情况。 model <- function() { ## Specify likelihood for (i in 1:N1) { y[i] ~ dbin(p[i], n[i]) logit(p[i]) <- log.alpha[1] + alpha[2] * d[i] } ## Specify priors alpha[1] <- exp(log.alpha[1])

浏览 1提问于2017-09-07得票数 0

回答已采纳

1回答

怎样才能知道在R中逻辑回归输出的赔率比分子中使用哪种概率？

r、logistic-regression、r-caret

我非常熟悉逻辑回归背后的数学，但根据R的输出，我不知道几率比分子中的概率是多少。请考虑以下几点： library(dplyr) library(caret) set.seed(42) levels(iris$Species) <- list("setosa" = c("setosa"), "not_setosa" = c("versicolor", "virginica")) train <- sample.int(0.5*nrow(iris)) test <- setdiff((1:nro

浏览 0提问于2018-06-13得票数 2

回答已采纳

1回答

使用非整数与整数:使用非整数的警告，但模型不会与整数一起运行。

r、glm

我在运行负二项式模型时遇到了一些困难。基本上，我有一个有动物计数的数据集。然而，努力是不同的，因此我可以计算动物的速度每天。我正在用一个相当大的数据集(>100000观测数据集)来做这件事。我很惊讶，我找不到其他的话题涵盖我的问题，如果你知道一个:会有帮助！在试图将模型与我的数据相匹配时，我遇到了一些问题。要么我用负二项分布模型 > m1<-glm.nb(Rates ~ Par1+Par2+...+Par7+Par8,data=data) 然后我收到以下警告信息： >Warning messages: 1: In dpois(y, mu, log = TRUE) :

浏览 6提问于2016-11-21得票数 1

回答已采纳

1回答

岭二项回归在Python中可用吗？

glm、logistic-regression

我是Python的新手，我想要拟合一个岭二项回归。我知道二项式回归可以在以下网址获得：我还知道带有L2惩罚的逻辑回归可以用sklearn.linear_model拟合。因为binomial是Bernoulli的总和，所以我可以在将我的二项式结构化数据转换为Bernoulli结构后，通过更改它的第i行来使用scikit： (size_i，success_i) 转换成长度为size_i的向量，记录success_i 1和size_i - success_i 0。但是，这对我不起作用，因为size_i非常大。有没有办法用Python拟合二项岭回归？

浏览 0提问于2016-04-06得票数 0

1回答

计数模型的随机效果

r、stata、random-effects

我正在尝试做一个在r或stata中具有随机效果的栅栏模型。我已经查看了glmmADMB包，但在R中下载它时遇到了问题，并且我在Cran中找不到任何关于该包的文档。这个套餐还能用吗？有没有人用它成功地估计了一个具有随机效应的栅栏模型？或者，有没有一种方法可以在stata中估计这个值？在stata中，有没有一种方法可以用任何类型的计数数据来估计随机效应？任何建议都将不胜感激。詹妮弗

浏览 5提问于2013-05-25得票数 2

2回答

为什么你要分割你的火车数据来计算一半的数据的值，然后填充另一半的南值呢？

machine-learning、data-cleaning

我正在检查Bosch竞赛(指向python内核的kaggle链接)中用python编写的内核，我想出了一种奇怪的方法(至少对我来说是这样)来填充Nan值。将列车数据分成两半，然后利用一个字段的非南值和目标值计算出某种平均值，然后用这些计算值填充另一半的Nan值。然后，在填充Nan值后对模型进行训练时，该模型只对已替换Nan值的一半数据进行训练。问题是，你为什么要把数据分成两半来计算，然后填充另一半呢？当平均值与目标值相关时，您是否引入了某种泄漏，这就是为什么使用填充值的一半部分(没有计算任何内容的部分，只是填充的Nans)来进行训练的原因吗？如果您对所有列车数据执行此操作，此程序是否容易

浏览 0提问于2016-10-27得票数 4

回答已采纳

1回答

获得多个负二项glm模型的AICc

r、glm

我已经在R中对六个候选GLM模型列表运行了函数"aictab“(对于九个不同的响应变量运行了九次)。我的响应变量分布为Gamma或负二项分布。(我使用负二项误差结构，因为我的计数数据过于分散。)aictab函数工作得很好，给了我一个带有AICc误差结构的模型的Gamma值、模型权重等的表，但当我尝试在具有负二项误差结构的模型上运行该函数时，我意识到aictab()不支持这种类型的误差结构，并且我无法获得AICc或模型权重。我的问题是:对于负二项GLM模型，我可以使用哪些其他函数或代码来获得与aictab函数等效的输出？代码/错误示例如下。 setwd('C:/Users/La

浏览 0提问于2017-09-28得票数 1

1回答

nls模型的误差拟合

r、regression、curve-fitting、nls

以前对类似问题的回答无助于解决我的问题。我正在尝试安装一个模型y=a1*(1-exp(-a21*Age_WH40))^a3，其中a21=ln(1/a3)/a2和Age_WH40从1到40。我绘制了数据和一行，以了解起始值 plot(MOE_WH40 ~ Age_WH40) lines(ts(8*(1-exp(log(1/3)/5*(1:40)))^3),col="red", lwd=2) fit.nlm_MOE4A.WH <- nls(MOE_WH40 ~ a*(1-exp(log(1/c)/b*Age_WH40))^b, start=list(a=10, b

浏览 2提问于2016-07-05得票数 0

回答已采纳

1回答

混合效应logistic回归中的风险比估计而不是优势比

r、lme4

glmer用于估计数据聚类时对y逻辑规模的影响。在以下模型中 fit1 = glmer(y ~ treat + x + ( 1 | cluster), family = binomial(link = "logit")) exp的treat系数是一个二元0-1处理变量的优势比，x是一个协变量，cluster是一个聚类指标，通过它我们建立了一个随机效应(截距)。glm中估计风险比率的一种标准方法是使用log链接，即family=binomial(link = "log")。 Error in (function (fr, X, reTrms, family, n

浏览 0提问于2021-03-05得票数 2

1回答

多元回归中的错误:要替换的项目数不是替换长度的倍数。

r、for-loop、matrix、logistic-regression、training-data

我试图使用从我的教授那里获得的代码将我的数据分成训练数据和测试数据，但都会出现错误。我认为这是因为数据的格式，但我回到了硬代码，没有任何工作。数据现在是矩阵形式，我相信代码被用来预测logistic回归有多精确。 A = matrix( c(64830,18213,4677,24761,9845,17504,22137,12531,5842,28827,66161,18852,5581,27219,10159,17527,23402,11409,8115,31425,68426,18274,5513,25687,10971,14104,19604,13438,6011,30055,6971

浏览 2提问于2016-05-11得票数 0

1回答

是否有方法通过增加GLMM中的权重来处理丢失的观测？

glm、lme4、glmmtmb

是否有方法通过增加GLMM中的权重来处理丢失的观测？我想知道如何构造一个GLMM模型的计数数据，其中一些观测损失。对我来说，我用黄色粘板来捕捉瓢虫，它们的数据类型是计数。另一个变量是半径在1km范围内的草地面积比。ID是黄色粘板的ID。每个棉田放3针板。地点是不同的棉田。区域是指属于某一特定区域的几个地点。我想要建立GLMM模型：如您所见，我可以如下所示创建GLMM模型： library(lme4) library(glmmTMB) library(mgcv) m1 = glmer(ladybeetles ~ Grass.perc + (1|Region\SITE) , data=df,

浏览 3提问于2021-12-16得票数 0

1回答

如何回到Gimp2.6 (2018年)

software-installation、gimp

对于较早版本的ubuntu 这个问题，答案仍然有效。现在他们不知道了。由于依赖关系错误，无法访问存储库，并且从源构建失败。我找到了这个PPA，但它也不起作用：以下软件包有未满足的依赖关系: libgegl-0.0-0 :依赖: libpng12-0 (>= 1.2.13-4)，它是一个虚拟包，没有任何可用的包提供。你怎么回过头来看上一个理智版本的“瘸子”：2.6？

浏览 0提问于2018-12-22得票数 0

回答已采纳

1回答

伽马跨栏(两部分)模型和零充气伽马模型有区别吗？

r、glm、gamma-distribution、glmmtmb

我有半连续的数据(许多精确的零和连续的正结果)，我试图建模。我从Zuur和Ieno的“零充气模型指南”中学到了大量的零质量的建模数据，它区分了零膨胀的伽马模型和他们所说的“零改变的”伽马模型，他们把它描述为把零的二项式分量和正的连续结果的伽马分量组合在一起。我一直在探索ziGamma选项在glmmTMB包中的使用，并将产生的系数与我按照Zuur书中的说明(第128-129页)构建的障碍模型进行比较，它们不一致。我很难理解为什么不，因为我知道伽马分布不能接受零的值，所以我想每个零膨胀的伽马模型在技术上都是一个障碍模型。有人能帮我照一下这个吗？请参阅有关代码下面的模型的更多注释。 library(

浏览 4提问于2021-01-16得票数 5

1回答

拟合多项式模型时runjags中的错误：“部分观察到，部分丢失”

r、mcmc、jags、multinomial

我是第一次接触Jags，我正在尝试将多项式模型应用到我的数据中。当我运行代码时，我得到以下错误：“部分观察到positive.counts1，1:9，部分丢失”。我用谷歌搜索了一下，我发现这是因为一个节点不能同时有观察值和缺失值。这是因为在我的数据中(参见下面的代码)，值和NA在同一行中。如果我用0值替换NA，模型就能正常工作。有谁有解决这个问题的办法吗？下面你可以找到数据和代码！在此之前，非常感谢， Elisa ########################################################################## # load jags lib

浏览 7提问于2020-06-04得票数 0

1回答

LinAlgError: SVD没有收敛于线性最小二乘: fit()函数给了我误差

python、jupyter-notebook、time-series、var、forecasting

在VAR建模过程中，选择信息准则Akaike (AIC)作为模型选择准则进行最优模型辨识。简单地说，我根据运行以下代码的最佳score.So来选择VAR的顺序(p)： forecasting_model = VAR(train) results_aic = [] for p in range(1,10): results = forecasting_model.fit(p) results_aic.append(results.aic) 但是它给出了这样的错误： ----------------------------------------------------------

浏览 2提问于2022-10-06得票数 -1

3回答

如何在MVC3中动态将字符串从模型加载到javascript？

c#、javascript、asp.net-mvc

好的，上一次我在MVC3上问了一个问题，它得到了极大的否决，我不知道为什么，所以如果这是同样的方式，请告诉我原因，这样我就可以解决它了。无论如何，我尝试从模型中提取一个字符串，并将其放入Javascript中。Javascript操作字符串。我已经让Javascript在数组中处理静态字符串，但是我希望将这些字符串放在SQL数据库中，并将其加载到模型中，然后从那里将其放入已经在执行大部分工作的Javascript中。下面是我的javascript： function questionViewModel() { this.questions = new Array("Whats

浏览 0提问于2013-07-12得票数 1

回答已采纳

1回答

仅在恢复模型时输出TensorFlow NaN

python、tensorflow、machine-learning、batch-normalization

我正在TensorFlow中训练一个模型，当我从经过训练的模型中进行评估时，这个模型会很好地工作。但是，在不同的点上，我保存一个检查点，然后加载该检查点来对其运行评估。加载的网络将只输出NaNs。在输入输入时，使用tfdbg并运行过滤器"has_inf_or_nan“，最终显示网络中出现在批处理规范化层中的moving_mean和moving_variance变量中的第一个NaNs。正在使用以下代码进行保存： with self.graph.as_default(): if not self.saver: self.saver = tf.train.Sav

浏览 0提问于2018-06-22得票数 3

回答已采纳

1回答

为什么损失会增加？

python、tensorflow、keras、mathematical-optimization

执行下面的代码有时会导致在培训期间损失增加，然后停留在那里。为什么会这样呢？ import tensorflow as tf from tensorflow.keras import layers, losses, models FEATURE_COUNT = 2 TRAINING_SET_SIZE = 128 def patch_nans(t: tf.Tensor) -> tf.Tensor: """:return t with nans replaced by zeros""" nan_mask = tf.math

浏览 6提问于2020-02-22得票数 0

回答已采纳

2回答

lightgbm python数据集引用参数是什么意思？

machine-learning、cross-validation、lightgbm

我试图弄清楚如何在python中使用lightgbm训练gbdt分类器，但与the official website上提供的示例混淆了。按照上面列出的步骤，我发现validation_data不知从何而来，并且没有关于valid_data格式的任何线索，也不知道使用或不使用它的训练模型的优点或益处。 ? 随之而来的另一个问题是，在文档中，有人说“验证数据应该与训练数据对齐”，当我查看数据集的详细信息时，我发现有另一种说法显示“如果这是用于验证的数据集，则应该使用训练数据作为参考”。我的最后一个问题是，为什么验证数据应该与训练数据对齐？数据集中引用的含义是什么?在训练过程中如何使用它？是否通过

浏览 37提问于2019-06-28得票数 4

1回答

如何对GLMMTMB中的非整数使用二项式族？

r、statistics、glmmtmb

这是我的模型： revisitsm0 <- glmmTMB(cbind(revisits_per_bout, tot_visits_bout - revisits_per_bout) ~ experiment_type * foraging_bout + (1|colony/bee_id), data=table_training, family=binomial) 我的模型不太适合，因为色散，所以我平方根我的变量"revisits_per_bout“和"tot_visits_bout"，因此给我非整数。由于GLMMTMB中没有准二项式，我如何解决这个问题？谢

浏览 8提问于2022-07-02得票数 0

1回答

用线性回归方法预测蟒蛇体内Na的含量

python、anaconda、regression、sklearn-pandas

我有一个数据集，它缺少一些我想预测的Y值。因此，我删除了Na，以便首先创建一个模型，使用下面的代码-> RBall.dropna(子集=‘NextHPPR’)，inplace = True import statsmodels.api as sm from sklearn import linear_model RBall.dropna(subset=['NextHPPR'], inplace = True) X = RBall[['ReceivingTargets_x','SnapsPlayedPercentage','Ru

浏览 0提问于2018-10-06得票数 1

回答已采纳

2回答

MATLAB:时间序列中NaNs上的插值

matlab、time-series、interpolation、nan

问:如何在较小长度的NaNs上进行局部插值？我有一个包含NaN块的时间序列(在"t“时间均匀采样的”x“数据)。例如： x = [ 1 2 4 2 3 15 10 NaN NaN NaN NaN 2 4 NaN 19 25] t = [0.1 0.2 0.3 ...etc..] 我想在NaN上执行插值。最基本的方法是从最左边的数据点到最右边的数据点进行线性插值。例如：从x= 10到x=2的一条线路和4个NaN值将被分配到该行中的值。时间序列的长度约为150万乘以约10000个in，因此我不希望合并远离NaN位置的数据(在插值中)。其中一些NaNs的长度为1000-2

浏览 0提问于2012-11-19得票数 7

1回答

从状态模型估计误差方差

python-3.x、statsmodels

Python模块状态模型有一些通用线性模型(GLM)的方法，如中所描述的。我想知道是否有任何方法可以得到error variance的估计模型适合吗？任何指针都会非常有用。

浏览 1提问于2022-03-25得票数 0

1回答

R中scatter3D()曲面图的GLM预测

r、predict、scatter3d、plot3d

我试图用scatter3D()函数从二项式GLM中生成一个具有重叠点的曲面图。为此，我使用predict()来预测x和y的不同值的z曲面。 # Data: library(plot3D) structure(list( x = c(0.572082281112671, -0.295024245977402, 0.295024245977402, 0.861117839813232, 0.572082281112671, -1.74020183086395, 0.861117839813232, 0.283046782016754, 0.861117839813232, 0.2830467

浏览 0提问于2016-06-22得票数 2

1回答

HNSC数据聚类的iClusterPlus误差

r、cluster-analysis、head

我正在使用iClusterPlus包对HNSC数据集进行聚类我有两个错误第一 **fit.single=iClusterPlus(dt1=df_m_tong1,dt2=df_c_tong1,dt3=df_e_tong1, type=c("binomial","gaussian","gaussian"), lambda=c(0.04,0.61,0.90),K=2,maxiter=10)** dataType(dt1，type1，K)中的错误:错

浏览 15提问于2022-10-04得票数 0

1回答

GLM回归预测-了解哪个因素水平是成功的

r、regression、prediction、glm

我建立了一个二项glm模型。该模型预测两个潜在类之间的输出: AD或Control。这些变量是具有级别的因素：{AD，Control}。我使用这个模型来预测和获得每个样本的概率，但我不清楚概率是否超过0.5表示AD或Control。这是我的数据集： > head(example) cleaned_mayo$Diagnosis pca_results$x[, 1] 1052_TCX AD 0.9613241 1104_TCX AD -0.9327390

浏览 3提问于2017-12-06得票数 3

回答已采纳

1回答

流量线性回归NaN输出

python、tensorflow、regression、linear-regression

我试图为机器学习算法编写代码，以学习机器学习概念和Tensorflow。我想写的算法是： (声誉不足以嵌入图像) “这相当于分段线性回归模型。” 来自(等式7)：我已经加载了我想要做的向量。并初始化我的占位符和变量： size = len(originalVecs) _x1 = tf.placeholder(tf.float64, shape=[size, 300], name="x1-input") _x2 = tf.placeholder(tf.float64, shape=[size, 300], name="x2-input") _w = tf.

浏览 0提问于2018-11-08得票数 2

回答已采纳

1回答

更新更新版本后，熊猫.transform()将生成NaN值

python、pandas、group-by

我有一些代码在3-4年前就有了。从那以后，我升级到了新版本的熊猫，矮胖，蟒蛇，而且它已经坏了。我已经孤立了我认为的问题，但不太明白为什么会发生这种情况。 def function_name(S): L = df2.reindex(S.index.droplevel(['column1','column2']))*len(S) return (-L/np.expm1(-L) - 1) gb = df.groupby(level=['name1', 'name2']) dc = gb.transform(

浏览 10提问于2022-10-14得票数 1

回答已采纳

1回答

LSTM输入在非文本分类问题中产生non

python、input、data-structures、lstm、keras-layer

对非文本数据上的LSTM模型进行训练，对两个-classes进行分类。我有225个时间点，每个产品(N=730)，有167个功能，包括目标。只有最后一个时间点是可以预测的。我在预测中使用目标作为一个特征:以下是我准备输入的方式： def split_sequences(sequences, n_steps, n_steps_out): X, y = list(), list() for i in range(n_steps_out): # gather input and output parts of the pattern y.append

浏览 21提问于2019-08-25得票数 0

1回答

峰值拟合

python-2.7、lmfit

试图将峰值与这样的数据相匹配： import scipy from lmfit.models import GaussianModel x = shm.PTR_P y = shm.PORE_V_P mod = LorentzianModel() pars = mod.guess(y, x=x) out = mod.fit(y, pars, x=x) print(out.fit_report(min_correl=0.25)) 虽然如果我生成数据，我可以做适当的处理，但是如果我尝试从另一个来源读取它们，它就不工作了。我不太擅长这个，也不知道问题出在哪里。这是输出： x，y

浏览 2提问于2016-05-20得票数 1

1回答

如果我的数据帧没有NaNs，为什么套索模型不运行？

python、lasso-regression

我正在运行一个model.fit，它运行得很完美，我不知道我现在做的事情是不是在运行。背景知识我制作了一个数据框架，并将值添加到列中的所有NaN中。然后创建我的预测器和目标，并运行套索模型。当我运行套索模型时，我发现输入包含NaN、无穷大或对于dtype('float64')太大的值错误。我还通过运行final_data.isna().sum()再次检查了我的列没有NaN值，并且发现所有列的返回值都为0 def build_and_fit_lasso_model(X, y): """Creates and returns a LASSO mod

浏览 23提问于2020-12-12得票数 0

2回答

在Excel中生成两个值之间的随机整数的正态分布列表

excel、random、normal-distribution

我需要使用给定的平均值生成正态分布的下限和上限之间的随机整数值列表。例如:1到10之间的150个随机值的钟形分布，平均值为3。可以近似平均值(例如，2.8到3.2之间的浮点数)，但列表的数字必须是整数。这个似乎指向了可能的方向。使用NORM.INV(RAND()，mean，dev)，我可以生成浮点数，然后将它们转换为整数，但我不知道如何限制最小值和最大值。RANDBETWEEN()可以解决这个问题，但它似乎不适用于NORM.INV

浏览 0提问于2014-06-10得票数 0

1回答

如何测试由“警告()”产生的特定警告？

r、tidyverse、testthat

问题我使用read_delim函数读取许多csv文件(非逗号分隔)。这会产生警告，因为有些列具有相同的名称。我不想编辑原始文件，而且我不能在用read_delim读取它们时更改列名。因此，这些警告是不可避免的。然而，我想做一个测试，这些是生成的唯一警告，并且没有其他警告，如错误的列规范等。我能怎么想我自己在运行代码之后，我可以用myWarnings <- warnings()捕获警告，但是我不知道如何用它来测试任何东西。问题是，myWarnings是一个类warnings的列表，我不知道如何对其进行测试。例如，myWarnings[[1]]生成NULL，因此我不能测试每个元素的元素

浏览 0提问于2019-04-30得票数 0

回答已采纳