腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3135)
视频
沙龙
1
回答
有没有
办法
在
Catboost
中
对
Gamma
分布式
响应
变量
进行
回归
?
poisson
、
catboost
、
gamma-distribution
、
tweedie
我正在开发一个保险模型,我想使用
Catboost
梯度提升算法来运行严重性和频率模型。问题是,根据文献,严重性模型假设
Gamma
分布式
响应
变量
,而根据
Catboost
文档,不支持
Gamma
目标模型。
有没有
办法
利用现有的目标之一(例如泊松或特威迪)来实现这一点?
浏览 44
提问于2021-01-26
得票数 0
2
回答
具有多个二进制特性的LinearRegression有时性能很差。
python
、
scikit-learn
、
linear-regression
我有一个数据集,它包含许多二进制特性,它们是分类特征的虚拟(如在pd.get_dummies()
中
)。SalePrice是我的目标
变量
。5.286095e-0128 5.638573e-01Name: lr3, dtype: float64 我想我的问题是,
在
第我正在比较这个模型和其他不同对待数据的模型(例如,简单地使用.astype('category').cat.codes编码),虽然
在
“通常”的分数范围(它们都是
浏览 0
提问于2019-01-12
得票数 0
1
回答
如何提高sklearn SVR的速度?
python
、
svm
、
sparse-matrix
、
scikit-learn
我正在使用python包实现。我的稀疏矩阵的大小是146860 x 10202。我已经将它划分为大小为2500 x 10202的各种子矩阵。对于每个子矩阵,SVR拟合大约需要10分钟。有什么方法可以加速这一过程?请推荐任何不同的方法或不同的python包。谢谢!
浏览 7
提问于2013-03-23
得票数 5
回答已采纳
3
回答
在
同一个大规模数据集上对数百个模型
进行
评分的最佳实践?
scoring
我有预测各种事物的500+模型,以及一个由400m+个人和大约5,000个可能的自
变量
组成的大型数据库。这个过程耗时太长,容易出错(更多的是它变成的复杂代码网络的一个指标),代价很高(需要大量的云实例),并且只允许
在
R
中
构建模型(我想基本上不知道模型来自哪种语言,但我主要想启用Python和R--这是一个不可协商的需求
在
类似的问题领域有经验的人有什么建议吗? re:如何将这个过程重新架构为1)更有效地运行(从$ PoV)和2)启用Python模型。
浏览 0
提问于2020-01-21
得票数 2
1
回答
如何建立一个基于非独立不平衡数据的模型?
machine-learning
、
time-series
、
statistics
我把“搅动”定义为
在
一周内没有出现其他活动的活动。客户可能在两个月后回来,并再次变得活跃,而这些活动不被视为搅动。 因此,根据未来的行为,可能会认为同一个用户被搅动或不被搅动。我如何
进行
建模,甚至简单的t检验(因为它的假设是独立的)?任何想法或方向都会受到高度赞赏。
浏览 0
提问于2019-05-19
得票数 1
1
回答
如何在libsvm
中
找出最佳的C/
Gamma
参数?
java
、
machine-learning
、
svm
、
libsvm
我正在使用
对
具有大量特征/属性的数据集
进行
多类分类(每项大约5,800个)。我想为C和
Gamma
选择比我目前使用的默认参数更好的参数。我已经尝试过运行easy.py,但对于我正在使用的数据集,估计的时间几乎是永远的(
在
20、50、100和200个数据样本上运行easy.py,并得到一个超线性
回归
,它预计我所需的运行时间需要数年)。
有没有
办法
比默认值更快地得到更好的C和
Gamma
值?我正在使用Java库,如果这有什么不同的话。
浏览 0
提问于2010-05-04
得票数 2
回答已采纳
1
回答
SVR参数的可能范围是多少?
python
、
regression
、
svm
、
hyperparameter
我
在
研究
回归
问题。
在
调整SVR参数时,得到了以下值c=100、
gamma
= 10和epsilon =100。我得到了95 %的r-平方。我的问题是,这些参数值的理论范围是什么?
浏览 0
提问于2019-03-22
得票数 1
回答已采纳
2
回答
如何写出多元
响应
的R公式?
r
、
regression
在
R
中
,我想
对
所有预测因子的多
变量
响应
进行
回归
,对于单
变量
响应
,我知道公式是这样的 这是使用所有预测器来
回归
y,如果我现在面对100个
响应
,我不能像y1+y2+y3...+y4~x那样输入100 yi,那么如何使用所有预测器来
回归
多元
响应
呢?
浏览 1
提问于2012-05-30
得票数 10
1
回答
增加一个mable:带有ARMA误差的
回归
模型的残差和创新是相同的
broom
、
fable-r
、
fabletools
fit <- us_change %>% augment() augment()函数似乎只提取新息值,并将其用于
回归
的残差
浏览 37
提问于2021-01-28
得票数 0
回答已采纳
1
回答
MCMC永远无法
在
SAS
中
运行
sas
、
mcmc
假设我有一个
回归
,其中
响应
变量
是sales,并且我有各种销售驱动因素作为自
变量
。我想使用MCMC构建一个模型,但我不确定这是否可能(我
在
SAS
中
运行)。简化的模型结构见下文(生产模型中有更多的
变量
和随机交互): Yij=β0+β1TVX1ij+γ(TV×dma)i+εi 对于上面的模型,我
对
β1表示的TV有一个主要效果,并在DMA (美国有210个DMA)和TV之间
进行
随机交互。我有我的所有参数的先验,当我
在
SAS<
浏览 23
提问于2019-01-03
得票数 1
1
回答
为SAS
中
的二进制逻辑
回归
中使用的缺失数据赋值
variables
、
sas
、
regression
、
modeling
、
missing-data
我每天使用的数据
中
的许多
变量
都有空白字段,其中一些字段具有含义(例如,
对
处理满意帐户与总帐户比率的
变量
的空白
响应
,因此,如果在此列
中
没有
响应
,则个人没有任何帐户,而
响应
为0表示个人没有满意的帐户)。目前,这些记录不包括
在
逻辑
回归
分析
中
,因为它们有一个或多个字段的缺失值。
有没有
办法
将这些记录纳入逻辑
回归
模型?我知道我可以为这些空白字段分配一个不在数
浏览 1
提问于2013-08-13
得票数 2
1
回答
X和y上带误差的线性
回归
r
、
statistics
、
linear-regression
我有两个
变量
,x和y,每个
变量
都有一个与每个点相关的x和y的误差。我试着
在
R
中
拟合一个线性
回归
模型,它考虑了两个
变量
的误差。我看到您可以使用lm()
中
的权重来根据误差
对
回归
进行
加权,但据我所知,这只能将误差合并到一个
变量
上。
有没有
办法
拟合一个考虑了这两个
变量
的误差的线性模型?
浏览 37
提问于2020-03-24
得票数 1
回答已采纳
1
回答
如何改进线性
回归
模型
python-2.7
、
machine-learning
、
linear-regression
我正在做一个简单的线性
回归
模型来练习,以便学习机器学习。我的模型运行正常,但是它得到了一个坏的分数,这意味着它是一个糟糕的模型,所以对更好的模型的任何建议都将受到感谢。
浏览 1
提问于2015-04-25
得票数 0
1
回答
在
R
中
对
一系列独立拟合使用lm()
r
、
lm
我想使用R
中
的lm()来拟合一个系列(实际上是93)的线性
回归
。根据R lm()帮助手册: “如果
响应
是矩阵,则
对
矩阵的每一列分别用最小二乘法对线性模型
进行
拟合。”只要Y
响应
矩阵
中
没有缺失的数据点,这就可以正常工作。当存在缺失点时,没有将每个
回归
与可用数据
进行
拟合,而是丢弃任何列中有缺失数据点的每行。
有没有
办法
指定lm()应该独立地适应Y
中
的所有列,而不丢弃单个列有缺失数据点的行?
浏览 4
提问于2012-09-18
得票数 1
1
回答
具有分类
变量
的数据集模型的选择
predictive-modeling
、
model-selection
数据集共有7个自
变量
和1个我需要预测的因
变量
。如果我想提高这个准确度,我该怎么做呢?考虑到我拥有的数据集,我如何从可以使用的模型中派生出这些模型呢?
浏览 0
提问于2018-02-06
得票数 5
1
回答
多权重Matlab
回归
matlab
、
linear-regression
、
weighted
在
Matlab语言中,我使用函数fitlm
在
响应
变量
y和预测器x之间执行线性
回归
。
在
我的分析
中
,我还包括了一个权重
变量
w。但是,权重
变量
只能是一个列向量,我希望同时控制多个因素。让我给你举个例子:y是按下按钮的
响应
时间,x是
响应
的准确性,weights = [gender age weight height]。我希望能够同时控制所有这些
变量
。
有没有
一种方法可以<e
浏览 2
提问于2015-11-11
得票数 0
2
回答
使用R的一行时间差
r
、
dataframe
、
time
2011,2012,2010,2011,2012,2012), result = c(3,5,6,1,2,4)) 在这里,我想
对
响应
变量
result做一些
回归
。因为我想估计result,所以我必须延迟
响应
变量
result,并留下另一个因
变量
points。因此,对于我的
回归
设置,result是
响应
变量</
浏览 1
提问于2022-07-06
得票数 0
回答已采纳
1
回答
从拟合的lm或glm [R]
中
获取每个因子级别(以及交互作用)
中
的数据数量
r
、
regression
、
linear-regression
、
lm
、
glm
我
在
R中有一个逻辑
回归
模型,其中所有的预测
变量
都是分类的,而不是连续的(除了
响应
变量
,它显然也是分类/二元的)。
在
调用summary(model_name)时,
有没有
办法
在
每个因子级别
中
包含一个表示观察值数量的列?
浏览 73
提问于2018-07-19
得票数 2
回答已采纳
1
回答
在
R
中
,使用带有伽马族的glm函数的默认链接函数是什么?
r
、
modeling
、
glm
、
gamma-distribution
、
gamma
我使用glm()函数实现了一个模型,并将家庭分布指定为
gamma
:我知道,您可以将链接函数,如“标识”或“日志”应用于伽马分布。我搞不懂他们
对
我数据的影响. 任何帮助都是非常感谢的--谢谢!
浏览 4
提问于2019-08-29
得票数 1
回答已采纳
2
回答
Bayesian vs OLS
machine-learning
、
linear-regression
、
bayesian
目的是试图从k个
回归
变量
中
建立一个只有一个
响应
变量
的
回归
模型。1.(贝叶斯
回归
)利用前500个样本来估计假设的先验分布的参数,然后用最后500个样本
对
后验分布的先验
进行
更新,
在
最后的
回归
模型中使用后验估计。2.(OLS
回归
)
对
所有1000个
回归
变量
使用一个简单的普通最小二乘
回归
模型。
浏览 3
提问于2017-06-04
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言拟合改进的稀疏广义加性模型(RGAM)预测、交叉验证、可视化
基于随机森林的分类与回归
第十一讲:贝叶斯学习与EM算法(中)
集成时间序列模型提高预测精度
Python之Sklearn使用教程
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券