腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
R
中
测试
预测
变量
的
所有
子集
、
、
我想在
r
中
以编程方式构建glms,类似于这里描述
的
(How to build and test multiple models in
R
),除了
测试
所有
可能
的
预测
变量
子集
。因此,对于像这样
的
数据集,使用结果
变量
z data <- data.frame("z" = rnorm(20, 15, 3), "a&qu
浏览 13
提问于2020-01-17
得票数 0
3
回答
计算
R
中
向量
的
所有
子集
我想写一个小函数,我可以用它在
R
中
的
逻辑回归中自动选择特征,以暴力
的
方式
测试
预测
变量
的
所有
子集
,然后通过CV评估它们
的
分类性能。令人惊讶
的
是,我没有找到一个包来做这个“
所有
子集
功能选择”,因此我想自己实现它。 不幸
的
是,我有限
的
R
知识使我无法编写一个循环来生成给定向量
的
<em
浏览 0
提问于2013-06-05
得票数 2
回答已采纳
1
回答
XGBoost:
测试
数据
中
的
特性可以是用于训练模型
的
特性
的
子集
吗?
、
如果
测试
数据仅包含用于训练xgboost模型
的
特性
子集
,这是否是一个问题?我
的
所有
预测
变量
(1除外)都是因素,所以在将其转换为xgb.DMatrix之前先进行一次热编码。因此,不同级别的因素
变量
成为特性,而我
的
测试
并没有
所有
这些特性,只有一个
子集
。 目前,当我在
R
中
的
测试
数据上运行我
的
模型时,
浏览 0
提问于2019-06-14
得票数 2
回答已采纳
3
回答
删除
预测
差
的
数据点是一种有效
的
方法吗?
、
、
、
最后我做
的
是对训练
子集
上
的
模型进行拟合,找出
测试
子集
中
预测
误差最大
的
数据点,并删除这一个数据点。列车
测试
分割是随机进行
的
,因此偶然保留一些“坏”数据点
的
概率很低。“第一组”然后,整个过程在整个数据集上重复,减去第1组,最终,
所有
数据都应该被分成几组,在这些组
中
可以进行合理可靠
的
预测
。以这种方式将
所有
数据分割成组后,我期望能够对特
浏览 0
提问于2018-04-23
得票数 4
1
回答
正态回归和生存回归
的
预测
限
、
、
、
我知道,我建立
的
普通ML模型无法很好地
预测
2009年后安装
的
管道
的
泄漏持续时间。我这么说
的
原因是因为我首先根据他们
的
“安装年”对数据进行了排序,然后做了一个训练
测试
拆分,看看它如
何在
预测
测试
数据集中发挥作用,我得到了%93
R
平方,但当我在火车
测试
拆分
中
关闭了混洗功能时(这意味着与正常
的
火车
测试
拆分不同,
子集
是随
浏览 0
提问于2019-01-28
得票数 0
1
回答
具有多个二元
变量
的
回归?
、
我是数据科学领域
的
新手,我正在尝试用
R
开发一个小程序,我想用它来
预测
香水(香水)。我已经创建了一个包含我自己
的
所有
香水
的
数据集,其中我有一些属性作为列,比如酸橙、香草、鸢尾花等香水
的
注释。
所有
这些都是二元
变量
,我个人为每种香水都指定了一个0-10范围内
的
" like“连续值。如何使用
所有
这些二元
变量
对连续
变量
(
如
)进行回归。我想我必须使
浏览 3
提问于2021-01-01
得票数 0
1
回答
在训练数据之前,对特征排序(多重)
的
显着性
测试
有哪些?
、
、
、
我想运行一些显着性
测试
来对每个特征进行排序,将其作为异常
的
一个显著特征。 您能建议用Python对此进行一些重要
的
测试
吗?
浏览 0
提问于2020-03-01
得票数 0
1
回答
R
中
缺失因子
的
cv.glm问题
、
、
我正在使用
R
中
引导库
的
cv.glm交叉验证过程
测试
逻辑回归
的
性能。 我
的
一些
预测
变量
是因子。我可以在某些水平
的
因子
变量
不存在
的
观察值
的
子集
上训练回归模型。如果这个模型后来被用于新
的
观察,包括
预测
变量
的
未知水平,那么它就不知道如何表现。因为在我看来这是一个基本
的
简历问题,我很惊
浏览 39
提问于2013-06-06
得票数 3
回答已采纳
1
回答
我应该如何读取和使用数据从~40 for
的
csv时间序列
预测
?
、
、
、
我有一个~40 csv
的
csv文件,其中包含了2013-2016年出租车乘车情况
的
数据(大约)。我试图用它来
预测
2017年
的
收入。目前,我正在
测试
技术,
如
随机森林,xgboost和先知。由于内存限制,我只处理了一小部分数据,现在我需要使用
所有
可用数据进行
预测
。 为了
预测
目的,阅读
所有
这些数据
的
最好方法是什么: dask是否符合这个目的?对于较小
的
子集
,我使用熊猫,
浏览 0
提问于2018-04-16
得票数 1
回答已采纳
1
回答
我应该使用什么作为基本(一级)分类器
的
训练数据?
、
我能不能把我
所有
的训练数据,训练他们
的
基本模型,然后把他们
的
结果,并使用他们
的
训练水平2模型?这是一个好
的
做法,还是应该采取不同
的
做法?
浏览 0
提问于2020-01-12
得票数 1
回答已采纳
1
回答
缺少标准错误
的
测试
当我
的
预测
器完美地
预测
我
的
因
变量
时,我如
何在
Stata进行假设检验?sysuse auto, clear gen value = 2*foreign*(price<
浏览 3
提问于2015-09-28
得票数 1
回答已采纳
1
回答
用几个月
的
时间构造实验/训练数据
、
、
、
我们使用全年
的
数据来
预测
一个特定
的
目标variable.The模型,就像数据- OneHot编码分类
变量
- MinMaxScaler - PCA (从15k中选择2000年组件
的
子集
)- MLPRegressor但是,当我们进行ShuffleSplit交叉验证时,
所有
事情都很糟糕(
r
^2分数超过0.9,错误率也很低),但是在现实生活
中
,他们不会使用相同格式
的
数据(例如,全年
的
数据),而是使用那个月到
浏览 0
提问于2020-02-12
得票数 2
1
回答
在lda分析过程
中
,我
的
数据代表有问题吗?
、
当我试图在
R
中
的
虹膜数据集
的
子集
上运行lda时,我得到了一个错误,
变量
长度似乎不同,我不明白为什么?表
中
的
错误(原始= ytest,
预测
= pred_class):
所有
参数必须具有相同
的
长度 orlda = linDA(dtraino
浏览 0
提问于2019-01-05
得票数 0
回答已采纳
3
回答
具有逗号分隔值
的
因
变量
的
预测
、
、
我从基因
测试
的
调查结果
中
得到
的
数据如下:有关更多详细信息,请参见csv文件示例: https://drive.google.com/open?基于上面csv文件
中
的
特性,我想要创建一个模型来帮助我
预测
“actionspost”值。然后为“actionspost”
的
每个唯一值创建数据集
子集
。这一次,因
变量
将不是actionspost,而是类似于“isactionpost2?”(是=1
浏览 0
提问于2016-05-13
得票数 0
1
回答
计算
预测
连续值
的
准确度分数
、
、
from sklearn.metrics import accuracy_score我相信这段代码将返回我们
预测
的
准确性。然而,我正在比较连续值
的
预测
值和实际值,我相信它们
中
的
大多数不会完全相同。有人能建议我如
何在
连续
变量
的
情况下衡量
预测
的
浏览 1
提问于2018-03-05
得票数 3
回答已采纳
1
回答
通过穷举搜索在Python
中
实现
子集
回归
、
使用Python在线性回归中对x
中
预测
y
的
变量
的
最佳
子集
执行穷举搜索
的
最佳方法是什么?例如,
R
有一个名为
的
包,它使用一种有效
的
分支定界算法来实现这一点。
浏览 1
提问于2016-06-04
得票数 0
1
回答
建立具有多(8)个
预测
变量
的
负二项GLMM
我是
R
的
新手,我正在尝试使用负二项GLMM创建模型。问题是,我有一个响应
变量
,我想
测试
8个
预测
变量
的
多重共线性。例如,当只有3个
预测
变量
时,这似乎很容易,因为这意味着只有4种可能
的
组合。然而,我想知道在
测试
多重共线性时,是否有一种更容易
的
方法来为8个不同
的
预测
变量
设置
所有
可能
的
组合,而不是手动
浏览 14
提问于2021-04-21
得票数 1
2
回答
根据
R
中
循环中
的
循环数为数据帧生成
变量
名
、
、
我已经通过使用0和1
的
随机生成器(各有50%
的
概率)向我
的
数据帧添加了一个
变量
。我使用这个
变量
将数据框
子集
到一个训练集和一个验证集,如果没有将记录分配给训练集,它就会被分配到验证集。通过使用这些
子集
,我能够估计模型
的
拟合程度(通过对验证集中
的
记录使用
预测
函数,并将它们与原始值进行比较)。我对优化模型
的
系数和
预测
结果与实际结果之间
的
KS检验结果感兴趣。我
的<
浏览 4
提问于2012-07-25
得票数 0
回答已采纳
1
回答
训练H2O模型时忽略ID
变量
、
、
如果有人能告诉我如
何在
创建(训练和
测试
模型)时将ID
变量
保留为指示
变量
而不是
预测
变量
,那就太好了。我正在使用H2o到
R
。如果有人能回应他们
的
想法,我将非常感谢。
浏览 2
提问于2018-02-01
得票数 0
1
回答
如何使用
R
中
的
循环在多个条件下设置矩阵
的
子集
?
示例矩阵(输入) <code>C0</code>我想使用多个条件
的
集合来
子集
R
中
的
一个矩阵-对于
所有
子集
(S1和S2)
的
每一列(PH和PNH),我必须计算香农多样性-所以我
的
问题是“如
何在</
浏览 16
提问于2018-12-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习基础Python训练集测试集分割与交叉验证
机器学习模型训练全流程!
在R语言中实现Logistic逻辑回归
R语言特征选择——逐步回归
当今最火10大统计算法,你用过几个?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券