腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
可以
根据
总体
的
子集
指定
GBM
(
或
任何
ML
algo
)
的
损失
函数
吗
?
、
、
我
正在尝试为
GBM
创建一个
损失
函数
,其中
我
有两个子
总体
,比方说按性别划分。除了试图正确预测实际情况之外,
我
还想惩罚模型在一个性别上表现得比另一个性别更好。例如,
我
可能愿意牺牲模型
的
整体性能,只是为了减少男性和女性
的
假阴性率之间
的
差异。
我
找到了向
损失
函数
添加额外参数
的
解决方案,但我找不到
任何
基于潜在
总体<
浏览 17
提问于2021-07-08
得票数 1
1
回答
gbm
多项分布
、
我
第一次尝试在
我
的
数据上使用
gbm
(实际上是第一次使用
任何
类型
的
回归树),它由14个连续
的
因变量和一个因子作为响应变量,有13个水平。
我
是通过Elith等人非常好
的
描述来到
gbm
的
,但是他们使用了基本
gbm
包
的
修改,不能处理多项式分布。在
gbm
的
帮助下,它声称
可以
处理这个问题: “分布:
指定
浏览 4
提问于2013-02-12
得票数 1
回答已采纳
1
回答
在LightGBM (分类)中,叶分数是多少?
、
、
、
我
在一个二进制分类问题上训练了LightGBM,在绘制树时,
我
得到了一些这样
的
叶子
我
很难找到分类树
的
损失
函数
- LightGBM是否最小化了二元情况下
的
交叉熵,这是叶分数
吗
?
浏览 3
提问于2020-11-13
得票数 0
1
回答
R-
gbm
函数
中
的
权参数
、
、
、
、
R- weights
函数
中
的
参数是什么?它实现了cost-sensitive随机梯度增强
吗
?
浏览 4
提问于2015-04-16
得票数 5
1
回答
如何知道成本
函数
是否已变为最小值?
、
、
我
试图在不使用
ML
相关库
的
情况下实现逻辑回归,并且在优化成本
函数
时遇到了麻烦。这是否意味着
我
的
代码中有一些错误? 或者,0.66
可以
是成本
函数
的
最小值
吗
?
我
浏览 0
提问于2020-01-02
得票数 1
2
回答
如何对多个
ML
模型执行网格搜索
、
、
、
通常,我们使用GridSearchCV对特定模型
的
超参数执行网格搜索,例如:params_ada = {'n_estimators':params_ada, scoring = 'accuracy', cv = 5, verbose = 1, n_jobs = -1)有什么技术
或
功能
可以
让我们在
ML
模型上执行网格搜索
吗
?例如,
我
浏览 2
提问于2020-12-21
得票数 1
回答已采纳
1
回答
如何在Azure AutoML中调整功能重要性
、
、
、
我
希望有一些使用Azure AutoML
的
低代码模型,它实际上只是到AutoML选项卡,对
我
的
数据集进行分类实验,在完成之后,我部署了最好
的
选择模型。这个模型有点工作(意思是,
我
发布了端点,然后做了一些手动验证,看起来很准确),但是,
我
不够自信,因为当我看到解释时,
我
可以
看到这样
的
东西:4顶级功能并不是非常重要
的
。最“重要”
的
不是
我
喜欢用
的</
浏览 15
提问于2021-12-07
得票数 2
回答已采纳
2
回答
R中相似情形(观测)最小距离
的
计算
我
有一个数据集,它描述了将3种算法应用到多个cases.For中
的
结果--每种算法和案例
的
结合,都有一个结果。因此,对于每个算法和案例,
我
想要计算到最低达到
的
结果
的
差距,,对于相同
的
情况,
任何
算法都
可以
实现。,
我
得到了预期
的
结果。23 13现在看来,gap
函数
与整个dataframe
的
浏览 1
提问于2017-07-26
得票数 0
回答已采纳
2
回答
如何处理H2O算法中
的
倾斜响应
、
、
在
我
的
问题中,dataset响应变量非常偏左。
我
试着将模型与h2o.randomForest()和h2o.
gbm
()相匹配,如下所示。
我
可以
给曲调min_split_improvement和min_rows,以避免过度适应这两种情况。但是有了这些模型,
我
发现尾部观测有很高
的
误差。,
我
尝试了h2o包
的
h2o
函数
。然而,
我
认为这是非常过份
的
。
我
不知道
浏览 1
提问于2018-01-18
得票数 5
回答已采纳
2
回答
如何再现H2o
GBM
类概率计算
、
、
、
、
我
一直在使用h2o.
gbm
来解决分类问题,并希望进一步了解它是如何计算类概率
的
。作为起点,
我
试图重新计算只有一棵树
的
gbm
的
类概率(通过查看leafs中
的
观察结果),但是结果非常混乱。
我
认为最好
的
方法来说明这种混淆是告诉
我
做了什么,以一种循序渐进
的
方式。
我
不关心超值
或
模特
的
表现。H2o为此提供了一个
函
浏览 1
提问于2017-06-24
得票数 3
3
回答
多输出模型
的
Keras精度不起作用。
、
在多输出模型
的
情况下,一个重要
的
关注点是,这种模型
的
培训需要为网络
的
不同头(输出)
指定
不同
的
度量标准。如正式文件所述: metricsmse', 'output_d'
浏览 1
提问于2018-05-26
得票数 3
1
回答
gbm
.step,总平均偏差不会降低
、
我
使用以下参数从dismo包中运行
gbm
.step
函数
gbm
.x= predictor_names , #site.weights此外,如果
我
增加了n.tre
浏览 2
提问于2017-11-23
得票数 0
1
回答
股市神经网络中Keras
损失
的
特征及精度
、
、
、
、
最近,
我
尝试完成一个神经网络来预测股票市场上单个股票价格
的
波动,使用Keras作为网络
的
框架,Quandl检索历史性
的
调整后
的
股票价格;在运行这个程序时,
我
主要使用了一个单独教程中显示
的
程序范例和信息,链接如下: Trai
浏览 0
提问于2020-01-04
得票数 0
回答已采纳
1
回答
ML
.net中多类多标签分类
的
每类加权
损失
、
我
想对几个类别进行分类,比如说A、B、C和D,但数据集是不平衡
的
(A类
可以
有60%
的
情况)。因此,
ML
.NET中
的
多类分类算法倾向于预测A.这种不平衡
的
情况在
我
的
问题人群中很常见:A比其他人更频繁,B比C更频繁,C比D更频繁。目前,
我
对通过向上/向下采样数据集
或
增加数据集大小来解决这个问题不感兴趣(除非没有其他选择)。但是
我
找不到在
ML
.Net中做这件事
浏览 30
提问于2021-05-10
得票数 0
1
回答
我们能否
指定
使用哪种算法(例如,决策树、支持向量机、集成、NNs)?或者,Automl是否选择算法本身?
、
、
我
试着阅读Vowpal
的
,它并没有
指定
如何选择特定
的
学习算法(而不是
损失
),比如支持向量机、神经网络、决策树等等。 还是
根据
问题类型(回归/分类类似于自动类型
或
低代码
ML
库)选择算法本身?有一些博客显示,使用-nn命令使用神经网络,但这不是文档
的
一部分--这是因为它没有像上面提到
的
那样关注特定
的
算法
吗
?如果是这样的话,沃帕尔·瓦比特在本质上是什么?
浏览 0
提问于2020-07-30
得票数 1
回答已采纳
1
回答
在不丢失趋势
的
情况下对较小
的
线形图点集进行采样
、
、
、
、
给定一组X/Y坐标((x,y),递增X(表示时间戳)和Y表示该时间戳
的
值/测量值)。这个集合可能很大,
我
希望避免返回集合中
的
每个点进行显示,而是找到一个较小
的
子集
来表示测量
的
总体
趋势(折线图中
的
某种程度
的
精度
损失
是
可以
接受
的
)。到目前为止,
我
尝试了以均匀间隔对测量跳跃点进行简单
的
均匀采样,然后将最大/最小测量值添加到
浏览 17
提问于2020-03-31
得票数 0
1
回答
带有插入符号和summaryFunction mnLogLoss
的
错误:与'lev‘一致
的
列
、
我
试图使用日志丢失作为使用Caret进行培训
的
损失
函数
,使用来自 of Kaggle
的
数据。library(caret)3: train(x, y, weights = w, ...) 2: train.formula(shot_made_flag ~ ., data = train, method = "
gbm
= ctrl, metric = "l
浏览 2
提问于2020-01-09
得票数 1
回答已采纳
2
回答
监督学习方法-创建
我
自己
的
标签
、
、
、
场景--
我
有没有标签
的
数据,但是
我
可以
创建一个
函数
,
根据
行为给数据贴上标签,然后部署模型,这样
我
就不用一直给数据贴标签了。这算是机器学习
吗
?目的:基于high、medium
或
low标签对具有容量峰值
的
账户进行分类,使其部署在大数据(数万亿条数据线)上。创建一个名为spike
的
新功能列,并创建一个熊猫
函数</
浏览 0
提问于2019-06-26
得票数 2
2
回答
将条件
指定
为变量以将R中
的
数据框
子集
假设
我
有一个数据框,df有30列:A1到A30。
我
知道
我
可以
通过编写如下命令来设置此数据帧
的
子集
:上面的示例
根据
三列中
的
值过滤数据,但我必须对大约12列中
的
值执行此操作。在subset()
函数
中写入这12个值会使它太长。为了使代码更清晰,有没有一种方法<em
浏览 2
提问于2011-06-24
得票数 3
回答已采纳
1
回答
交叉熵(
损失
)
的
实体是什么?
交叉熵( -\sum y_i\;\log(\hat{p_i}) )基于估计
的
概率( \hat{p} )估计了使用Huffman编码编码y所需
的
信息量。因此,人们
可以
声称,应该考虑衡量信息
的
数量,例如一些双边投资条约。
根据
\log
的
基础,它们
可以
是二进制位
或
数字,但通常是欧拉位,因为大多数使用\ln。是否有一个流行
的
或
官方
的
名称
或
单位,这些所谓
的
欧拉位?
可
浏览 0
提问于2021-06-22
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
人工智能–GBM算法
Sentieon | 应用教程:DNAscope使用机器学习模型进行胚系变异调用
流行于机器学习竞赛的Boosting,一文讲透足够了
流行于机器学习竞赛的Boosting,这篇文章讲的非常全了
R语言梯度提升机 GBM、支持向量机SVM、正则判别分析RDA模型训练、参数调优化和性能比较可视化分析声纳数据
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券