开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >UnknownCategoricalLevels如何影响H2O模型预测的置信值

问UnknownCategoricalLevels如何影响H2O模型预测的置信值
EN

Stack Overflow用户

提问于 2017-10-30 15:22:51

回答 1查看 171关注 0票数 0

我正在使用用h2o flow生成的DRF模型。当针对这个模型运行新的输入数据(在EasyPredictModelWrapper的java程序中使用它的MOJO )时，有大量的UnknownCategoricalLevels (使用getUnknownCategoricalLevelsSeen()和getUnknownCategoricalLevelsSeenPerColumn() 方法进行检查)。

我的解决办法是只使用那些在某个阈值(比如0.90)以上具有预测可信度的预测。即。模型选择的classProbability必须比要使用的阈值更高。

我的问题是：

这个解决办法不正确吗？实际上并没有解决/解决这个问题。unknownlevels实际上不会影响类的概率值)，或者它是解决问题的有效方法吗？
有没有更好的方法来解决这个问题？

谢谢。

machine-learning

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-11-11 08:00:04

未知的分类级别被视为该列的安娜。

在不了解数据的详细信息(包括假阳性和假阴性的成本影响)的情况下，我不会说您需要对具有NAs的行进行阈值化，这些行与不具有NAs的行有任何不同。(DRF已经很好地处理了NA。)

注意，内置阈值是max-F1 (不是0.5)。因此，如果要更改值未知的行的阈值，则相对于max-F1 (而不是0.5)。使用您自己的阈值当然是一种有效的方法。

如果您想要可视化您的树，以便更容易地查看NAs的行为，您可以按照这里的说明这样做：

http://docs.h2o.ai/h2o/latest-stable/h2o-genmodel/javadoc/overview-summary.html#viewing-a-mojo

还有其他处理它的策略，比如目标--编码你的分类输入列，并将安娜作为平均目标值。(这实际上将一个分类变量转换为一个数字变量，但需要对数据进行预处理。)

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47025680

复制

相关文章

双精度，单精度和半精度

https 网络安全 numpy tensorflow 深度学习

浮点数是计算机上最常用的数据类型之一，有些语言甚至数值只有浮点型（Perl，Lua同学别跑，说的就是你）。

用户1148523

2019/05/27

6K0

c++编程算法腾讯云测试服务

摘自维基百科 http://zh.wikipedia.org/wiki/Ctype.h

用户7886150

2021/02/25

8320

python ctype模块（一）

ctypes module 程序

官网：https://docs.python.org/2.6/library/ctypes.html?highlight=ctype#module-ctypes ctypes 的简单使用。 ctyp

py3study

2020/01/08

8370

SpringBoot返回前端Long型丢失精度咋办

javascript java 编程算法

最近为Prong开发了一个基于snowflake算法的Java分布式ID组件，将实体主键从原来的String类型的UUID修改成了Long型的分布式ID。修改后发现前端显示的ID和数据库中的ID不一致。例如数据库中存储的是：812782555915911412，显示出来却成了812782555915911400，后面2位变成了0，精度丢失了：

用户3467126

2021/11/09

4.3K0

SpringBoot返回前端Long型丢失精度咋办

轮询和长轮询轮询和长轮询

flash socket编程 javascript ajax html

轮询和长轮询轮询：客户端定时向服务器发送Ajax请求，服务器接到请求后马上返回响应信息并关闭连接。优点：后端程序编写比较容易。缺点：请求中有大半是无用，浪费带宽和服务器资源。实例：适于小型应用。长轮询：客户端向服务器发送Ajax请求，服务器接到请求后hold住连接，直到有新消息才返回响应信息并关闭连接，客户端处理完响应信息后再向服务器发送新的请求。优点：在无消息的情况下不会频繁的请求。缺点：服务器hold连接会消耗资源。实例：WebQQ、Hi网页版、Facebook IM。另外

大道七哥

2019/09/10

2.2K0

轮询和长轮询_http长轮询

socket编程 flash http https ajax

长轮询：说白了也是客户端请求服务端，但是服务端并不是即时返回，而是当有内容更新的时候才返回内容给客户端，从流程上讲，可以理解为服务器向客户端推送内容；

全栈程序员站长

2022/09/20

1.5K0

利用高精度拼接算法实现长柱形物体检测

今天跟大家分享的是我们在近几年多次成功在客户现场部署的利用高精度拼接算法实现长柱形物体检测方案。

小白学视觉

2022/09/28

3220

C++ AMP双精度Windows环境测试报告

测试日期：2014-2-26 测试环境：华硕ESC1000超算工作站测试GPU：AMD FirePro S7000 测试系统：Win7 & Win 8 测试过程：测试代码下载：完整的C++ AMP工程参考材料：微软对于C++ AMP双精度的描述为：（http://blogs.msdn.com/b/nativeconcurrency/archive/2012/02/07/double-precision-support-in-c-amp.aspx） A WDDM 1.1 drive

GPUS Lady

2018/03/30

1K0

python 与 C 的交互(ctype

python http https html

对指针实例赋值只会改变其指向的内存地址，而不是改变内存的内容。指针实例有一个contents属性，返回这个指针所指向的对象。

py3study

2020/01/07

1.7K0

python 与 C 的交互(ctype

AMD 新卡皇，双精度达到2.53TFlops

在 AMD FirePro S9150 服务器 GPU 面前，强度最大的计算密集型工作负载和复杂计算都不能构成挑战。它支持 OpenCL™ 1.2、16GB GDDR5 显存、最高可达 2.53 TFLOPS 的峰值双精度浮点运算性能和最高可达 10.8 GFLOPS/W 的峰值双精度性能，这让您的选择毋庸置疑。AMD FirePro S9150 GPU 能够提供无与伦比计算性能和每瓦特性能。 GPU 计算性能处于业内领先地位作为首款具有 ½ 比率双精度，并突破 2.0 TFLOPS 双精

GPUS Lady

2018/03/30

1.6K0

小朋友学C语言（4）：单精度浮点数与双精度浮点数

上节课简单介绍了浮点数。计算机程序中的浮点数分为单精度浮点数和双精度浮点数。单精度和双精度精确的范围不一样。计算机里的最基本的存储单位用位(bit)来表示。bit只能用来存储0或1。稍大一点的单位是字节(Byte，简写为B）。再大一级的是千字节(kilo Bytes)，用k来表示。再大一级的单位是兆字节(Mega Bytes)，用M来表示。一张照片的大小通常为1~3M。再大一级的单位为G。一部高清电影的大小通常为1~2G。再大一级的单位为T。换算关系为： 1B = 8bit 1k =

海天一树

2018/04/17

2.9K0

小朋友学C语言（4）：单精度浮点数与双精度浮点数

避坑 | 记一次前端长整数精度丢失问题

json java 网站

后端Java实现的接口如下，返回一个json格式的大整数 123456789123456789：

程序员鱼皮

2020/11/25

11.8K1

避坑 | 记一次前端长整数精度丢失问题

C/C++ 双精度double 数据相加出错缺陷解释

该文章讲述了作者在 C++ 社区遇到的一个问题，在两个数值相加时，程序显示的数值误差可能导致结果出错。作者通过使用 fabs 函数来修正误差，并给出了具体的解决方法。

林冠宏-指尖下的幽灵

2018/01/02

1.4K0

ANTNet|端侧架构，精度速度双超MobileNetV2

机器学习神经网络深度学习人工智能

code: https://github.com/yyxiongzju/ANTNets

AIWalker

2020/08/10

1.7K0

ANTNet|端侧架构，精度速度双超MobileNetV2

spring ajax 长轮询,Ajax轮询和长轮询

编程算法 ajax json php

缺点：Ajax轮询需要服务器有很快的处理速度与快速响应。long poll需要很高的并发，体现在同时容纳请求的能力。

全栈程序员站长

2022/11/04

1.4K0

【STM32H7的DSP教程】第30章 STM32H7复数浮点FFT（支持单精度和双精度）

完整版教程下载地址：http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第30章 STM32H7复数浮点FFT（支持单精度和双精

Simon223

2021/06/17

1.1K0

【STM32H7的DSP教程】第30章 STM32H7复数浮点FFT（支持单精度和双精度）

【STM32H7的DSP教程】第31章 STM32H7实数浮点FFT（支持单精度和双精度）

完整版教程下载地址：http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第31章 STM32H7实数浮点FFT（支持单精度和双精

Simon223

2021/06/17

1.1K0

【STM32H7的DSP教程】第31章 STM32H7实数浮点FFT（支持单精度和双精度）

C库函数手册(ctype.h)

ctype.h函数说明： int isalpha(int ch) 若ch是字母('A'-'Z','a'-'z')返回非0值,否则返回0 int isdigit(int ch) 若ch是数字('0'-'9')返回非0值,否则返回0 int isalnum(int ch) 若ch是字母('A'-'Z','a'-'z')或数字('0'-'9')返回非0值,否则返回0 int islower(int ch) 若ch是小写字母('a'-'z')返回非0值,否则返回0 int isupper(int ch)

用户1215536

2018/02/05

7870

mysql长轮询_ajax的轮询和长轮询

ajax json php 编程算法

轮询(polling)：客户端按规定时间定时像服务端发送ajax请求，服务器接到请求后马上返回响应信息并关闭连接。

全栈程序员站长

2022/11/08

3.9K0

【STM32F407的DSP教程】第31章 STM32F407实数浮点FFT（支持单精度和双精度）

完整版教程下载地址：http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第31章 STM32F407实数浮点FFT（支持单精度和

Simon223

2021/06/17

1.7K0

【STM32F407的DSP教程】第31章 STM32F407实数浮点FFT（支持单精度和双精度）

相似问题

精度长双精度比双精度差

14

c++中双精度和长双精度的区别

112

FFTW与长双精度

11

双精度和长整型数字的减法

52

试着访问长双数学宏和长双的精度

20