Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在开发机器学习模型时，测试集中每个类的大小是否重要？

问在开发机器学习模型时，测试集中每个类的大小是否重要？
EN

Data Science用户

提问于 2020-11-15 17:55:44

回答 1查看 46关注 0票数 2

我正在考虑如何在现实世界中应用经过训练的分类器。我们知道，当我们对数据集进行过度/欠采样以平衡数据集时，我们永远不会触及测试集，因为我们希望保持数据集的真实行为。但是，我不理解的部分是测试集的分布在分类器性能中的作用。

假设我有一个模型，可以将电子邮件标记为垃圾邮件或非垃圾邮件。如果我在我的电子邮件服务中启动这个模型，在特定的时间窗口中，我的分类器接收到的所有电子邮件都可能是非垃圾邮件。但经过训练的模型对每个类别都有50-50%的分布。我的问题是，does this difference in the distribution--during the prospective application-- change the performance of the model?，例如，如果我的网络服务在那个时间窗口收到5个垃圾邮件和5个非垃圾邮件，我应该得到一个更准确的分类吗？根据我的理解，答案应该是否定的。尽管如此，我仍然随处可见，人们都在谈论测试分布的重要性及其在预测模型的性能和准确性中的作用。

谢谢。

cross-validation

class-imbalance

语音识别特惠，低至14.9元！

提供业界非常具有性价比的语音识别服务，超高识别准确率，适用多场景

EN

回答 1

Data Science用户

发布于 2020-11-16 01:15:22

取决于您是否要进行在线学习。

假设您将进行在线学习/增量学习，而测试集分发将产生影响。例如，由于神经网络的灾难性遗忘。

如果您正在进行批处理预测，则测试集分布没有任何区别。模型没有区别，因为它不改变ist状态。

票数 1

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/85476

复制

相关文章

Idea 打包成功，运行失败

最近开发中，发现一个奇怪的问题，用idea 的maven ，编译，打包都能够成功，项目中也没有爆红出错，但是你运行/调式SpringBoot的启动类的时候，会提示包**不存在。网上找了很多解决方案都没成功。最后终于成功了，特此记录分享下：

IT小马哥

2021/03/22

2.3K0

Hadoop 任务运行失败

任务运行失败最常见的情况是 map 任务或 reduce 任务中的用户代码抛出运行异常。如果发生这种情况，任务 JVM 会在退出之前向其父 application master 发送错误报错。错误报告最后被记入用户日志中。application master 会将此次任务尝试标记为 failed (失败)，并释放容器以便资源可以为其他任务使用。

smartsi

2019/08/07

3K0

IntelIj IDEA运行JUnit Test OutOfMemoryError

好久没看到OutOfMemoryError这种错误了，今天跑测试的时候发现总是报错。针对IDEA需要修改几个配置。 JUnit Test在运行前，IDEA会build整个项目，这个是喜欢eclipse的人最讨厌的地方，因为即便是别的不相干的类没配置好，我的Test也不能跑。我的错误正好是build的时候出现内存不够的。修改build内存位置Settings -> Compiler -> Build process heap size (MB), 原来默认是800m，修改2048M后，错误消失。修改运行

Ryan-Miao

2018/03/14

1.7K0

android UiAutomator让运行失败的用例重新运行

uml 腾讯云测试服务

本人在使用android UiAutomator做测试的时候，发现经常会因为页面加载太慢或者网络延迟比较大又或者出现意外情况导致用例失败，但是在检查的时候又能运行成功，提出了一个让失败的用例重新运行的需求，经过尝试终于成功了，使用excel作为测试报告的类型，html的类似，下面分享一下运行的代码，供大家参考。

FunTester

2019/09/04

8640

Linux后台持久运行 npm run dev

linux 登录后台命令行日志

命令行输入： which nohup 复制这个地址。一般是/usr/bin vi .bash_profile 在最后一行，PATH=$PATH:$HOME/bin 后面添加刚才查询的地址: :/usr/bin 即： source ~/.bash_profile cd 回到你的项目目录。如果你想记录日志文件【新建日志记录文件】 touch my.log chmod u+w my.log nohup npm run dev > my.log 2>my.log & exit 如果没有报错，就成功了。此时

司夜

2023/04/08

6.3K0

Linux后台持久运行 npm run dev

编译成功了,运行为什么会失败_如何编译内核

打包 https java 网络安全 node.js

arch/arm/configs下选则davinci_dm368_ipnc_defconfig_nand（nandflash启动），davinci_dm368_ipnc_defconfig_nfs（nfs文件系统启动）

全栈程序员站长

2022/09/21

6870

编译成功了,运行为什么会失败_cython编译python

pytorch python https 网络安全

最新的caffe2 已经移到pytorch中去了，直接下载其中的代码然后按照官方教程就可以了。

全栈程序员站长

2022/11/17

8560

Kylin启动失败||启动成功但Web界面显示404

bash bash 指令 hive spark xml

如果Kylin启动时控制台报某某依赖未找到的Error，那就很大可能是环境变量的配置出现了错误

WHYBIGDATA

2023/01/31

1.6K0

Kylin启动失败||启动成功但Web界面显示404

用户支付成功但下单失败了怎么办？

小程序微信网站编程算法

8月，是更新最少的一个月了，出差一个月，打乱了节奏，回来第一周异常的累，其实最近并没有看新的文章，或者特别感兴趣的东西，不过好在遇到了两个新问题，让我有东西可写。

疯狂的KK

2019/08/19

2.9K0

用户支付成功但下单失败了怎么办？

pycharm配置运行环境_服务器运行失败怎么办

https java 网络安全 tcp/ip

今天讲一下，如何使用pycharm 关联服务器代码，以及使用本地文件启动，服务器环境。

全栈程序员站长

2022/09/27

3.8K0

pycharm配置运行环境_服务器运行失败怎么办

FFD：Fast Feature Detector运行失败解决

https 网络安全 github git 开源

1、我直接运行FFD，发现确实报错了。可能是作者用到了OpenCV3.2来编译，而我电脑上装的是4.5版本，只有libopencv_calib3d.so.4.5。我重新下载了3.2.0版本并编译。

小锋学长生活大爆炸

2021/11/09

7200

FFD：Fast Feature Detector运行失败解决

python运行代码不成功_Python | PyCharm无法直接运行（Run）脚本

python java https ide

发现无法直接运行：没有Run选项，只有Run unittests选项。于是把脚本拷贝到另一个不是package的目录下

全栈程序员站长

2022/09/27

2.7K0

python运行代码不成功_Python | PyCharm无法直接运行（Run）脚本

Idea 运行Test报错：scala: No scalac found to compile scala sources

scala 操作系统插件

但是在操作系统上面安装了scala，在idea当中也安装了scala插件,依然会报错。

zeekling

2023/10/17

4420

Idea 运行Test报错：scala: No scalac found to compile scala sources

phpstorm安装xdebug（phpstudy环境下）成功运行

想要在phpstorm中调试请满足一个条件。那就是安装在d盘。为什么呢？因为这样方便复制粘贴呀, 要开启phpstudy中的php扩展的xdebug啊

贵哥的编程之路

2022/09/23

3500

phpstorm安装xdebug（phpstudy环境下）成功运行

成功的测试通常是运行测试用例后_成功的测试是指运行测试用例后

uml json https java python

用过pytest的小伙伴都知道，pytest的运行方式是非常丰富的，可以说是你想怎么运行怎么运行，想运行哪些运行哪些，那httprunner是否同样可以呢？

全栈程序员站长

2022/09/19

1K0

Tomcat闪退问题 Tomcat在eclipse运行失败

tomcat https eclipse java 网络安全

1.环境配置问题 2.端口被占用 3.直接修改 startup.bat 和 shutdown.bat 文件，在前面添加 jdk 和 jre 的安装路径 …还有很多这些方法随便一搜到处都是

全栈程序员站长

2022/08/26

1.1K0

Tomcat闪退问题 Tomcat在eclipse运行失败

2020-12-02 graphviz在windows运行失败

go 数据结构

今天使用go tool pprof test.test.exe prof.cpu，出现错误 Could not execute dot; may need to install graphviz. 解决问题步骤如下：

oracle3

2022/04/22

1.8K0

制作的 dotnet tool 运行失败提示依赖缺失

小伙伴做了一个很好用的 dotnet tool 工具，但是这个工具仅在他的设备上能运行，在我的设备上运行就会退出提示 An assembly specified in the application dependencies manifest (LindexiDoubi.deps.json) was not found 找不到依赖

林德熙

2020/07/28

9060

Python为什么文件运行和在命令行运行同样语句但结果却不同？

python 微信 https

这篇是之前知乎上的一个提问，感觉非常有趣而且内容丰富，所以把我自己的回答搬运到公众号来。另外关于昨天的推送，是因为我之前把文章投到了Python中文社区的公众号，他们那边开通了微信的原创保护，我后发的文章被判定了转载。已经和那边的负责人取得联系，加入转载白名单后会把之前的几篇文章再发出来。后续也会坚持更新其他文章的。微信文章没办法加入超链接。所以文中下划线的参考资料外链请到知乎页面打开：https://www.zhihu.com/question/53536750/answer/135411534。

不二小段

2018/04/08

2.3K0

Python为什么文件运行和在命令行运行同样语句但结果却不同？

npm运行项目报错：No ESLint configuration found 的解决方法

javascript npm eslint

今天接受了一个 Vue 项目，在执行 npm run serve 命令运行项目时报错：

德顺

2021/04/19

17K0

npm运行项目报错：No ESLint configuration found 的解决方法

相似问题

角: ng构建失败，但npm运行构建工作良好。

10

纱线运行命令失败，但npm运行正常

10

react npm运行构建失败，但运行启动有效

115

AngularJS项目ng命令未被识别，但npm运行ng工作。

10

运行Test.class，但加载ApplicationContext失败

10

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例