腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >我的模型应该总是在训练数据集上提供100%的准确率吗？

问我的模型应该总是在训练数据集上提供100%的准确率吗？
EN

Stack Overflow用户

提问于 2020-06-04 03:42:42

回答 3查看 4.7K关注 0票数 2

from sklearn.naive_bayes import MultinomialNB # Multinomial Naive Bayes on Lemmatized Text

X_train, X_test, y_train, y_test = train_test_split(df['Rejoined_Lemmatize'], df['Product'], random_state = 0)

X_train_counts = tfidf.fit_transform(X_train)
clf = MultinomialNB().fit(X_train_counts, y_train)
y_temp = clf.predict(tfidf.transform(X_train))

我正在训练数据集本身上测试我的模型。它给了我以下结果：

                          precision    recall  f1-score   support

               accuracy                           0.92    742500
              macro avg       0.93      0.92      0.92    742500
           weighted avg       0.93      0.92      0.92    742500

在训练数据集上获得100%的accuracy<是可以接受的吗？

machine-learning

scikit-learn

tf-idf

naivebayes

python

腾讯云域名特惠，新用户首年1元起

腾讯云域名专场特惠：个人新用户.cn仅8.8元/年，企业新用户.com仅1.06元/年...

回答 3

Stack Overflow用户

发布于 2020-06-04 03:49:50

不，你不应该从你的训练数据集中获得100%的准确率。如果是这样，可能意味着你的模型过度拟合了。

票数 5

Stack Overflow用户

发布于 2020-06-04 07:35:09

TL:DR:是的，在测试数据集上有更好的性能是可以获得的

分类(监督学习)中最重要的问题是泛化问题，即生产(或测试数据集)中的性能。实际上，学习数据集上的性能并不重要，因为它只用于学习模型。一旦完成，您将永远不会使用它，并且仅在学习过程中未见过的数据上的性能将提交给模型。

一个足够复杂(具有足够容量)的统计模型可以完美地拟合任何学习数据集，并在其上获得100%的准确率。但是，通过完美地拟合训练集，它在训练期间看不到的新数据上的性能将很差(过度拟合)。因此，这不是你感兴趣的东西。因此，您可以接受降低训练数据集的性能，以便更好地泛化，也就是说，在学习期间未使用的数据上获得更好的性能。这就是正则化。

在您的情况下，我仍然不确定MultinomialNB是否允许控制正则化。你应该尝试其他的sklearn分类器，比如proposed here。

票数 2

Stack Overflow用户

发布于 2020-06-04 09:06:57

我认为最好使用交叉验证结果来准确估计您的准确性。交叉验证被认为是避免过度拟合的一种有效方法。

from sklearn.model_selection import cross_val_score

scores = cross_val_score(clf, X_train, y_train, cv=10)

并且，您可以报告平均分的值：scores.mean()。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62186526

复制

在 SwiftUI 中用 zIndex 调整视图显示顺序

swift ios 容器 https 网络安全

本文将对 SwiftUI 的 zIndex 修饰符做以介绍，包括：使用方法、zIndex 的作用域、通过 zIndex 避免动画异常、为什么 zIndex 需要设置稳定的值以及在多种布局容器内使用 zIndex 等内容。

东坡肘子

2022/07/28

1.8K0

在 Linux 终端调整图像的大小

linux 图像处理

ImageMagick 是一个方便的多用途命令行工具，它能满足你所有的图像需求。ImageMagick 支持各种图像类型，包括 JPG 照片和 PNG 图形。

用户4988085

2021/09/14

4.5K0

张量拼接_调整维度_切片

编程算法

tf.concat的作用主要是将向量按指定维连起来，其余维度不变；而1.0版本以后，函数的用法变成：

狼啸风云

2019/07/01

1.3K0

Linux调整Swap大小

linux

关闭swap swapoff -a 1.创建交换分区的文件:增加2G大小的交换分区 dd if=/dev/zero of=/var/swapfile bs=1M count=2048 2.设置交换文件 mkswap /var/swapfile 3.启用交换分区文件 swapon /var/swapfile 4.在/etc/fstab添加 echo '/var/swapfile swap swap defaults 0 0'>>/etc/fstab 5.检查 free -m

苦咖啡

2018/04/28

8.7K0

在SwiftUI中使用UIKit视图

swift 网站 ios 编程算法

已迈入第三个年头的SwiftUI相较诞生初始已经提供了更多的原生功能，但仍有大量的事情是无法直接通过原生SwiftUI代码来完成的。在相当长的时间中开发者仍需在SwiftUI中依赖UIKit（AppKit）代码。好在，SwiftUI为开发者提供了便捷的方式将UIKit（AppKit）视图（或控制器）包装成SwiftUI视图。

东坡肘子

2022/07/28

8.3K0

调整JVM内存大小

jvm

JAVA程序启动时JVM都会分配一个初始内存和最大内存给这个应用程序。这个初始内存和最大内存在一定程度都会影响程序的性能；Tomcat默认可以使用的内存为128MB，在较大型的应用项目中，这点内存是不够的，需要调大。有以下几种方法可以选用：

MonroeCode

2018/01/12

3.2K0

ECharts散点图大小调整

编程算法

在业务需求中，有时候会遇到ECharts散点图，现在记录一下，今天解决了一个小问题，ECharts散点图大小调整。

王小婷

2019/05/07

5.1K0

小程序checkbox调整大小

小程序

.cb{ transform: scale(0.6,0.6); } <view> <label class="lab" for="box1"> <checkbox value="v1" checked class="cb"/>复选框 </label> </view>

苦咖啡

2018/04/28

4.1K0

InnoDB 缓冲池大小调整

http 数据库 sql

从MySQL 5.7.5开始，我们可以动态修改InnoDB Buffer Pool的大小。这个新特性同时也引入了一个参数--innodb_buffer_pool_chunk_size，buffer pool会根据这个参数值的整数倍增加或减小。这个参数不是动态修改的，如果配置错误，可能会导致不想看到的结果。

田帅萌

2019/01/23

5.6K0

VMware 中 Linux 调整分区大小

虚拟化 linux

Precondition ：VMware Player 中安装的Fedora 17 Linux 32bit，个人较久远的测试环境，安装时没有进行磁盘规划，默认20G空间（动态调整），安装在根/下。 Background ：在上述环境中安装IBM DB2 Express-C 10.5（v10.5fp1_linuxia32_expc.tar.gz），安装时/tmp空间不足，无法安装。 Plan：需要进行磁盘扩容。考虑到使用VMware Player虚拟机。

gigiwangs

2019/02/28

6.9K0

HPUX调整LUN大小识别更改

oracle

磁盘阵列通常允许调整 LUN 的大小，如果增加 LUN 的大小，请执行以下步骤将附加空间合并到卷组中： 1、按照阵列说明增加 LUN 的大小。 2、运行 vgmodify 检测任何物理卷大小更改。还将报告卷组能否使用所有空间。 3、如果 vgmodify 报告，每个物理卷的最大物理盘区数 (max_pe) 太小，无法容纳新增的空间，请使用带 -t 和 -n 选项的 vgmodify 确定 max_pe 的新值，如“修改卷组参数” 4、按照新的设置运行带 -r 选项的 vgmodify 检查这些值。 5、停用卷组。 6、提交 max_pe 的任何新值，运行不带 -r 选项的 vgmodify 更新物理卷信息。 7、激活卷组。运行 vgdisplay 和 pvdisplay 命令验证增加的空间是否可用。

星哥玩云

2022/06/30

1.5K0

python 调整图片大小脚本

jquery

infile = 'D:\original_img.jpg' outfile = 'D:\adjust_img.jpg' im = Image.open(infile) (x,y) = im.size #read image size x_s = 250 #define standard width y_s = y * x_s / x #calc height based on standard width out = im.resize((x_s,y_s),Image.ANTIALIAS) #resize image with high-quality out.save(outfile)

用户5760343

2022/05/13

2K0

Markdown 调整图片位置与大小

html markdown

使用 Markdown 编写文档或博客时，经常需要对图片的位置与尺寸进行调整。插入图片后，Markdown 表示图片的语法格式如下： ![图片描述](图片URL地址) 调整图片位置居左（1）方法一：添加位置标识。 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200822014538211.png#pic_left) （2）方法二：嵌入 HTML 代码。 <div align="left"> <img src=https://img-blog.csdnimg.c

恋喵大鲤鱼

2020/08/24

43.3K0

Visio如何调整锁定图像大小

其他

在Visio中，比如模板中的UML类图，是不可调整大小的，这可能给我们设计图片带来了一些不便之处，如下图：可以看到其边框是显示锁定状态无法修改的，当我们在左下角修改器长宽时，也会出现不可修改的情况。

码农阿宇

2018/04/18

4.5K0

通过修改样式调整trtccalling 视图

实时音视频

总体思路就是通过添加点击事件，给流播放节点动态添加样式，来实现视角切换。拿web 端 Demo来举例就是，通过点击，修改flex来实现两个dom的切换。

良人

2022/03/25

3350

调整分区大小后分区丢失的数据

tensorflow

盘符不见是比较常见的数据恢复案例，需要注意，盘符不见后不要再重建新的分区。保护好文件丢失现场，可以最大程度的恢复出文件。具体的恢复方法看正文了解。

用户10127983

2023/04/09

1.8K0

joplin调整markdown展示字体大小

markdown

joplin怎么调整字体大小呢？我相信比较少有人听过joplin，joplin是一个小众的笔记软件(https://joplinapp.org/)。但小编已经用了很久了。joplin的字体有时有点小，那么joplin怎么调整字体大小呢，下面就让小编带大家一起了解吧。 joplin在设置界面没有看到调整markdown字体的选项，那joplin怎么调整字体大小呢？原来调整字体大小只需要改它，下面一起看小编的操作吧。 joplin改markdown字体大小，只需要在外观-编辑 custom stylesheet 的 css。

超级大猪

2020/07/03

6.5K1

ggplot2 调整绘图区域大小

ggplot2 pdf plot png

熟悉 R 绘图的朋友肯定知道，在普通绘图中，图片的大小可以直接在 png() 和 pdf() 中指定，而绘图区大小则可以用 par() 中的 mar 或 mai 来指定。但是在 ggplot2 中，图片大小依然可以在 png 和 pdf 中设定，但是边界大小， par 函数似乎就不奏效了。至今天探索，才发现原来这个参数隐藏在 theme 中，其名为 plot.margin 。

章鱼猫先生

2021/10/15

19K0

干货分享|Windows系统调整分区大小

文件存储 jquery

你是否遇到C盘空间太小系统运行速度减慢的情况，想增加C盘空间怎么办？你是否遇到某个磁盘空间不够用，而相邻分区磁盘空间用不完的情况，你想调整两个磁盘大小怎么办？

吾爱运维

2022/09/29

4.1K0

Excel小技巧63：调整工作表中所有图表的大小并保持相同

vba excel 图表

在创建图表时，Excel会使用默认的大小。有时候，我们想将工作表中所有图表的大小进行调整，使其更小些或者更大些。可以通过逐个图表手动拖拉进行调整，然而，这样调整出来的图表大小总会稍有差异。要想使图表的大小保持一致，有多种方法，除了VBA外，下面介绍两种快捷的方法。

fanjy

2020/11/06

6.4K0

相似问题

如何使用DragGesture()在SwiftUI中调整形状大小限制？

如何调整滚动视图的大小，使其适合屏幕上的所有内容？

在调整NSWindow大小时自动调整所有视图的大小

调整视图大小，使其他视图不可见

如何防止SwiftUI视图在滚动时调整大小

111

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问我的模型应该总是在训练数据集上提供100%的准确率吗？
EN

腾讯云域名特惠，新用户首年1元起

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

如何使用DragGesture()在SwiftUI中调整形状大小限制？

如何调整滚动视图的大小，使其适合屏幕上的所有内容？

在调整NSWindow大小时自动调整所有视图的大小

调整视图大小，使其他视图不可见

如何防止SwiftUI视图在滚动时调整大小

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我的模型应该总是在训练数据集上提供100%的准确率吗？EN

腾讯云域名特惠，新用户首年1元起

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

如何使用DragGesture()在SwiftUI中调整形状大小限制？

如何调整滚动视图的大小，使其适合屏幕上的所有内容？

在调整NSWindow大小时自动调整所有视图的大小

调整视图大小，使其他视图不可见

如何防止SwiftUI视图在滚动时调整大小

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我的模型应该总是在训练数据集上提供100%的准确率吗？
EN