开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在scikit-learn中评估估计器的性能

问在scikit-learn中评估估计器的性能
EN

Stack Overflow用户

提问于 2013-06-07 18:16:46

回答 1查看 3.1K关注 0票数 1

我正在使用scikit learn 0.13.1在Kaggle上进行比赛。我正在使用决策树分类器，为了评估我的估计器，我遵循了通过train_test_split分割训练数据或使用cross_val_score进行交叉验证的技术。任何一种技术都会表明估计器大约有90%的准确率。然而，当我在实际测试数据上使用估计器时，获得的准确率大约降低了30%。让我们假设训练数据是测试数据的良好表示。

我还能做些什么来评估估计器的准确性？

clf = tree.DecisionTreeClassifier( )
...
X_train, X_test, y_train, y_test = train_test_split(train, target, test_size=0.3, random_state=42)
...
clf.fit(X_train, y_train)
print "Accuracy: %0.2f " % clf.score(X_test, y_test)
...    
scores = cv.cross_val_score(clf, train, target, cv=15)
print "Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() / 2)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-06-07 18:58:54

这可能意味着在最终评估数据和开发集的分布之间存在显着差异。

不过，测量决策树的过度拟合将是一件有趣的事情:在您的拆分中，训练分数clf.score(X_train, y_train)和测试分数clf.score(X_test, y_test)之间的差异是什么？

同样，纯粹的决策树应该被认为是一个玩具分类器。它们的泛化特性非常差(并且可能会过度拟合)。你真的应该尝试一下ExtraTreesClassifier，因为n_estimators的数量越来越多。如果数据集足够小，则从n_estimators=10开始，然后是50、100、500、1000。

票数 5

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/16990486

复制

相关文章

Python抛出异常_python抛出异常的作用

python https 网络安全

在python中不同的异常可以用不同的类型（python中统一了类与类型，类型即类）去标识，不同的类对象标识不同的异常，一个异常标识一种错误

全栈程序员站长

2022/11/02

2.5K0

Java陷阱之：finally块抛出异常或return导致异常丢失

java return 日志设计异常

java中finally语句包含有抛出异常或者return语句，会把try块中出现的异常丢弃。

崔认知

2023/06/19

8830

Java陷阱之：finally块抛出异常或return导致异常丢失

【C++ 语言】异常 ( 抛出字符串异常 | 抛出异常对象 | 抛出任意对象 | 抛出自定义异常 )

对象继承异常异常处理字符串

1. 异常处理 : 使用 " try{}catch(){} " 将抛出异常的代码包起来 , 注意将可能抛出异常的代码包裹在 try 后的大括号中 , 将异常处理逻辑放在 catch 后的大括号中 ;

韩曙亮

2023/03/27

1.3K0

django 获取字段选项 choice 的值

由二项元组构成的一个可迭代对象（例如，列表或元组），用来给字段提供选择项。如果设置了choices ，默认的表单将是一个选择框而不是标准的文本框，而且这个选择框的选项就是choices 中的选项。

卓越笔记

2023/02/18

2.7K0

android 抛出FileNotFoundException异常

https 网络安全

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

全栈程序员站长

2022/11/17

1.6K0

.net remoting 抛出异常

所有在远程软件运行的类，如果需要传输到本地，都需要继承 MarshalByRefObject 或其他可以序列化的类。

林德熙

2018/09/19

1.5K0

.net remoting 抛出异常

dotnet remoting 抛出异常

.net 面向对象编程文件存储 json

所有在远程软件运行的类，如果需要传输到本地，都需要继承 MarshalByRefObject 或其他可以序列化的类。

林德熙

2019/09/27

1.4K0

dotnet remoting 抛出异常

python抛出异常和捕获异常_在try块中可以抛出异常吗

python https 网络安全

2.解析关键字try 以及except是使用Python 解释器主动抛出异常的关键， Python解释器从上向下执行当运行try中的某行代码出错,会直接进入except中执行下方代码 try中错行下方的代码不会被运行 except…as… 是固定的语法格式打印traceback信息 finally 后的代码不管是否抛出异常都会执行 except 的原理调用sys中 exc.info 方法返回基本信息所以抛出异常的第一步拓展可以在这里开始注意每个关键字下方的代码都是独立的(所有的变量都是局部变量)

全栈程序员站长

2022/11/02

4.5K0

python抛出异常会终止程序吗_catch里面抛出异常

https 网络安全

如果没有 try 和 except 语句覆盖抛出异常的 raise 语句，该程序就会崩溃，并显示异常的出错信息。通常是调用该函数的代码知道如何处理异常，而不是该函数本身。所以你常常会看到 raise 语句在一个函数中，try 和 except 语句在调用该函数的代码中。

全栈程序员站长

2022/11/19

2.2K0

dotnet remoting 抛出异常

文件存储数据处理 .net 面向对象编程 json

所有在远程软件运行的类，如果需要传输到本地，都需要继承 MarshalByRefObject 或其他可以序列化的类。

林德熙

2022/08/04

1K0

python抛出异常和捕获异常_Python异常

class Widget: def __init__(self,size=(40,40)): self._size=size def getSize(self): return self._size def resize(self,width,height): if width<0 or height<0:

全栈程序员站长

2022/11/02

2.9K0

应该抛出什么异常？不应该抛出什么异常？（.NET/C#）

2018-02-04 13:25

walterlv

2018/09/18

1.7K0

python抛出异常会终止程序吗_python抛出异常的作用

python https 网络安全编程算法

当python执行无效的代码时，就会抛出异常。用 try 和 catch 语句可以处理异常，以避免程序的崩溃。我们也可以在代码中抛出自己的异常，抛出异常意味着停止运行这个函数中的代码，将程序执行转到except语句

全栈程序员站长

2022/11/02

1.8K0

c++构造函数是否可以抛出异常_什么叫抛出异常

c++java https 网络安全

从语法上来说，构造函数可以抛出异常。但从逻辑上和风险控制上，构造函数中尽量不要抛出异常。万不得已，一定要注意防止内存泄露。

全栈程序员站长

2022/09/22

1.7K1

Java 捕获和抛出异常

Java中把非正常情况分为两种：异常（Exception）和错误（Error），其中Error错误一般是指与虚拟机相关的问题，这种错误无法恢复或不可能捕获，而对于Exception异常我们可以使用try…catch进行捕获。try…catch不允许存在单独的try块或catch块，可存在多个catch块。try块中存放业务功能代码，catch块中存放异常处理代码。Java7后支持用catch捕获多个异常，也可捕获自定义异常。对于捕获的异常一般可以使用printStackTrace()方法追踪输出至标准错误流。try…catch后可以添加finally，使用finally可以保证除系统退出外finally块中代码绝对执行。捕获异常时需要注意一定要先捕获小异常，再捕获大异常，否则小异常将无法被捕获。代码示例如下

用户7886150

2021/04/06

1.9K0

django 主动抛出 403 异常

django web.py 腾讯云开发者社区 https 网络安全

* 网站名称：obaby@mars * 网址：https://h4ck.org.cn/ * 本文标题：《django 主动抛出 403 异常》 * 本文链接：https://h4ck.org.cn/2018/12/django-%e4%b8%bb%e5%8a%a8%e6%8a%9b%e5%87%ba-403-%e5%bc%82%e5%b8%b8/ * 转载文章请标明文章来源，原文标题以及原文链接。请遵从《署名-非商业性使用-相同方式共享 2.5 中国大陆 (CC BY-NC-SA 2.5 CN) 》许可协议。

obaby

2023/02/24

7540

python中用来抛出异常的关键字是( )_python异常抛出

python 命令行工具

动抛出异常raise typeerror(类型错误) # 7. 触发异常try: raise typeerror(类型错误)except exception as e: print(e) # 8. 自定义异常class my…syntaxerror 语法错误 python代码非法，代码不能编译(个人认为这是语法错误，写错了） typeerror 类型错误传入对象类型与要求的不符合 unboundlocalerror …

全栈程序员站长

2022/11/02

1K0

interrupt+抛出异常测试

interrupt return 线程异常

建议使用“抛异常”的方法来实现线程的停止，因为在catch块中可以对异常的信息进行相关的处理，而且使用异常流能更好、更方便的控制程序的运行流程，不至于代码中出现很多个return；污染代码。

用户7365393

2021/10/07

4980

在python中,如果异常并未被处理或捕捉_抛出异常是什么意思

https 网络安全 python 面向对象编程

Python使用异常类来管理异常信息。当发生异常的时候，程序会抛出一个异常信息，自动根据代码的层次查找异常处理信息。当代码发生异常而没有指定处理异常的方法是，Traceback会打印发生异常时代码执行栈的情况。

全栈程序员站长

2022/11/02

1.6K0

Java 如何抛出异常、自定义异常

1、定义：一个方法不处理这个异常，而是调用层次向上传递，谁调用这个方法，这个异常就由谁来处理。

Java编程指南

2019/08/02

4.8K0

Java 如何抛出异常、自定义异常

相似问题

按值或引用抛出异常

23

抛出异常或返回值

45

抛出异常或返回值

11

抛出异常，然后传播或返回布尔值，然后抛出异常？

11

为"Find“方法抛出异常或返回选项更好吗？

20

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例