开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >不平衡类classification_report支持值的表示

问不平衡类classification_report支持值的表示
EN

Stack Overflow用户

提问于 2020-11-30 03:47:05

回答 1查看 602关注 0票数 0

我有一个不平衡的数据集，我正在尝试进行二进制分类。最后，我使用了几种算法，CatBoostClassifier和lightgbm给了我比较好的结果。关于classification_report和confusion_matrix，我有一个问题要问。

从我的classification_report：-True Negatives：1076，-False Positives：0，-False Negatives：1，-True Positives：6可以看出。

Sensitivity：0.86和Specificity 1.00，这意味着我的false positive rate为0.0。

我认为它确实表现得很好。

从classification_report中，它是否告诉你，我的模型可能已经安装过了，或者它确实表现得很好？

我之所以这样问，是因为1类的1(数量较少)是7，而0类是1076。

link说：“支持的是该类中真正响应的样本数。”但我不太明白重点。

有人能向我解释，或者让我知道我的算法是否太适合或者表现得很好吗？

标签比率：

0    5550
1      60

分类报告

              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00      1076
         1.0       1.00      0.86      0.92         7

    accuracy                           1.00      1083
   macro avg       1.00      0.93      0.96      1083
weighted avg       1.00      1.00      1.00      1083

混淆矩阵：

[[1076    0]
 [   1    6]]

confusion-matrix

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-30 04:30:47

如果你同时看一看训练集和测试集的分类报告，你就能更好地理解事情，你不能说任何事情，只看训练集的性能，或者单独看火车组。但是，如果我们假设您在这里展示的性能度量是针对测试集的，并且火车组的性能与您在测试集中观察到的性能大致相同，那么我想说，这个模型做得很好。对于类1的回忆是86%，因为它只形成了数据集的1%这一事实非常好。

此外，支持是指数据集中属于特定类的示例总数，例如，在您的示例中，对类0的支持是5550，对类1的支持是60。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/65072978

复制

相关文章

盘点一个Python网络爬虫问题

python href 函数网络爬虫源码

前几天在Python钻石交流群【空】问了一个Python网络爬虫处理的问题，一起来看看吧。他的代码如下：

前端皮皮

2023/10/17

1720

盘点一个Python网络爬虫问题

如何编写一个简易网络爬虫

感谢小臣投稿本文将简述网络爬虫及其工作流程，结合个人实践，简单介绍如何使用HttpClient、HtmlParser第三方jar工具包，编写一个简易的网络爬虫。网络爬虫简述及流程架构网络爬虫，又叫网页蜘蛛，是一种按照一定的规则逻辑，自动地抓取网络信息的程序或者脚本。在当今网络时代，信息量爆炸性增长，不同领域、不同背景的用户对信息的获取有不同的需求。人们无法在这么海量信息中及时有效地获取到极具针对性的信息。搜索引擎一定程度上也无法根据语义查询，满足用户定制化需求。诸如此

java达人

2018/01/31

1.4K0

盘点一个Python网络爬虫问题

python 编程测试数据网络爬虫

前几天在Python最强王者群【刘桓鸣】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

Python进阶者

2023/08/31

2160

盘点一个Python网络爬虫问题

php 网站爬虫搜索引擎数据库

最近在写一个程序，去爬热门事件和热门关键词网站上的数据。在这里介绍一下网络爬虫的种种。

四火

2022/07/15

6590

盘点一个Python网络爬虫的问题

python 网站表格数据网络爬虫

前几天在Python白银群【大侠】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

前端皮皮

2023/08/17

1820

盘点一个Python网络爬虫的问题

分享一个playwright网络爬虫实战教程

php python json 爬虫

前几天在Python交流白银群【空翼】问了一道Python网络爬虫的问题，如下图所示。

前端皮皮

2022/08/17

1.9K0

分享一个playwright网络爬虫实战教程

python 网络爬虫入门（一）———第一个python爬虫实例

python html 文件存储爬虫

最近两天学习了一下python，并自己写了一个网络爬虫的例子。 python版本: 3.5 IDE : pycharm 5.0.4 要用到的包可以用pycharm下载： File->Default Settings->Default Project->Project Interpreter 选择python版本并点右边的加号安装想要的包

全栈程序员站长

2022/08/31

2.4K0

python 网络爬虫入门（一）———第一个python爬虫实例

盘点一个Python网络爬虫实战问题

前几天在Python铂金交流群【红色基因代代传】问了一个Python网络爬虫的问题，提问截图如下：

Python进阶者

2022/11/14

1730

盘点一个Python网络爬虫实战问题

精通 Python 网络爬虫：网络爬虫学习路线

本文主要介绍了如何精通Python网络爬虫，从选择编程语言、掌握基础语法、常用爬虫库、数据提取与去重、反爬处理、分布式爬虫、项目实战等方面进行了详细的阐述。同时，文章还推荐了几本与Python网络爬虫相关的书籍，以帮助读者更好地学习和掌握相关知识。

韦玮

2017/08/08

3.5K0

精通 Python 网络爬虫：网络爬虫学习路线

盘点一个网络爬虫中常见的一个错误

python php 爬虫

前几天在Python白银交流群有个叫【雨就是雨】的粉丝问了一个Python网络爬虫的问题，这里拿出来给大家分享下，一起学习下。

Python进阶者

2022/06/05

2200

盘点一个网络爬虫中常见的一个错误

网络爬虫原理

爬虫安全 php http https

网络爬虫指按照一定的规则（模拟人工登录网页的方式），自动抓取网络上的程序。简单的说，就是讲你上网所看到页面上的内容获取下来，并进行存储。网络爬虫的爬行策略分为深度优先和广度优先。如下图是深度优先的一种遍历方式是A到B到D 到E 到C到 F（ABDECF）而宽度优先的遍历方式ABCDEF 。

全栈程序员站长

2022/07/22

7890

网络爬虫（一）

爬虫编程算法 http html

爬虫是按照一定规则，自动地提取并保存网页中信息的程序。通过向网站发起请求获取资源，提取其中有用的信息。爬虫在获取信息、整理数据等方面应用广泛。

陆勤_数据人网

2020/11/26

6400

Python——网络爬虫

爬虫 python scrapy

此篇文章继续跟着小甲鱼的视频来初学网络爬虫，除了小甲鱼的网站上可下载视频，发现b站上也有全套的视频哦，会比下载来的更方便些。网络爬虫，又称为网页蜘蛛（WebSpider），非常形象的一个名字。如果你

闪电gogogo

2018/01/08

1.5K0

数据采集技术python网络爬虫_精通Python网络爬虫

apache php javascript tcp/ip

网络爬虫（Crawler）又称网络蜘蛛，或者网络机器人（Robots）. 它是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。换句话来说，它可以根据网页的链接地址自动获取网页内容。如果把互联网比做一个大蜘蛛网，它里面有许许多多的网页，网络蜘蛛可以获取所有网页的内容。爬虫是一个模拟人类请求网站行为, 并批量下载网站资源的一种程序或自动化脚本。

全栈程序员站长

2022/09/27

1.8K0

数据采集技术python网络爬虫_精通Python网络爬虫

点进来，这里告诉你：爬虫学习之一个简单的网络爬虫

爬虫数据分析

###概述这是一个网络爬虫学习的技术分享，主要通过一些实际的案例对爬虫的原理进行分析，达到对爬虫有个基本的认识，并且能够根据自己的需要爬到想要的数据。有了数据后可以做数据分析或者通过其他方式重新结构化展示。 ###什么是网络爬虫网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。via 百度百科网络爬虫网络蜘蛛（Web spider）也叫网络爬虫（We

小莹莹

2018/04/23

8580

点进来，这里告诉你：爬虫学习之一个简单的网络爬虫

Python网络爬虫实战项目大全，最后一个亮了

爬虫 python mongodb 云数据库 Redis®

wcspider [1]- 微信公众号爬虫。使用爬虫搜索所有微信公众号资料及其文章，通过搜狗搜索获取公众号的openid，创建公众号历史消息请求URL，解析出历史消息总量、历史消息总页数、单个历史消息

Python中文社区

2018/01/31

1.8K0

Python网络爬虫实战项目大全，最后一个亮了

创建一个分布式网络爬虫的故事

编者按：作者通过创建和扩展自己的分布式爬虫，介绍了一系列工具和架构, 包括分布式体系结构、扩展、爬虫礼仪、安全、调试工具、Python 中的多任务处理等。以下为译文：大概600万条记录，每个记录有15个左右的字段。这是我的数据分析项目要处理的数据集，但它的记录有一个很大的问题：许多字段缺失，很多字段要么格式不一致或者过时了。换句话说，我的数据集非常脏。但对于我这个业余数据科学家来说还是有点希望的-至少对于缺失和过时的字段来说。大多数记录包含至少一个到外部网站的超链接，在那里我可能找到我需要的信息。因此

CSDN技术头条

2018/02/06

1.2K0

盘点Python网络爬虫入门常见的一个问题

python 网络安全爬虫

前几天在Python铂金交流群【余丰恺】问了一个Python网络爬虫的问题，如下图所示。

前端皮皮

2022/08/17

3050

盘点Python网络爬虫入门常见的一个问题

学习了《python网络爬虫实战》第一个爬虫，爬取新浪新闻

python 爬虫 anaconda 人工智能

请安装anaconda,其中附带的spyder方便运行完查看变量 1.进入cmd控制台，输入 pip install BeautifulSoup4 pip install requests 2.编写代码，代码已经很清晰了，直接运行不会报错并有成功的结果

潇洒坤

2018/09/10

1K0

快速入门网络爬虫系列 Chapter01 | 初识网络爬虫

数据分析爬虫搜索引擎 api php

我们为什么要了解网络爬虫？因为当今从事科学研究等，需要大量的数据，但是这些数据公开的又非常的少，大量的数据都在大公司的手中。我们这些普通人本身并没有那么多数据，但是我们又需要大量的数据。那么，这时我们就需要用到网络爬虫了。

不温卜火

2020/10/28

8760

快速入门网络爬虫系列 Chapter01 | 初识网络爬虫

相似问题

用节点爬虫或简单爬虫进行NodeJS网络爬行

10

网络爬虫-如何删除div中的子节点？

10

简易网络爬虫

12

自动网络爬虫

40

识别网络爬虫

10

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例