首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习入门案例:鸢尾花数据集分类 绘制PR曲线

案例使用鸢尾花数据集进行分类预测,并绘制评价分类性能的PR曲线图

认识分类任务和数据集

Iris(鸢尾花)数据集

案例演示中使用的是有监督的机器学习算法:SVM 支持向量机

建立模型的流程如下:

训练接和测试集的拆分:

使用留出法(Hold-Out Method)

按照一定的比例将数据分为训练集和测试集

分类问题:

分类性能评价和PR图

分类性能度量—准确率

分类性能度量—精确率和召回率

精确率是分类预测结果中的正例的比例,召回率是指被分类器真正判定为正例的比率。

分类性能度量—P‐R曲线

如何绘制PR曲线?

简单的来说,要形成PR曲线,我们需要不断的设定阈值,比如说当预测分数大于0.6(阈值)时,我们认为是 P 正例;不断的调整阈值,得到不同的precision 和 recall,可以绘制出PR曲线。

分类性能度量—ROC‐AUC计算

代码实现

获取代码:回复公众号 ”鸢尾花“

结果如下:

写在最后

本案例是对鸢尾花数据集进行分类预测的监督学习模型,包含了机器学习建模过程所用到的概念,可以作为学习机器学习的入门案例来使用。

好文章,我 在看

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200802A01SLA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券