首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何用F1代替精度来训练非二进制分类部件?

如何用F1代替精度来训练非二进制分类部件?
EN

Stack Overflow用户
提问于 2016-01-13 16:24:56
回答 1查看 1.2K关注 0票数 1

我使用插入符号来进行非二进制(三个类)决策树分类。我的数据集是倾斜的,所以我想使用F1而不是准确性来进行培训和测试。我该怎么设置这个?

对于MWE,我们可以预测钻石数据集中的切割:

代码语言:javascript
运行
复制
library(ggplot2)
library(caret)
inTrain <- createDataPartition(diamonds$cut, p=0.75, list=FALSE)
training <- diamonds[inTrain,]
testing <- diamonds[-inTrain,]
fitModel <- train(cut ~ ., training, method = "rpart")

如何在这里使用F1?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-13 17:00:34

http://topepo.github.io/caret/training.html的页面详细介绍了如何为列车功能创建一个新的度量-

你需要创建一个有三个参数的新函数-

  • data -“是数据框架或矩阵的引用,列名为obs和pred,用于观察和预测的结果值(用于回归的数字数据或用于分类的字符值)。”
  • “lev -”是一个字符串,其结果因子级别从训练数据中提取出来。对于回归,一个NULL值被传递到函数中。
  • name -“是使用的模型的字符串”

该函数应该计算数据对象中观察到的标签和预测标签的F评分,并根据度量命名结果-

例如,函数的计算精度。

代码语言:javascript
运行
复制
summaryStats <- function (data, lev = NULL, model = NULL) {
  cor <- sum(data$pred==data$obs)
  incor  <- sum(data$pred!=data$obs)
  out <- cor/(cor + incor)
  names(out) <- c("acc")
  out
} 

然后创建一个新的trainControl对象并训练您的模型--

代码语言:javascript
运行
复制
fitControl <- trainControl(summaryFunction = summaryStats)
fitModel <- train(cut ~ ., training, trControl = fitControl, metric = "acc", maximize=TRUE) 
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34771852

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档