首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从A到Z,掌握机器学习基本词汇【A】 从A到Z,掌握机器学习基本词汇【A】

从A到Z,掌握机器学习基本词汇【A】 从A到Z,掌握机器学习基本词汇【A】

作者头像
尾尾部落
发布2018-09-04 13:49:05
3560
发布2018-09-04 13:49:05
举报
文章被收录于专栏:尾尾部落尾尾部落尾尾部落

Accuracy: 准确率 机器学习的常用评价指标。定义如下: Accuracy = (TruePositives + TrueNegatives) / 总样本数

经常和准确率一起出现的,还有精确率和召回率。 – 精确率(Precision) = TP / (TP + FP)。它表示:预测为正的样本中有多少是真正的正样本,它是针对我们预测结果而言的。Precision又称为查准率。 – 召回率(Recall) = TP / (TP + FN)。它表示:样本中的正例有多少被预测正确了, 它是针对我们原来的样本而言的。Recall又称为查全率。

Activation function: 激活函数 一种函数(例如 ReLU 或 Sigmoid),将前一层所有神经元激活值的加权和输入到一个非线性函数中,然后向下一层传递该函数的输出值(典型的非线性)。 如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。

常见的激活函数有:sigmoid、Tanh、ReLU、softmax等

Adagrad:一种优化算法 Adagrad是一种复杂的优化算法(梯度下降算法),它能够在迭代过程中不断地自我调整学习率,并让模型参数中每个元素都使用不同学习率。

AUC: 曲线下面积 AUC(Area Under Curve)也是一种常见的机器学习评价指标,和ROC(Receiver Operating Characteristic)曲线一起常被用来评价一个二值分类器(binary classifier)的优劣。相比准确率、召回率、F-score这样的评价指标,ROC曲线有这样一个很好的特性:当测试集中正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。 AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。AUC值越大,当前的分类算法越有可能将正样本排在负样本前面,即能够更好的分类。

如果你觉得还有其他核心基础词汇,欢迎评论补充。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档