腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ml

专栏作者

664

文章

633437

阅读量

64

订阅数

N-gram的简单的介绍

　　　　N-gram是机器学习中NLP处理中的一个较为重要的语言模型，常用来做句子相似度比较，模糊查询，以及句子合理性，句子矫正等. 再系统的介绍N-gram前，我们先了解一下这几种概率.

2018-08-13

1.1K0

关于TF(词频) 和TF-IDF(词频-逆向文件频率 )的理解

TF（词频）: 假定存在一份有N个词的文件A，其中‘明星‘这个词出现的次数为T。那么 TF = T/N; 所以表示为：某一个词在某一个文件中出现的频率. TF-IDF(词频-逆向文件频率)：表示的词频和逆向文件频率的乘积. 比如：假定存在一份有N个词的文件A，其中‘明星‘这个词出现的次数为T。那么 TF = T/N; 并且‘明星’这个词，在W份文件中出现，而总共有X份文件，那么 IDF = log(X/W) ; 而： TF-IDF = TF * IDF = T/N * log(X/W);

2018-04-11

1.5K0

使用感知机训练加法模型

深度学习机器学习

感知机此处不介绍，这里只是简单的做了一个使用感知机思路，训练一个y=a+b计算模型. 1 # -*-coding:utf-8-*- 2 '@author: xijun.gong' 3 import numpy as np 4 import random 5 import math 6 7 8 class Perceptron: 9 def __init__(self, learnRate, maxIter, bit_len): 10 """ 11

2018-03-27

7020

读RCNN论文笔记

深度学习机器学习

1. RCNN的模型（如下图）描述: RCNN相比传统的物体检测，还是引入传统的物体检测的基本流程，先找出候选目标物体，逐个的提取特征，不过rbg大神引入了当时炙手可热的CN

2018-03-27

9220

评估一个预测模型性能通常都有那些指标

编程算法 python 机器学习

对于不同类型的模型，会有不同的评估指标，那么我们从最直接的回归和分类这两个类型，对于结果连续的回归问题，一般使用的大致为:MSE(均方差),MAE（绝对平均差）,RMSE(根均方差)这三种评估方法，这三种方式公式此处补贴出来。对于离散的分类问题，我们一般看ROC曲线，以及AUC曲线，一般好的模型，ROC曲线，在一开始就直接上升到1,然后一直保持1，也就是使得AUC=1.0或者尽可能的让其接近这个值，这是我们奋斗的目标. 摘个实际的例子：--出自《预测分析核心算法》这本书. 1 #-*-coding:

2018-03-27

1.2K0

调参过程中的参数学习率，权重衰减，冲量(learning_rate , weight_decay , momentum)

深度学习机器学习

无论是深度学习还是机器学习，大多情况下训练中都会遇到这几个参数，今天依据我自己的理解具体的总结一下，可能会存在错误，还请指正. learning_rate , weight_decay , momen

2018-03-27

2.7K0

机器学习之决策树熵&信息增量求解算法实现

机器学习决策树编程算法

此文不对理论做相关阐述,仅涉及代码实现: 1.熵计算公式: P为正例,Q为反例 Entropy(S) = -PLog2(P) - QLog2(Q); 2.信息增

2018-03-27

1.2K0

机器学习之KNN算法思想及其实现

机器学习编程算法

从一个例子来直观感受KNN思想如下图 , 绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方形

2018-03-27

5940

机器学习之最小二乘法

1.背景: 1801年，意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后，由于谷神星运行至太阳背后，使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星，但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希·奥伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中，而法国科学家勒让德于1806年独立发现“最小二乘法

2018-03-27

7810

机器学习优化算法之爬山算法小结

机器学习编程算法

简言机器学习的项目,不可避免的需要补充一些优化算法,对于优化算法,爬山算法还是比较重要的.鉴于此,花了些时间仔细阅读了些爬山算法的paper.基于这些,做一些总结. 目录　　1. 爬山算法简单描述　 2. 爬山算法的主要算法 2.1 首选爬山算法 2.2 最陡爬山算法 2.3 随机重新开始爬山算法 2.4 模拟退火算法(也是爬山算法) 3. 实例求解正文爬山算法,是一种局部贪心的最优算法.

2018-03-27

2.9K0

神经网络模型之AlexNet的一些总结

神经网络机器学习深度学习

说明：这个属于个人的一些理解，有错误的地方，还希望给予教育哈～此处以caffe官方提供的AlexNet为例. 目录： 1.背景 2.框架介绍 3.步骤详细说明 5.参考文献背景： AlexNet是在2012年被发表的一个金典之作，并在当年取得了ImageNet最好成绩，也是在那年之后，更多的更深的神经网路被提出，比如优秀的vgg,GoogleLeNet. 其官方提供的数据模型，准确率达到57.1%,top 1-5 达到80.2%. 这项对于传统的机器学习分类算法而言，已经相当的出色。框架介绍: Al

2018-03-26

6780

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态