首页
学习
活动
专区
工具
TVP
发布

决胜机器学习

专栏作者
219
文章
278629
阅读量
105
订阅数
循环神经网络(四) ——words2vec、负采样、golve
循环神经网络(四) ——words2vec、负采样、golve (原创内容,转载请注明来源,谢谢) 一、概述 本文主要学习几种现有的流行的词嵌入算法,包括words2vec、负采样、golve,另外学
用户1327360
2018-06-07
1.2K0
循环神经网络(五) ——Bean搜索、bleu评分与注意力模型
循环神经网络(五) ——Bean搜索、bleu评分与注意力模型 (原创内容,转载请注明来源,谢谢) 一、概述 本文主要讲解机器翻译过程中涉及的算法,主要包括bean搜索算法及其改进与误差分析、bleu
用户1327360
2018-06-07
7980
卷积神经网络(四) ——目标检测与YOLO算法
卷积神经网络(四) ——目标检测与YOLO算法 (原创内容,转载请注明来源,谢谢) 一、概述 目标检测,主要目的是在图片中,分类确认是否有需要的物体,如果有则标出对应的物体。 二、目标定位 目标定位(
用户1327360
2018-03-29
5.4K0
深层神经网络参数调优(四) ——adam算法、α衰减与局部最优
深层神经网络参数调优(四)——adam算法、α衰减与局部最优 (原创内容,转载请注明来源,谢谢) 一、概述 本文主要讲解另外一种思想的梯度下降——adam,并且在此之前介绍动量梯度下降和RMSprop算法作为前置内容。 另外,本文讲到学习速率衰减方式,以及局部最优和鞍点问题等。 二、动量梯度下降法 1、当前问题 mini-batch、随机梯度下降等,在优化每个w和b时,是会优化一个部分最优值,故容易出现抖动,导致优化速度慢。因此可以结合接下来的算法,来加快学习速度。 2、主要思想 将一
用户1327360
2018-03-07
2.7K0
神经网络和深度学习(五) ——深层神经网络基础
神经网络和深度学习(五)——深层神经网络基础 (原创内容,转载请注明来源,谢谢) 一、概述 本文是对深层神经网络的基础,主要讨论深层神经网络的算法、公式推导以及一些注意事项。 首先,符号表示上和之
用户1327360
2018-03-07
1.4K0
《编程之美》读书笔记(一)——中国象棋将帅有效位置
《编程之美》读书笔记(一) ——中国象棋将帅有效位置 (原创内容,转载请注明来源,谢谢) 一、问题 如上述棋盘,假设将为点A,帅为点B。将只能在d10、d8、f10、f8点内部的正方形移动(共9
用户1327360
2018-03-07
1K0
机器学习(二十五) ——adaboost算法与实现
机器学习(二十五)——adaboost算法与实现 (原创内容,转载请注明来源,谢谢) 一、概述 当进行监督学习时,除了使用某个分类器外,还可以将各个分类器结合起来使用,或者多次使用某个分类器,也可以是数据集分给不同的分类器后进行集成。本文主要介绍基于同一种分类器多个不同实例的方法,基础算法基于单层决策树。 二、bagging 首先,先介绍bagging算法,这个算法是一种自举汇聚法,方法如下: 1)获取数据源 假设样本容量为m,则进行m次放回抽样(即每次抽到样本后再将样本放回),获
用户1327360
2018-03-07
1.1K0
机器学习(二十二) ——推荐系统基础理论
机器学习(二十二)——推荐系统基础理论 (原创内容,转载请注明来源,谢谢) 一、概述 推荐系统(recommendersystem),作为机器学习的应用之一,在各大app中都有应用。这里以用户评价电影、电影推荐为例,讲述推荐系统。 最简单的理解方式,即假设有两类电影,一类是爱情片,一类是动作片,爱情片3部,动作片2部,共有四个用户参与打分,分值在0~5分。 但是用户并没有对所有的电影打分,如下图所示,问号表示用户未打分的电影。另外,为了方便讲述,本文用nu代表用户数量,nm代表电影数量,r(i,j)=
用户1327360
2018-03-07
1.2K0
机器学习(二十一) ——高斯密度估计实现异常检测
机器学习(二十一)——高斯密度估计实现异常检测 (原创内容,转载请注明来源,谢谢) 一、概述 异常检测(anomalydetection),主要用于检查对于某些场景下,是否存在异常内容、异常操作、异常状态等。异常检测,用到了一个密度估计算法(density estimation)——高斯分布(Gaussian distribution),又称正态分布(normal distribution)。 该算法只用到了样本的特征值,不需要分类标签,故该算法是无监督学习算法 主要内容是,对于样本集,当有一个新的数
用户1327360
2018-03-07
3.9K0
机器学习(二十) ——PCA实现样本特征降维
机器学习(二十)——PCA实现样本特征降维 (原创内容,转载请注明来源,谢谢) 一、概述 所谓降维(dimensionalityreduction),即降低样本的特征的数量,例如样本有10个特征值,要降维成5个特征值,即通过一些方法,把样本的10个特征值映射换算成5个特征值。 因此,降维是对输入的样本数据进行处理的,并没有对预测、分类的结果进行处理。 降维的最常用的方法叫做主成分分析(PCA,principal component analysis)。最常用的业务场景是数据压缩、数据可视化。该方法只
用户1327360
2018-03-07
2.4K0
机器学习(十九) ——K-均值算法理论
机器学习(十九)——K-均值算法理论 (原创内容,转载请注明来源,谢谢) 一、概述 K均值(K-Means)算法,是一种无监督学习(Unsupervisedlearning)算法,其核心是聚类(Clustering),即把一组输入,通过K均值算法进行分类,输出分类结果。 由于K均值算法是无监督学习算法,故这里输入的样本和之前不同了,输入的样本只有样本本身,没有对应的样本分类结果,即这里的输入的仅仅是{x(1),x(2),…x(m)},每个x没有对应的分类结果y(i),需要我们用算法去得
用户1327360
2018-03-07
9480
机器学习(四) ——梯度下降算法解释以及求解θ
机器学习(四)——梯度下降算法解释以及求解θ (原创内容,转载请注明来源,谢谢) (本文接 机器学习(二) 的内容) 一、解释梯度算法 梯度算法公式以及简化的代价函数图,如上图所示。
用户1327360
2018-03-07
1K0
机器学习(三) ——k-近邻算法基础
机器学习(三)——k-近邻算法基础 (原创内容,转载请注明来源,谢谢) 一、概述 k近邻算法(kNN),是监督学习的一种,主要用于分类,通过测量不同特征值之间的举例进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 使用数据范围:数值型和标称型。 二、工作原理 1、原理 存在一个训练样本集,其中每个数据都存在标签,即可以知道数据的每个特征和其对于的分类结果。 现输入没有标签的数据,将新数据的每个特征值和样本集的数据对应特征进行比较,计
用户1327360
2018-03-07
6530
机器学习(二) ——线性回归、代价函数与梯度下降基础
机器学习(二) ——线性回归、代价函数与梯度下降基础 (原创内容,转载请注明来源,谢谢) 一、线性回归 线性回归是监督学习中的重要算法,其主要目的在于用一个函数表示一组数据,其中横轴是变量(假定一
用户1327360
2018-03-07
1.1K0
《Redis设计与实现》读书笔记(三十五) ——Redis 二进制位数组及SWAR汉明重量算法
《Redis设计与实现》读书笔记(三十五) ——Redis 二进制位数组及SWAR汉明重量算法 (原创内容,转载请注明来源,谢谢) 一、基本概念 redis提供了setbit、getbit、bitcount、bitop四个命令用于处理二进制数组,称为bit array,又叫位数组。 setbit命令用于位数组指定偏移量上的二进制设置值,偏移量从0开始计算,值可以是0或者是1。 getbit获取指定位置上的值。 bitcount统计位数组里面,值为1的二进制位的数量。 bitop可以有and、or、xor,即
用户1327360
2018-03-07
1.3K0
有趣的算法(十一) ——分治法:大数相乘
有趣的算法(十一)——分治法:大数相乘 (原创内容,转载请注明来源,谢谢) 太大的两个数字相乘,有可能会超出计算机的位数,需要人工进行转化。 1、原始解法 最原始的解法,是乘法的逐个位对应的相乘后相加,这里需要的时间复杂度是O(n2)。 2、尝试优化 用分治法的思想进行优化,即将一个大的数字拆成两半的长度(不是数值的1/2,是字面上的折成两半),再进行计算。例如: 假设两个n位的二进制数A和B相乘,可以先将A分解成A1*2n/2+A2(A1为前面一半的位,A2为后一半的位,这里乘以2n/2是一个二进制的
用户1327360
2018-03-07
1.4K0
有趣的算法(十一) ——分治法:快速​求最值
有趣的算法(十一)——分治法:快速求最值 (原创内容,转载请注明来源,谢谢) 一、需求 一个数组,里面有若干的数字,现需要得到这一组数字的最大值和最小值。 二、简单分析 最基本的做法,是两两比对,可以区分出临时的最大值和最小值,再拿临时的最大值和最小值往后比较,有新的最值则更新。总的需要的比较次数是2n-2。 三、优化 使用分治法快速求最值。即把数组分到最小的1-2个数,两两比较后,仅将最大值和最小值回传,再两两比较最值,回传新的最值,最终得出最大值和最小值。 分析需要比较的次数。当数组只有1个数时,
用户1327360
2018-03-07
1.5K0
有趣的算法(十) ——归并排序思想解决大量用户数据清洗
有趣的算法(十)——归并排序思想解决用户数据清洗 (原创内容,转载请注明来源,谢谢) 一、问题阐述 近期工作中接触到一个很有趣的算法,在此进行分享。 当前有一个千万条级别的用户数据,其中包含用户openid、用户是否有效状态。其中,这些用户是关注微信公众号的用户,openid是可以从微信拿到的接口中,确定的用户信息。 每个用户关注或者取消关注,系统可以从微信接口中获取信息,并且每个新关注的用户,系统会搜索现有库,如果用户openid已经在数据库中存在,则将其状态置为有效;如果用户不存在,则新增一条记录,
用户1327360
2018-03-07
8730
有趣的算法(九) ——蛇形数组
有趣的算法(九)——蛇形数组 (原创内容,转载请注明来源,谢谢) 一、问题阐述 给定一个数字,需要返回的内容如下图所示: 输入5,得到结果: 输入10,得到结果: 输入一个数字i,输出结果的矩阵是i行
用户1327360
2018-03-07
1.6K0
有趣的算法(八) ——红黑树插入算法
有趣的算法(八)——红黑树插入算法 (原创内容,转载请注明来源,谢谢) 一、概述 红黑树是一种二叉平衡查找树。二叉查找树是二叉树,且树的根节点会比左节点大、比右节点小。 1)二叉查找树 二叉查找树对于数字比较大小,具有重要意义。由于其左子节点都比根节点小,右子节点都比根节点大,要查找一个数是否在其中,或者在某个位置,会变得很容易。 从根节点出发,如果待查数据比根节点小,则往根节点的左子树去查找;反之从右子树查找;如果值和某个节点一样,表示找到;如果到某个节点,其没有子节点,而还没有匹配,则表示数据不存在
用户1327360
2018-03-07
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档