腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器学习算法原理与实践
专栏成员
举报
129
文章
155442
阅读量
76
订阅数
订阅专栏
申请加入专栏
全部文章(129)
其他(73)
编程算法(41)
机器学习(18)
神经网络(9)
强化学习(9)
决策树(6)
scikit-learn(5)
java(4)
python(4)
监督学习(4)
api(3)
深度学习(3)
人工智能(3)
spark(3)
数据分析(3)
partial(3)
NLP 服务(2)
tensorflow(2)
存储(2)
分布式(2)
图像识别(2)
卷积神经网络(2)
大数据(2)
数据处理(2)
sum(2)
布局(2)
数据挖掘(1)
数据库(1)
游戏(1)
开源(1)
爬虫(1)
numpy(1)
面向对象编程(1)
推荐系统(1)
数据结构(1)
nat(1)
com(1)
layout(1)
搜索文章
搜索
搜索
关闭
机器学习中的矩阵向量求导(五) 矩阵对矩阵的求导
机器学习
神经网络
深度学习
人工智能
在矩阵向量求导前4篇文章中,我们主要讨论了标量对向量矩阵的求导,以及向量对向量的求导。本文我们就讨论下之前没有涉及到的矩阵对矩阵的求导,还有矩阵对向量,向量对矩阵求导这几种形式的求导方法。
刘建平Pinard
2019-05-31
2.6K
0
强化学习(十九) AlphaGo Zero强化学习原理
神经网络
强化学习
在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。
刘建平Pinard
2019-04-01
1.3K
0
强化学习(十五) A3C
编程算法
强化学习
神经网络
在强化学习(十四) Actor-Critic中,我们讨论了Actor-Critic的算法流程,但是由于普通的Actor-Critic算法难以收敛,需要一些其他的优化。而Asynchronous Advantage Actor-critic(以下简称A3C)就是其中比较好的优化算法。本文我们讨论A3C的算法原理和算法流程。
刘建平Pinard
2019-03-05
1.2K
0
强化学习(十六) 深度确定性策略梯度(DDPG)
神经网络
编程算法
在强化学习(十五) A3C中,我们讨论了使用多线程的方法来解决Actor-Critic难收敛的问题,今天我们不使用多线程,而是使用和DDQN类似的方法:即经验回放和双网络的方法来改进Actor-Critic难收敛的问题,这个算法就是是深度确定性策略梯度(Deep Deterministic Policy Gradient,以下简称DDPG)。
刘建平Pinard
2019-03-05
5K
0
强化学习(十四) Actor-Critic
编程算法
强化学习
神经网络
在强化学习(十三) 策略梯度(Policy Gradient)中,我们讲到了基于策略(Policy Based)的强化学习方法的基本思路,并讨论了蒙特卡罗策略梯度reinforce算法。但是由于该算法需要完整的状态序列,同时单独对策略函数进行迭代更新,不太容易收敛。
刘建平Pinard
2019-02-22
857
0
线性判别分析LDA原理总结
神经网络
机器学习
在主成分分析(PCA)原理总结中,我们对降维算法PCA做了总结。这里我们就对另外一种经典的降维方法线性判别分析(Linear Discriminant Analysis, 以下简称LDA)做一个总结。LDA在模式识别领域(比如人脸识别,舰艇识别等图形图像识别领域)中有非常广泛的应用,因此我们有必要了解下它的算法原理。
刘建平Pinard
2018-08-14
900
0
深度神经网络(DNN)模型与前向传播算法
神经网络
编程算法
深度学习
机器学习
深度神经网络(Deep Neural Networks, 以下简称DNN)是深度学习的基础,而要理解DNN,首先我们要理解DNN模型,下面我们就对DNN的模型与前向传播算法做一个总结。
刘建平Pinard
2018-08-14
787
0
文本挖掘预处理之向量化与Hash Trick
神经网络
机器学习
在文本挖掘的分词原理中,我们讲到了文本挖掘的预处理的关键一步:“分词”,而在做了分词后,如果我们是做文本分类聚类,则后面关键的特征预处理步骤有向量化或向量化的特例Hash Trick,本文我们就对向量化和特例Hash Trick预处理方法做一个总结。
刘建平Pinard
2018-08-14
763
0
循环神经网络(RNN)模型与前向反向传播算法
神经网络
编程算法
NLP 服务
在前面我们讲到了DNN,以及DNN的特例CNN的模型和前向反向传播算法,这些算法都是前向反馈的,模型的输出和模型本身没有关联关系。今天我们就讨论另一类输出和模型间有反馈的神经网络:循环神经网络(Recurrent Neural Networks ,以下简称RNN),它广泛的用于自然语言处理中的语音识别,手写书别以及机器翻译等领域。
刘建平Pinard
2018-08-14
587
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档