口仆

LV1
发表了文章

策略梯度入门(上)

强化学习是机器学习中的一个子领域,其目标是为「代理」(agent)找到一个最优的行为策略以获得最大的奖励。「策略梯度」(policy gradient)是一类解...

口仆
发表了文章

知识图谱入门(三)

作为人类,我们可以基于图 1 推断出一些新的信息,例如 EID15 的举办地点是 Santiago、有航班相连的城市必定存在机场等。在这些情况下,给定图中的数据...

口仆
发表了文章

常见编程模式之就地反转链表

在很多问题中,我们需要对一个链表中的节点连接进行反转,且通常需要原地进行,即不能使用额外的存储空间。这时我们可以使用就地反转链表模式,该模式本质上是一种迭代解法...

口仆
发表了文章

常见编程模式之循环排序

循环排序模式描述了一种解决包含给定范围数字的数组问题的有趣方法。具体来说,我们遍历数组的每一位数字,如果当前数字不在正确的索引上,则将其与正确的索引交换,如下图...

口仆
发表了文章

知识图谱入门(二)

本节我们将介绍数据图的各种增强与扩展,包括「模式」(schema)、「身份」(identity)和「上下文」(context),它们为知识的聚合提供了额外的结构...

口仆
发表了文章

常见编程模式之合并区间

合并区间模式是一种处理重叠区间的有效手段。在很多包含区间的问题中,我们可能需要去找出重叠的部分或将重叠部分合并。给定两个区间,其关联方式有如下六种:

口仆
发表了文章

OpenAI Gym 入门

这一部分参考官网提供的文档[1],对 Gym 的运作方式进行简单的介绍。Gym 是一个用于开发和比较强化学习算法的工具包,其对「代理」(agent)的结构不作要...

口仆
发表了文章

常见编程模式之快慢指针

快慢指针方法,又称为龟兔赛跑算法,其基本思想就是使用两个移动速度不同的指针在数组或链表等序列结构上移动。这种方法对于处理「环形」链表或数组非常有用。以链表为例,...

口仆
发表了文章

Playing Atari with Deep Reinforcement Learning

本文是对 DQN 原始论文 Playing Atari with Deep Reinforcement Learning 的详细解读。

口仆
发表了文章

《百面机器学习》读书笔记之:特征工程 & 模型评估

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。这样做的目的是消除数据特征之间的量纲影响,使得不同的指标之间具有可比性,帮助在进行迭代...

口仆
发表了文章

BERT 原理解析

本文是对 BERT 原始论文(BERT: Pre-training of Deep Bidirectional Transformers for Languag...

口仆
发表了文章

Transformer 原理解析

本文是对 Transformer 原始论文( Attention Is All You Need )的解读。

口仆
发表了文章

《PRML》读书笔记之一:多项式曲线拟合

模式识别简单来说就是使用计算机算法自动发现数据中隐藏的规律,并利用这些规律来处理数据,比如对数据进行分类。下面会以手写数字识别为例,介绍模式识别中的常见术语。

口仆
发表了文章

LeetCode 刷题记录 1-5

给定一个整数数组 nums 和一个目标值 target ,找出数组中和为目标值的两个数,并返回它们的数组下标。

口仆
发表了文章

PRML 读书笔记之二:概率论(上)

模式识别领域中的一个重要概念就是不确定性(uncertainty),其产生于测量的噪声,以及数据集的有限大小。概率论(probability theory)提供...

口仆
发表了文章

文本分析的参数估计

口仆
发表了文章

Deeplearning.ai 课程笔记第一部分:神经网络与深度学习

神经网络就是由若干神经元组合而成的网络结构,其包含输入层、隐藏层和输出层。而含有多层隐藏层的神经网络即为深度神经网络。下图给出了一个深度神经网络的示意图。

口仆
发表了文章

CS229 课程笔记之一:线性回归

线性回归是一种监督学习算法,即给定一个训练集,去学习一个假设函数,用来尽量精确地预测每个样本对应的输出。从输出变量的离散程度来看,监督学习算法可以分为两类。线性...

口仆
发表了文章

CS229 课程笔记之三:广义线性模型

实际上这些模型都是一个更为广泛的模型族的特例,这个模型族被称为广义线性模型(Generalized Linear Models)。

口仆
发表了文章

CS229 课程笔记之二:分类与逻辑回归

之前我们讨论的是回归问题,即输出是连续值,现在我们来讨论输出是离散值的分类问题。本节我们将专注于二元分类问题,即输出 只能取 和 两个值。

口仆

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券