「因果推断」(causal inference)是基于观察数据进行反事实估计,分析干预与结果之间的因果关系的一门科学。虽然在因果推断领域已经有许多的框架与方法,...
目前许多的新型应用都属于「数据密集型」(data-intensive),而不是计算密集型(compute-intensive),对于这些应用,CPU 的处理能力...
本系列旨在详细介绍 LaTeX 的使用,主要内容参考自著名的 「The Not So Short A Introduction to LaTeX」(Versio...
本系列参考自「Python Data Science Handbook」第三章,旨在对 Pandas 库的使用方法进行归纳与总结。
强化学习是机器学习中的一个子领域,其目标是为「代理」(agent)找到一个最优的行为策略以获得最大的奖励。「策略梯度」(policy gradient)是一类解...
作为人类,我们可以基于图 1 推断出一些新的信息,例如 EID15 的举办地点是 Santiago、有航班相连的城市必定存在机场等。在这些情况下,给定图中的数据...
在很多问题中,我们需要对一个链表中的节点连接进行反转,且通常需要原地进行,即不能使用额外的存储空间。这时我们可以使用就地反转链表模式,该模式本质上是一种迭代解法...
循环排序模式描述了一种解决包含给定范围数字的数组问题的有趣方法。具体来说,我们遍历数组的每一位数字,如果当前数字不在正确的索引上,则将其与正确的索引交换,如下图...
本节我们将介绍数据图的各种增强与扩展,包括「模式」(schema)、「身份」(identity)和「上下文」(context),它们为知识的聚合提供了额外的结构...
合并区间模式是一种处理重叠区间的有效手段。在很多包含区间的问题中,我们可能需要去找出重叠的部分或将重叠部分合并。给定两个区间,其关联方式有如下六种:
这一部分参考官网提供的文档[1],对 Gym 的运作方式进行简单的介绍。Gym 是一个用于开发和比较强化学习算法的工具包,其对「代理」(agent)的结构不作要...
快慢指针方法,又称为龟兔赛跑算法,其基本思想就是使用两个移动速度不同的指针在数组或链表等序列结构上移动。这种方法对于处理「环形」链表或数组非常有用。以链表为例,...
本文是对 DQN 原始论文 Playing Atari with Deep Reinforcement Learning 的详细解读。
对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。这样做的目的是消除数据特征之间的量纲影响,使得不同的指标之间具有可比性,帮助在进行迭代...
本文是对 BERT 原始论文(BERT: Pre-training of Deep Bidirectional Transformers for Languag...
本文是对 Transformer 原始论文( Attention Is All You Need )的解读。
模式识别简单来说就是使用计算机算法自动发现数据中隐藏的规律,并利用这些规律来处理数据,比如对数据进行分类。下面会以手写数字识别为例,介绍模式识别中的常见术语。
给定一个整数数组 nums 和一个目标值 target ,找出数组中和为目标值的两个数,并返回它们的数组下标。
模式识别领域中的一个重要概念就是不确定性(uncertainty),其产生于测量的噪声,以及数据集的有限大小。概率论(probability theory)提供...
扫码关注云+社区
领取腾讯云代金券