口仆

LV1
发表了文章

《数据密集型应用系统设计》读书笔记(二)

「数据模型」(Data models)是软件开发中最重要的部分之一,大部分应用程序都是通过数据模型的层层叠加来构建的,例如:

口仆
发表了文章

基于潜在结果框架的因果推断入门(下)

上一节详细介绍了在三类基本假设下的各种因果推断方法,然而在实践中,对于某些特定场景下的应用,例如包含依赖性网络信息、特殊数据类型(如时间序列)或特殊条件(例如存...

口仆
发表了文章

基于潜在结果框架的因果推断入门(上)

本文是一篇综述文章 「A Survey on Causal Inference」 的阅读笔记(大部分内容参照原文进行了较为通俗易懂的翻译,小部分内容加入了自己的...

口仆
发表了文章

The Missing Semester 01: Shell

如今的计算机有着多种多样的交互接口来进行指令的输入,例如图形界面、语音输入等。这些接口虽然使用方便,但其从根本上限制了我们的操作方式——我们不能够点击一个不存在...

口仆
发表了文章

Python HOWTOs 系列:换行指南

在计算机还没被发明之前,人们通过「电传打字机」(Teletype Model 33)来打印文字,每秒可以打印 10 个字符。然而,该机器存在一个问题:在打完一行...

口仆
发表了文章

因果推断框架 DoWhy 入门

「因果推断」(causal inference)是基于观察数据进行反事实估计,分析干预与结果之间的因果关系的一门科学。虽然在因果推断领域已经有许多的框架与方法,...

口仆
发表了文章

《数据密集型应用系统设计》读书笔记(一)

目前许多的新型应用都属于「数据密集型」(data-intensive),而不是计算密集型(compute-intensive),对于这些应用,CPU 的处理能力...

口仆
发表了文章

LaTeX 入门系列之一:基础知识

本系列旨在详细介绍 LaTeX 的使用,主要内容参考自著名的 「The Not So Short A Introduction to LaTeX」(Versio...

口仆
发表了文章

Pandas 实践手册(一)

本系列参考自「Python Data Science Handbook」第三章,旨在对 Pandas 库的使用方法进行归纳与总结。

口仆
发表了文章

策略梯度入门(上)

强化学习是机器学习中的一个子领域,其目标是为「代理」(agent)找到一个最优的行为策略以获得最大的奖励。「策略梯度」(policy gradient)是一类解...

口仆
发表了文章

知识图谱入门(三)

作为人类,我们可以基于图 1 推断出一些新的信息,例如 EID15 的举办地点是 Santiago、有航班相连的城市必定存在机场等。在这些情况下,给定图中的数据...

口仆
发表了文章

常见编程模式之就地反转链表

在很多问题中,我们需要对一个链表中的节点连接进行反转,且通常需要原地进行,即不能使用额外的存储空间。这时我们可以使用就地反转链表模式,该模式本质上是一种迭代解法...

口仆
发表了文章

常见编程模式之循环排序

循环排序模式描述了一种解决包含给定范围数字的数组问题的有趣方法。具体来说,我们遍历数组的每一位数字,如果当前数字不在正确的索引上,则将其与正确的索引交换,如下图...

口仆
发表了文章

知识图谱入门(二)

本节我们将介绍数据图的各种增强与扩展,包括「模式」(schema)、「身份」(identity)和「上下文」(context),它们为知识的聚合提供了额外的结构...

口仆
发表了文章

常见编程模式之合并区间

合并区间模式是一种处理重叠区间的有效手段。在很多包含区间的问题中,我们可能需要去找出重叠的部分或将重叠部分合并。给定两个区间,其关联方式有如下六种:

口仆
发表了文章

OpenAI Gym 入门

这一部分参考官网提供的文档[1],对 Gym 的运作方式进行简单的介绍。Gym 是一个用于开发和比较强化学习算法的工具包,其对「代理」(agent)的结构不作要...

口仆
发表了文章

常见编程模式之快慢指针

快慢指针方法,又称为龟兔赛跑算法,其基本思想就是使用两个移动速度不同的指针在数组或链表等序列结构上移动。这种方法对于处理「环形」链表或数组非常有用。以链表为例,...

口仆
发表了文章

Playing Atari with Deep Reinforcement Learning

本文是对 DQN 原始论文 Playing Atari with Deep Reinforcement Learning 的详细解读。

口仆
发表了文章

《百面机器学习》读书笔记之:特征工程 & 模型评估

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。这样做的目的是消除数据特征之间的量纲影响,使得不同的指标之间具有可比性,帮助在进行迭代...

口仆
发表了文章

BERT 原理解析

本文是对 BERT 原始论文(BERT: Pre-training of Deep Bidirectional Transformers for Languag...

口仆

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券