首页
学习
活动
专区
工具
TVP
发布

绿巨人专栏

专栏成员
129
文章
165273
阅读量
44
订阅数
读书笔记: 范畴论
一个范畴是一个带标签的有向图,其节点为对象(object),带有标签的有向边为箭头(arrow or morphism)。
绿巨人
2018-12-17
1.4K0
Category Theory: 01 One Structured Family of Structures
\(G = \{ G, +, e \}\),一个数据集\(G\),一个二元操作符\(+\),和一个幺元\(e\)。
绿巨人
2018-12-17
6480
Linux 技巧
当运行tmux时,实际上会运行一个tmux service,保持session的运行。
绿巨人
2018-10-10
6210
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判 信息传递和廉价谈判(Information Transmission and Cheap Talk) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。 三个结论: 不存在完全诚实的均
绿巨人
2018-07-05
5680
TypeScript中的怪语法
TypeScript中的怪语法 如何处理undefined 和 null undefined的含义是:一个变量没有初始化。 null的含义是:一个变量的值是空。 undefined 和 null 的最佳实践 核心思想: 避免null pointer错误。 null is bad。 要避免这个问题,我们需要做到: 用undefined,不要用null。 根据Code guidelines from Microsoft。 Enable "strict" 或者 "strictNullChecks" 编译选项
绿巨人
2018-07-04
1.8K0
[Java] Design Pattern:Code Shape - manage your code shape
[Java] Design Pattern:Code Shape - manage your code shape Code Shape Design Pattern Here I will introduce a design pattern: Code Shape。 It's fine that you never heard that, I just created it. Usage In the enterprise application development, in most cases,
绿巨人
2018-05-18
9030
BookNote: Refactoring - Improving the Design of Existing Code
BookNote: Refactoring - Improving the Design of Existing Code From "Refactoring - Improving the Design of Existing Code" by Martin Flower. BookNote: Refactoring - Improving the Design of Existing Code Duplicated Code Long Method Large Class Long Paramet
绿巨人
2018-05-18
8970
读书笔记: 博弈论导论 - 总结
读书笔记: 博弈论导论 - 总结 总结 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记的总结。 博弈论 博弈论是关于智能理性决策者的协作和冲突的数学模型的研究。 博弈论的目的可以说是研究寻找博弈均衡的方法。 博弈论的直接目标不是找到一个玩家的最佳策略,而是找到所有玩家的最理性策略组合。 我们称最理性策略组合为均衡。 博弈论(也叫逆向博弈论)的另外一个作用是机制设计,根据期望的结果,设计一个博弈体系。 博弈论的分类 这本书中将博弈论的只是分
绿巨人
2018-05-18
2K0
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈 贝叶斯博弈(Bayesian Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 不完整信息的静态博弈(Incomplete information static games) 不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集、结果集和收益函数等信息。 对不完整信息博弈的处理方法来自于Harsanyi。
绿巨人
2018-05-18
1.7K0
机器学习中的基本数学知识
机器学习中的基本数学知识 注:本文的代码是使用Python 3写的。 机器学习中的基本数学知识 线性代数(linear algebra) 第一公式 矩阵的操作 换位(transpose) 矩阵乘法 矩阵的各种乘积 内积 外积 元素积(element-wise product/point-wise product/Hadamard product 加 低等数学 几何 范数(norm) 拉格朗日乘子法和KKT条件 微分(differential) 表示形式 法则 常见导数公式 统计学/概率论 信息论
绿巨人
2018-05-18
3.8K0
强化学习读书笔记 - 00 - 术语和数学符号
强化学习读书笔记 - 00 - 术语和数学符号 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 基本概念 image.png image.png image.png 策略 image.png 由上面的公式可以看出:\(\pi(s)\)可以由\(v_{\pi}(s)\)或者\(q_{\pi}(s,a)\)决定。 强化学习的目
绿巨人
2018-05-17
1.5K0
强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)
强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 数学符号看不懂的,先看看这里: 强化学习读书笔记 - 00 - 术语和数学符号 时序差分学习简话 时序差分学习结合了动态规划和蒙特卡洛方法,是强化学习的核心思想。 时序差分这个词不好理解。
绿巨人
2018-05-17
1.7K0
强化学习读书笔记 - 08 - 规划式方法和学习式方法
强化学习读书笔记 - 08 - 规划式方法和学习式方法 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 需要了解强化学习的数学符号,先看看这里: 强化学习读书笔记 - 00 - 术语和数学符号 什么是模型(model) 环境的模型,本体可以通过模型来预测行为的反应。 对于随机的环境,有两种不同的模型: distribution model - 分
绿巨人
2018-05-17
1.1K0
强化学习读书笔记 - 09 - on-policy预测的近似方法
强化学习读书笔记 - 09 - on-policy预测的近似方法 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记 - 00 - 术语和数学符号 强化学习读书笔记 - 01 - 强化学习的问题 强化学习读书笔记 - 02 - 多臂老O虎O机问题 强化学习读书笔记 - 03 - 有限马尔科夫决策过程 强化学习读书笔记 - 04 - 动态规划
绿巨人
2018-05-17
9790
强化学习读书笔记 - 12 - 资格痕迹(Eligibility Traces)
强化学习读书笔记 - 12 - 资格痕迹(Eligibility Traces) 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记
绿巨人
2018-05-17
1.5K0
可满足性模块理论(SMT)基础 - 01 - 自动机和斯皮尔伯格算术
可满足性模块理论(SMT)基础 - 01 - 自动机和斯皮尔伯格算术 前言 如果,我们只给出一个数学问题的(比如一道数独题)约束条件,是否有程序可以自动求出一个解? 可满足性模理论(SMT - Satisfiability Modulo Theories)已经可以实现这个需求。 因此,最近想搞明白z3的实现原理。源代码没有读两句,还是找了本教材来看。 Vijay Ganesh (PhD. Thesis 2007), Decision Procedures for Bit-Vectors, Arrays
绿巨人
2018-05-17
3K0
机器学习实战 - 读书笔记(05) - Logistic回归
机器学习实战 - 读书笔记(05) - Logistic回归 解释 Logistic回归用于寻找最优化算法。 最优化算法可以解决最XX问题,比如如何在最短时间内从A点到达B点?如何投入最少工作量却获得最大的效益?如何设计发动机使得油耗最少而功率最大? 我们可以看到最XX问题,有寻找最小(最短时间)和最大等。 解决最小类问题会使用梯度下降法。可以想象为在一个山坡上寻找最陡的下坡路径。 同理,解决最大类问题会使用梯度上升法。可以想象为在一个山坡上寻找最陡的上坡路径。 寻找最优化算法,可以通过试图找到一个阶跃
绿巨人
2018-05-17
9650
机器学习实战 - 读书笔记(06) – SVM支持向量机
机器学习实战 - 读书笔记(06) – SVM支持向量机 前言 最近在看Peter Harrington写的“机器学习实战”,这是我的学习笔记,这次是第6章:SVM 支持向量机。 支持向量机不是很好被理解,主要是因为里面涉及到了许多数学知识,需要慢慢地理解。我也是通过看别人的博客理解SVM的。 推荐大家看看on2way的SVM系列: 解密SVM系列(一):关于拉格朗日乘子法和KKT条件 解密SVM系列(二):SVM的理论基础 解密SVM系列(三):SMO算法原理与实战求解 解密SVM系列(四):SVM非
绿巨人
2018-05-17
7720
机器学习实战 - 读书笔记(07) - 利用AdaBoost元算法提高分类性能
前言 最近在看Peter Harrington写的“机器学习实战”,这是我的学习笔记,这次是第7章 - 利用AdaBoost元算法提高分类性能。 核心思想 在使用某个特定的算法是,有时会发现生成的算法f(x)的错误率比较高,只使用这个算法达不到要求。 这时f(x)就是一个弱算法。 在以前学习算法的过程中,我们认识到算法的参数很重要,所以把公式改写成这样: 一个思路是通过多个弱算法组合形成一个强算法来满足需求。 训练多个弱算法的思路如下: 根据样本数据,求出 ; 调整样本数据:将满足匹配 的
绿巨人
2018-05-17
1.1K0
机器学习实战 - 读书笔记(08) - 预测数值型数据:回归
前言 最近在看Peter Harrington写的“机器学习实战”,这是我的学习心得,这次是第8章 - 预测数值型数据:回归。 基本概念 回归(regression) - 估算一个依赖变量和其它独立变量的关系。不同于分类的是,它计算的是连续数值,也就是数值型数据。 回归多用于预测。 回归方程(regression equation) : 就是回归分析的结果。一个方程式使用独立变量来计算依赖变量。 线性回归(linear regression) : 回归方程是一个多元一次方程,它是由常量乘以每个独立变量,然
绿巨人
2018-05-17
1K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档