此篇已收录至《大型网站技术架构》读书笔记系列目录贴,点击访问该目录可获取更多内容。
啥也不说了,@主席的《Android开发艺术探索》真是业界良心之作,不得不看! 感谢主席,膜拜主席!主席主席,我要跟你生猴子!(>^ω^<)
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉 建立信誉(Building a Reputation) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往? 本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作。 让我们回忆一下囚徒困境。 囚徒困境的均衡是双方都告密。 在有限多阶
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈 信号传递博弈(Signaling Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 信号传递博弈的核心在于玩家2如何判断玩家1的类型。 可以想象玩家2是一个面试官,试图挑选一个有经验的Java工程师。而玩家1是被面试者。 玩家1有两种类型:类型1是有三年Java工作经验的,类型2是有三年JavaScript工作经验的。 信号传递博弈的两种类别 混同均衡
强化学习读书笔记 - 11 - off-policy的近似方法 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记 - 00 - 术语
读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标 拍卖和竞标(Auctions and Competitive Bidding) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 拍卖的类型 公开拍卖(open auctions) 英式拍卖(The English Auctions) 从一个底价开始喊价,出价高者获得物品。 荷兰式拍卖(The Dutch Auctions) 价格从一个高价开始,慢慢下降,第一个喊“买
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判 信息传递和廉价谈判(Information Transmission and Cheap Talk) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。 三个结论: 不存在完全诚实的均
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈 贝叶斯博弈(Bayesian Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 不完整信息的静态博弈(Incomplete information static games) 不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集、结果集和收益函数等信息。 对不完整信息博弈的处理方法来自于Harsanyi。
强化学习读书笔记 - 13 - 策略梯度方法(Policy Gradient Methods) 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性 在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 子博弈精炼(subgame perfection) 序贯理性就是要求玩家总是选择最佳反应。 子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。 在均衡路径上(on the equilibriu
机器学习是计算机科学与人工智能的重要分支领域。西瓜书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识,是一本非看不可的书!!!读书笔记更新至第11章,习题答案更新至第九章。
强化学习读书笔记 - 14 - 心理学 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记 - 00 - 术语和数学符号 强化学习读书
强化学习读书笔记 - 10 - on-policy控制的近似方法 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记 - 00 - 术
最近有幸认识了很多国内安卓开发的大神,每每想到这里都感觉自己总算是找到了组织,步入了正轨。(^o^) 前段时间购入了几位大牛们写的书,这些书都是好评如潮啊,哈哈哈,慢慢看过来,永远相信勤能补拙吧。(^o^)
读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈 重复的博弈(Repeated Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 有限地重复的博弈 有限地重复的博弈(Finitely Repeated Games) 给定一个阶段博弈G,一个有限地重复的博弈被记做G(T, ),其中阶段博弈G被连续进行了T次, 是公共折扣因子。 推论 10.1 如果有限重复博弈的阶段博弈有一个唯一的纳什博弈, 则这个
数据治理成熟度评估为企业提供了一个数据治理的切入点,通过发现企业数据治理中存在的问题,找到目前和业界领先企业的差距,绘制出符合企业现状和需求的数据治理路线图。
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈 多阶段博弈(Multistage Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 多阶段博弈 多阶段博弈 多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。 这些阶段博弈的玩家都相同。每个博弈都属于一段截然不同的时期(distinct period)。 多阶段
读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计 机制设计(Mechanism Design) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 机制设计的概念 机制设计的目标是设计一个可以达到期望收益的博弈。 由于这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。 这个理论明显在经济和政治方面有很多用途。 我们假象这样一个例子: 某个政府需要设计一个关于化工厂的环保政
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡 压制信念:纳什均衡(Pinning Down Beliefs: Nash Equilibrium) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纳什均衡 纳什均衡 一个纯策略组合 是一个纳什均衡,如果对于其中的每个策略, 都是 的最佳响应。 推理 5.1: 一个策略组合 ,如何 满足下面的条件之一: 是一个严格的优势策略均衡 是唯一的IESD
强化学习读书笔记 - 12 - 资格痕迹(Eligibility Traces) 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性 可信性和序贯理性(Credibility and Sequential Rationality) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 序贯理性和逆向归纳法(Sequential Rationality and Backward Induction) 序贯理性(Sequential Rationality) 序贯理性是一个原则:在博弈树的每一个信息集上,
强化学习读书笔记 - 08 - 规划式方法和学习式方法 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 需要了解强化学习的数学符号,先看看这里: 强化学习读书笔记 - 00 - 术语和数学符号 什么是模型(model) 环境的模型,本体可以通过模型来预测行为的反应。 对于随机的环境,有两种不同的模型: distribution model - 分
读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议 战略协议(Strategic Bargaining) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。 一个两人协议博弈的过程: 第一回合 玩家1提出分配(x, 1-x),玩家1得到x,玩家2得到1-x。 如果玩家2表示接受,博弈结束, = x, = 1-x。如果玩家2反对,进入下一轮 第二回合
强化学习读书笔记 - 09 - on-policy预测的近似方法 参照 Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 强化学习读书笔记 - 00 - 术语和数学符号 强化学习读书笔记 - 01 - 强化学习的问题 强化学习读书笔记 - 02 - 多臂老O虎O机问题 强化学习读书笔记 - 03 - 有限马尔科夫决策过程 强化学习读书笔记 - 04 - 动态规划
从2016年年初,开始用python写一个简单的爬虫,帮我收集一些数据。 6月份,开始学习Machine Learning的相关知识。 9月开始学习Spark和Scala。 现在想,整理一下思路。 先感谢下我的好友王峰给我的一些建议。他在Spark和Scala上有一些经验,让我前进的速度加快了一些。 学习算法 作为一个程序猿,以前多次尝试看过一些机器学习方面的书,其过程可以说是步履阑珊,碰到的阻力很大。 主要原因是,读这些机器学习的书,需要有一些数学方面的背景。 问题就在这些数学背景上,这些背景
在这个信息爆炸的时代,我们总在寻找那些能够激发思维、启迪灵魂的宝藏。一本书可能是奇思妙想的起点,也可能是不断精进的开端。1024程序员节来临之际,腾讯云 TVP 诚邀你参加这场为期14天的读书盛宴,同时也为大家精心挑选了一本本经典著作,希望与你一同探索其中的智慧。
《麦肯锡 问题分析与解决技巧》是一本关于问题分析与如何解决问题的书籍,在阅读过程中收获不少,因此留下读书笔记方便其他人来进行学习。
上篇最重要的是介绍了去耦的工具之一依赖注入,本篇将继续介绍去耦工具:接口和适配器,本文是The Clean Architecture in PHP的第5篇。
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略 混合的策略 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 策略,信念和期望收益 混合策略 玩家i的有限纯策略集合 将 定义为 的单纯形,是在 上所有概率分布的集合。 玩家i的一个混合策略(mixed strategy)是 两个明显的条件: image.png 玩家i选择混合策略 ,并且对手选择混合策略 ,的期望收益:
读书笔记: 博弈论导论 - 总结 总结 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记的总结。 博弈论 博弈论是关于智能理性决策者的协作和冲突的数学模型的研究。 博弈论的目的可以说是研究寻找博弈均衡的方法。 博弈论的直接目标不是找到一个玩家的最佳策略,而是找到所有玩家的最理性策略组合。 我们称最理性策略组合为均衡。 博弈论(也叫逆向博弈论)的另外一个作用是机制设计,根据期望的结果,设计一个博弈体系。 博弈论的分类 这本书中将博弈论的只是分
https://www.gitbook.com/book/riboseyim/linux-perf-master/details
本书属于基础类书籍,会有比较多的基础知识,所以这里仅记录平常不怎么容易注意到的知识点,不会全记,供大家和自己翻阅;
强化学习读书笔记 - 00 - 术语和数学符号 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 基本概念 image.png image.png image.png 策略 image.png 由上面的公式可以看出:\(\pi(s)\)可以由\(v_{\pi}(s)\)或者\(q_{\pi}(s,a)\)决定。 强化学习的目
都说“数字转型,文化先行”,但做起来,并不容易,“文化”可能很虚,但他的作用,不容忽视。良好的企业文化为员工提供了做选择时的指导方针,有利于企业数字化目标的实现。如果领导层和员工的看法不同,说明在企业上下并没有形成共识,这对于企业数字化的推进是很不利的。但是一种企业文化不是一朝一夕就能轻易形成的,数据治理也是一项长期的系统工程,潜移默化地融入企业文化中。
今天继续更新《Effective C++》和《C++并发编程实战》的读书笔记,下面是已经更新过的内容:
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识 完整信息的动态博弈 预备知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 动态博弈(Dynamic Games) 静态博弈是每个玩家同时(并且在不知道其他玩家选择的情况下)做出选择。 动态博弈引进了玩家做出选择的先后次序。 注意:玩家i做出了选择后,玩家j知道玩家i做出了选择,但是不一定知道玩家i做出了什么选择。 扩展形式博弈(The Extensive-Form
DAMA认证的教材,没报考也没报班,但是买了书。一些知识“知道”和成体系往往是两码事,证不证的不重要,含金量如何也不重要,重要的是读书本身就是有收获的。
强化学习总结 强化学习的故事 强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。 有限马尔卡夫决策过程 马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习的故事1:找到最优价值 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略\(\p
强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 数学符号看不懂的,先看看这里: 强化学习读书笔记 - 00 - 术语和数学符号 时序差分学习简话 时序差分学习结合了动态规划和蒙特卡洛方法,是强化学习的核心思想。 时序差分这个词不好理解。
又一本网络基础的书啃完了,这本书建议结合[《网络是怎么样连接的》读书笔记 - 汇总篇]这一篇读书笔记食用(当然也可以直接看原书)。
“在互联网时代,信息量爆炸性增长,我们需要有效地整理和呈现这些信息。思维导图是一个非常有用的工具,可以帮助我们组织思路、整理知识、规划任务和解决问题。”
强化学习读书笔记 - 04 - 动态规划 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 数学符号看不懂的,先看看这里: 强化学习读书笔记 - 00 - 术语和数学符号 动态规划(Dynamic Programming) - 计算最优策略的一组算法。 策略 强化学习的一个主要目的是:找到最优策略。 我们先要明白什么是策略? 策略告诉主体(ag
读书笔记系列上新了,选择这本《宏观经济数据分析手册》的核心原因是,我们做企业微观数据的分析的时候其实离不开对宏观大环境的关注。有时候我们说数据分析师难做,其实就是因为数据分析这个职业对知识面的要求是很高的。
“理现状和定目标”,其实说的是两个方面的问题,一个是强调过程,一个是强调结果,了解了现状,才能更好地制定目标,进而才能改进现状和问题,这两者是相辅相成的。任何企业都不会为了治理数据而治理数据,其背后都是管理和业务目标在驱动。企业数据治理的第一步是明确治理的业务目标。
这一篇写完,本书就读完了。本来后面还有两章是关于12个持续开关和一些养习惯的成功案例的,我在这里就省掉了。
本文继续介绍斯科特·扬(Scott Young)写的《如何高效学习》中整体性学习的第二部分,主要介绍整体性学习的相关技术。
如果你经过一段时间的Obsidian实践,笔记数量已经积累到一定的数量,比如超过1000条,是否已经开始有所察觉,笔记好像没有之前那么好找了?比如,目录层级不断深入;搜索结果噪声增加……
废话不多说,行动起来吧。大家写的读书笔记链接可以在本文评论~下面是几个可能对你有用的链接
在开始今天的内容前,先回复下在上一篇笔记的热心读者的问题: 1 既然是读书笔记,是读的哪本书? 这本书的名字叫《快学scala》,虽然是本比较久远的书,但是也算是scala入门非常经典的读物,主要是对比java和scala的语言特点写出来的,我早期做了这样一套读书笔记,由于工作的需要,要重新使用scala,而且Scala的版本也有了较大变化,这里就当做温故知新,贴出来也算是抛砖引玉,希望Spark高手能给大家带来精彩的Spark源代码解析。 2 为什么笔记的内容和原书的解释不一样? 读书笔记,在读的过程中
领取专属 10元无门槛券
手把手带您无忧上云