首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

仓位管理:超越凯利公式,梦回华尔街!

那么,我们应该在每个交易机会中承担多少比例资本风险?今天推文带你揭开这个答案。 案例1:硬币 让我们从一个简单例子开始。假设在一个赌场,你和韩梅梅玩硬币游戏,并根据结果下赌注。...两枚硬币 在开始,我们研究了头寸大小对硬币游戏影响。这次,我们要用两个硬币。...头两场结果和之前一样正面翻倍,反面输掉100%在第一个(非相关)场景中,潜在结果如下: ? 因为两枚硬币都是同时,所以我们必须在硬币之前下注。...其次,我们建议在每一个打赌事件上(需要使用借来钱或杠杆)押注资金总额近180%。最后,我们应该把更大赌注分配给一枚硬币,随着时间推移,它肯定会赔钱。这些似乎都与直觉相悖。...如上所述,杠杆计算中使用最大回撤是基于加权收益。一种策略损失可以补偿同一时期另一种策略收益。为了解决所有策略同时对你产生不利情况,你可以将每种策略历史上最大回撤与投资组合权重相乘。

1.7K20

机器学习(十九)EM:期望最大算法

于是,以初始值θ0为起点,迭代执行以下步骤直至收敛: 基于θt推断隐变量Z期望,记为Zt; 基于已观测变量X和Zt对参数θ做极大似然估计,记为θt+1 2 硬币例子 我们现在考虑两个硬币例子...“E”步骤(期望): 首先初始化p和q值(初始猜测)。 我们不是说掷硬币来自特定硬币,而是说它以概率为'x'来自硬币A,来自硬币B概率'1-x'。 计算每枚硬币正反期望数量。...“M”步骤(最大化): 从“E”步骤计算步骤3中每个硬币正反期望对数似然,类似于MLE计算。 最大似然估计出隐变量,并重新估计p和q新值 使用新p和q值重复“E”步骤,直到它收敛为止。...对其他四个实验重复相同期望(E)步骤,我们得到硬币A = 21.3和尾部= 8.6预期头部总数,类似于硬币B,预期头部总数= 11.7,尾部= 8.4 ?...因此,对未知参数p和q新估计是 ? 和 ? 上一步是“M”步骤或最大化步骤。我们重复上述EM步骤,直到'p'和'q'值收敛。

1.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

传说中贝叶斯统计到底有什么来头?

例如当我脑海中带着停止意图时,它重复1000次或者在掷硬币过程中我看到最少300词头在上的话,我将停止进行实验。...现在让我们进一步了解: 通过掷硬币例子我们就会明白频率统计,目的是估计硬币公平性,下表是代表硬币过程中头在上次数: ? 我们知道在公平硬币过程中得到一个头在上那概率为0.5。...4.贝叶斯推理 让我们从硬币例子来理解贝叶斯推理背后过程: 贝叶斯推理中一个重要部分是建立参数和模型。 模型观察到事件数学公式,参数是在模型中影响观察到数据因素。...如果我们知道硬币是公平,这就是观测到头朝上概率。 P(D)就是证据,这是因为通过在θ所有可能值,是θ那些特定值加权求和(或积分)确定数据概率。...这就是所谓伯努利近似函数,硬币任务被称为伯努利试验。 y={0,1},θ=(0,1) 而且,当我们想看到一系列头或翻转,它概率为: ? ?

68960

深度 | 传说中贝叶斯统计到底有什么来头?

例如当我脑海中带着停止意图时,它重复1000次或者在掷硬币过程中我看到最少300词头在上的话,我将停止进行实验。...现在让我们进一步了解: 通过掷硬币例子我们就会明白频率统计,目的是估计硬币公平性,下表是代表硬币过程中头在上次数: ? 我们知道在公平硬币过程中得到一个头在上那概率为0.5。...4.贝叶斯推理 让我们从硬币例子来理解贝叶斯推理背后过程: 贝叶斯推理中一个重要部分是建立参数和模型。 模型观察到事件数学公式,参数是在模型中影响观察到数据因素。...如果我们知道硬币是公平,这就是观测到头朝上概率。 P(D)就是证据,这是因为通过在θ所有可能值,是θ那些特定值加权求和(或积分)确定数据概率。...这就是所谓伯努利近似函数,硬币任务被称为伯努利试验。 y={0,1},θ=(0,1) 而且,当我们想看到一系列头或翻转,它概率为: ? ?

1.2K50

2023-06-13:统计高并发网站每个网页每天 UV 数据,结合Redis你会如何实现?

规则如下: 硬币游戏,每次硬币可能正面,可能反面,没回合一直,直到每当抛到正面回合结束。 然后我跟B说,抛到正面最长回合用到了7次,你来猜一猜,我用到了多少个回合做到?...同样举硬币例子,如果只有一组硬币实验,显然根据公式推导得到实验次数估计误差较大;如果100个组同时进行硬币实验,受运气影响概率就很低了,每组分别进行多次硬币实验,并上报各自实验过程中抛到正面的抛掷次数最大值...那么基于上面的估算结论,我们可以通过多次硬币实验最大抛到正面的次数来预估总共进行了多少次实验(多少个不同数据),同样存储时候也可以优化,每次add一个元素时,只要算法最后出现1位数,把这个位数做一个最大替换久可以...当我们执行这个操作时,lijin这个字符串就会被转化成64个bit二进制比特串。...那么基于上面的估算结论,我们可以通过多次硬币实验最大抛到正面的次数来预估总共进行了多少次实验(多少个不同数据),同样存储时候也可以优化,每次add一个元素时,只要算法最后出现1位数,把这个位数做一个最大替换久可以

30520

最大期望算法EM,极大似然函数

对于求一个函数极值,通过我们在本科所学微积分知识,最直接设想是求导,然后让导数为0,那么解这个方程得到θ就是了(当然,前提是函数L(θ)连续微)。但,如果θ是包含多个参数向量那怎么处理呢?...为了估计这两个硬币朝上概率,咱们轮流硬币A和B,每一轮都连续5次,总共5轮: ? OK,问题变得有意思了。现在我们目标没变,还是估计PA和PB,需要怎么做呢?...答案就是先随机初始化一个PA和PB,用它来估计z,然后基于z,还是按照最大似然概率法则去估计新PA和PB,然后依次循环,如果新估计出来PA和PB和我们真实值差别很大,直到PA和PB收敛到真实值为止。...第3轮、第5轮出现正次数2、1、2相加,除以A被总次数15(A了三轮,每轮5次),作为z估计值,B计算方法类似。...然后循环重复2、3步直到收敛。 详细推导过程请参考文末参考文献。 2. 采用 EM 算法求解模型有哪些? 用EM算法求解模型一般有GMM或者协同过滤,k-means其实也属于EM。

2.1K20

CODING 技术小馆 | 数据挖掘中特征提取(中)

所以我们拿到这些数据时候,需要对它进行噪音去除。一个比较简单去除方法就是基于历史数据来平滑。...我们不仅考虑一天半天,半天可能是一天数据,一天可能 7 次展示 1 次下载,我们可以把前面历史 100 天数据放出来,如果只上线一天,前面 100 天数据为零,加权之后就会降低它权重。...举个例子,我们一个硬币,即使一次都没有它,它正面和反面朝上概率各是 50%;还比如说投篮总会认为有一定概率不会投进。...依然说硬币,假设了 10 次都是正面朝上,我们会认为概率是 100%,但是如果了 1 万次还是正面朝上,我们会认为这个硬币是特殊。它背后关联可以通过越来越多观测技术不停调整正面的分布。...这里有一个很好例子,如果观测分布的话,比如硬币一开始我们认为正反面朝上概率是 50:50,如果了 100 次一直朝上,我们会认为这枚硬币可能正面朝上概率会高一些,再观测 100 万次,如果都是正我们就认为它

24820

从似然函数到EM算法(附代码实现)

,通过我们在本科所学微积分知识,最直接设想是求导,然后让导数为0,那么解这个方程得到θ就是了(当然,前提是函数L(θ)连续微)。...为了估计这两个硬币朝上概率,咱们轮流硬币A和B,每一轮都连续5次,总共5轮: 硬币 结果 统计 A 正正反正反 3正-2反 B 反反正正反 2正-3反 A 正反反反反 1正-4反 B 正反反正正...3+1+2)/ 15 = 0.4 PB= (2+3)/10 = 0.5 问题来了,如果我们不知道硬币是A还是B呢(即硬币种类是隐变量),然后再轮流五轮,得到如下结果: 硬币 结果 统计 Unknown...答案就是先随机初始化一个PA和PB,用它来估计z,然后基于z,还是按照最大似然概率法则去估计新PA和PB,然后依次循环,如果新估计出来PA和PB和我们真实值差别很大,直到PA和PB收敛到真实值为止。...2相加,除以A被总次数15(A了三轮,每轮5次),作为z估计值,B计算方法类似。

70420

数据分析简单题目分享(附答案)

C 正态分布:多组(多次独立重复实验下随机变量均值) D 二项分布:多次硬币独立重复试验 解答: A 学生分布:小样本量下对正态分布均值进行估计 B 泊松分布:某段时间内,事件发生概率...也可以认为是n很大p很小二项分布。 C 正态分布:多组(多次独立重复实验下随机变量均值) D 二项分布:多次硬币独立重复试验 把体积看成时间,那么本题符合B泊松分布。 3....基本思路是依次训练多棵树,每棵树训练时对分错样本进行加权。...树模型中对样本加权实际是对样本采样几率加权,在进行有放回抽样时,分错样本更有可能被抽到 2)GBDT是Adaboost Tree改进,每棵树都是CART(分类回归树),树在叶节点输出是一个数值...(参考:https://www.cnblogs.com/pinard/p/6140514.html) 3)得到多棵树后,根据每颗树分类误差进行加权投票 结尾: 通过本篇博客学习,您不仅仅是解决了一系列简单数据分析问题

14810

【Redis04】高级数据类型-HyperLogLog

Redis-HyperLogLog 基于HyperLogLog算法,使用极小空间完成巨量运算 Redis 中HyperLogLog 基本使用 常用命令 PFADD key element [element...这个实验是这样:随机一枚硬币,那么正面朝上和反面朝上概率都应该是 50% ,那么如果一直重复硬币,直到出现正面朝上,就记作1次伯努利实验。...对于单个一次伯努利实验,硬币次数是不确定,有可能第一次就正面朝上,那这1次就被记为1次伯努利实验,也有可能了10次才出现正面朝上,那这10次才会被记作1次伯努利实验。...假设做了n次伯努利实验,第一次实验k_1次硬币, 第二次了k_2次硬币,那么第 n 次实验就了k_n次硬币,在[k_1,k_n]之间,,就必然存在一个最大值k_m,,k_m意义就是在这一组伯努利实验中...(同一用户不重复计算) 要实现这个功能,最简单办法就是维持一个set,每当有用新户访问页面,就把ID加入集合(重复访问用户也不会重复加),点击量就是集合长度,但这样做最大问题就是会浪费很多空间

56710

从伯努利分布到多项式分布条件_伯努利分布期望

大家好,又见面了,我是你们朋友全栈君。 文章目录 1. 伯努利分布(bernouli distribution) 1.1 伯努利试验 (一次硬币) 1.2 伯努利分布 2....二项分布(n次硬币) 2.1 二项定理 2.2 二项式分布(Binomial Distribution) 3....distribution) 伯努利分布(Bernoulli distribution)又名 两点分布 或 0-1分布,在讲伯努利分布前首先需要介绍伯努利试验(Bernoulli Trial) 1.1 伯努利试验 (一次硬币...如果试验 E 是一个伯努利试验,将 E 独立重复地进行 n 次,则将这一系列重复独立试验称为是 n 重伯努利试验,这时你可能会联想到逻辑回归,逻辑回归中,你可以理解成每一个样本是一个伯努利分布,由它固定参数...二项分布(n次硬币) 2.1 二项定理 二项定理是由牛顿-莱布尼茨发明,解决了两个数相加n次方问题,使用了排列组合即: 2.2 二项式分布(Binomial Distribution)

86420

连载 | 概率论与数理统计(1) – 基本概念

唯一可以获得这类现象结果办法是等到它们发生之后。最典型例子就是硬币一枚均匀硬币之前,已知结果只有正面和反面两种,但是无法知道到底会是哪一面。...还是拿硬币来举例,每次硬币都不知道会得到正面还是反面,但如果有耐心将一枚均匀硬币20,000次(已经有多位著名统计学家这么做过了),然后统计一下正反面分别出现了多少次,就可以发现它们差不多都是...上面的硬币例子中,随机现象(硬币)在相同条件下,大量重复试验中呈现规律性就叫做统计规律性。《概率论与数量统计》就是研究随机现象统计规律一门学科。...它具有以下特性: 可以在相同条件下重复进行; 事先知道所有可能出现结果; 进行试验前不知道哪个试验结果会发生。 随机试验有很多种,例如常出现掷骰子,摸球,射击,硬币等。...所有的随机试验结果可以分为两类来表示: 数量化表示:射击命中次数,商场每个小时客流量,每天经过某个收费站车辆等,这些结果本身就是数字; 非数量化表示:硬币结果(正面/反面),化验结果(阳性

66410

机器学习与网络安全(四)概率学基础

计算机科学所处理内容大部分是完全确定且必然,程序员写程序时是假定CPU将完美执行每条指令,硬件错误是非常罕见并在编程阶段几乎不予考虑。...; 3、不完全建模,例如三个杯子里一个硬币游戏,将一个硬币放在中间杯子中,然后随意转换杯子相互位置,如果不允许观察转换过程,则无法良好预测硬币最后在哪边杯子中。...概率论最初发展是为了分析事件发生频率,所以说我们很容易可以看出概率论,就像是在打扑克时候抽出一手特定牌这种事件研究中是如何使用,这类事件往往是可以重复,我们用概率只是表示一种信任度。...试验前不可预知,大量重复实验具有统计规律性。...随机实验 一些随机事件 一枚硬币,观察正反面的出现情况,一次再三次,观察正反面的出现情况;一枚硬币三次观察正面出现次数;一枚色子,观察出现点数,它都是可以反复进行

59320

机器学习数学基础:随机事件与随机变量

虽然随机试验是研究随机现象, 但是肯定不是所有的随机试验都那么好研究, 比如明天天气, 所以随机试验应该满足三个条件: 可以在相同条件下重复进行(重复) 结果虽然不确定, 有多种可能, 但是这些可能结果已知..., 就是跑不出这个范围 作一次试验不确定是这个范围里面的哪个结果 就拿硬币这个来说, 首先硬币我们可以重复进行多次, 并且每次进行我们都知道要么是正, 要么是反,所以可能结果已知, 但是我们抛掷一次是正是反就不确定..., 所以这个试验是满足上面的条件, 所以硬币结果随机现象我们就可以通过随机试验进行观察。...比如硬币, 样本空间是{正,反}, 而其子集就是{正}, {反}, 所以一枚硬币得到结果是正或者反都可以作为随机事件, 当然这个例子随机事件可能会和样本点进行混淆, 那就投掷一枚骰子结果, 我们知道样本空间是...emmm,有道理, 大量试验证实, 当重复试验次数逐渐增大, 频率会逐渐稳定性到某个常数, 比如硬币, 如果你做很多次试验, 你会发现正面向上频率会稳定在0.5(不信?

93820

统计系列(一)统计基础

这些推断基础都是基于中心极限定理和随机变量概率分布。 抽样 抽样方法 常见抽样方法有简单随机抽样、系统随机抽样、分层抽样和整群抽样,最常用是简单随机抽样。...,硬币所有结果只能为正反。...即样本空间为{ 正面,反面 };如果一次硬币(一次随机试验),其结果为正面(随机事件),将该结果记为1。再一次硬币,其结果为反面,将该结果记为2。...因此该硬币结果设为随机变量X,X结果可能为1或者2,多次试验后,X分布服从二项分布,所以X=1概率为0.5。...中心极限定理 给定一个任意分布总体,每次从这些总体中随机抽取 n 个样本(统计上大于30),重复 m 次,分别求出这m次样本平均值。这些样本平均值分布近似正态分布。

82430

零基础入门量子计算:从一个神奇概念进入量子世界

02 同一方向测量 测量是重复。如果我们重复完全相同测量,就会得到完全相同结果。例如,为了测量在垂直方向上电子自旋,我们在第一个装置后面放置另外两个装置,重复完全相同实验。...一枚均匀硬币是一个经典实验,它可以产生两个符号随机序列,且每个符号出现概率为二分之一。如果我们一个均匀硬币,可能会得到序列HTTHHHTT…。...尽管这两个例子产生了相似的结果,但在这两个理论中,对随机性解释有很大不同。 硬币是经典力学描述事情,可以用微积分来建模。...考虑到所有这些值,这个理论会告诉我们硬币是正面还是反面朝上。这没有包含真随机性。硬币似乎是随机,因为每次硬币初始条件都略有不同。这些微小变化可以将结果由正面变为反面,反之亦然。...硬币得到序列HTTHHHTT…,这看起来是随机,但是物理经典定律是确定,如果我们能以无限精度进行测量,这种明显随机性就会消失。 在这个阶段,人们自然会对此提出质疑。

54040

似然与概率异同

极大似然估计 假设有一枚硬币,我们想确定这枚硬币是否质地均匀。即想知道这枚硬币,正反面出现概率各是多少?于是我们将这枚硬币了10次,得到数据x0是:反正正正正反正正正反。...我们想求正面概率θ是模型参数,而硬币模型可以假设服从二项分布。 那么,出现实验结果x0(反正正正正反正正正反)似然函数是多少呢? ? 而极大似然估计,顾名思义,就是要最大化这个函数。...还是以判断一枚硬币是否质地均匀为例。假设正面概率θ满足均值为0.5,方差为1先验分布,即: ? 那么,将这枚硬币了10次,得到数据x0是:反正正正正反正正正反。...概率: 如果我有一枚质地均匀硬币,那么它出现正面朝上概率是0.5。 似然: 如果我一枚硬币100次,正面朝上52次,那么它十有八九是质地均匀。 再举一个例子加深理解。...假设有人向我挑战一个“有利赌博游戏”。 概率: 帮助我们计算预期收益和损失(平均值、众数、中值、方差、信息比率、风险值、赌徒破产等等)。 似然: 帮助我们量化是否首先应该相信那些概率。

80420

钟形曲线:中心极限定理 精选

钟形曲线:中心极限定理 上一篇中,通过赌徒谬误介绍了概率论中大数定律。大数定律说是当随机事件重复多次时频率稳定性,随着试验次数增加,事件发生频率趋近于预期“概率”。...图2左图显示便是当实验次数n=4时,出现1概率对不同“出现次数”分布情形。 图2:多次硬币得到正面的概率分布 显而易见,硬币概率分布图形随着丢次数n变化而变化。...硬币实验n次概率分布称为二项分布。对对称硬币来说,二项分布是一个取值对应于二项式系数离散函数,也就是帕斯卡三角形中第n列。...考虑图1所示高尔顿钉板实验中某一个小球下落过程:小球在下落过程中碰到n个钉子上,每次都等效于一次“公平硬币”类型随机变量。也就是说,一个小球从顶部到底部过程,等效于n次硬币之和。...一定条件下忽略不计。

91820

信息论

n位二进制数记N=2^n个不相等数,含有n比特信息,所以每位数字信息量还是1。 十进制数:十进制数字有10个,每位数字信息量是㏒(10)/ ㏒(2)=1/0.301=3.32。...熵定义 如果有一枚理想硬币,其出现正面和反面的机会相等,则硬币事件熵等于其能够达到最大值。我们无法知道下一个硬币抛掷结果是什么,因此每一次硬币都是不可预测。...若进行n次独立实验,则熵为n,因为可以用长度为n比特流表示。[1]但是如果一枚硬币两面完全相同,那个这个系列硬币事件熵等于零,因为结果能被准确预测。...硬币硬币熵H(X)(即期望自信息),以比特度量,与之相对硬币公正度 Pr(X=1)....注意图最大值取决于分布;在这里,要传达一个公正硬币结果至多需要1比特,但要传达一个公正骰子结果至多需要log2(6)比特。 (网上内容总结)

65520

Redis HyperLogLog 是什么?这些场景使用它,让我枪出如龙,一笑破苍穹

即使「肖菜鸡」重复访问页面,重复执行命令,也只会把 key 等于「肖菜鸡」 value 设置成 1。 最后,利用 HLEN 命令统计 Hash 集合中元素个数就是 UV。...第一步,执行下面指令表示「肖菜鸡」编码为 6 并 访问「巧用 Redis 数据类型实现亿级数据统计」这篇文章。...这些就是典型「基数统计」应用场景,基数统计:统计一个集合中不重复元素个数。...伯努利过程就是一个硬币实验过程。一枚正常硬币,落地可能是正面,也可能是反面,二者概率都是 1/2 。 伯努利过程就是一直硬币,直到落地时出现正面位置,并记录下抛掷次数k。...比如说,一次硬币就出现正面了,此时 k 为 1; 第一次硬币是反面,则继续,直到第三次才出现正面,此时 k 为 3。

1K20
领券