众所周知,在用有监督学习算法对未来的金融产品收益情况进行预测时,需要从训练集中拟合一个模型,而第一步需要对训练集里每个样本打标签,即为每个 X(i) 标注一个 y(i),其中 i = 1, 2, ..., n。
波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)
最近我们被客户要求撰写关于波动率的研究报告。 波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)。
最近我们被客户要求撰写关于随机波动率SV、GARCH的研究报告,包括一些图形和统计输出。
一般我们在训练神经网络模型的时候,都是每隔多少步,输出打印一下loss或者每一步打印一下loss,今天发现了另一种记录loss变化的方法,就是用
本文将给出基于决策树的智能根因分析方法,针对多维找出导致问题的根因。做数据、搞AI一定要基于具体业务,不可脱离业务谈数据、算法,否则将得不偿失。
当我们在使用Python进行数值计算时,有时会遇到类似于ValueError: cannot convert float NaN to integer的错误。这个错误通常是由于我们试图将一个NaN(Not a Number)转换为整数类型引起的。在本篇文章中,我们将讨论这个错误的原因以及如何解决它。
波动率是一个重要的概念,在金融和交易中有许多应用。这是期权定价的基础。波动率还使您可以确定资产分配并计算投资组合的风险价值(VaR)。甚至波动率本身也是一种金融工具,例如CBOE的VIX波动率指数。但是,与证券价格或利率不同,波动不能直接观察到。
最近参加了一个线上学习计划,一群人一起学《Elements of Financial Risk Management》这本书,主要偏向于金融时间序列和多因子模型的知识,结合python编程。现在已经看了三分之一左右,感觉写的还不错,有些收获,意外惊喜是教材的答案全是用excel公式做的,头一次发现excel还可以做极大似然估计这种东西,很神奇。
核心:一个多分类自变量与另一个多分类因变量。如检验学历(低、中、高)在收入等级(低、中、高)上的差异
当想用一个矩阵的数据 除以另一个矩阵的对应位置的数值时,可以直接用两个矩阵相除,例子如下
不需要刻意的去记,因为开发中很少会遇到多个运算符参与的式子,万一遇到也可以通过()来提升优先级
Infinity(无穷大)在 JS 中是一个特殊的数字,它的特性是:它比任何有限的数字都大,如果不知道 Infinity, 我们在一些运算操作遇到时,就会觉得很有意思。
公众号与点宽DigQuant量化社区开展了本期研究合作。 大家应该前段时间就知道 Alpha 101 了吧,很多人有去做,但是做的大多数都是简单的进行了一个复现,没有过多的区深究每个因子的涵义。本期推文我们和点宽合作,推出一个系列。来很系统的介绍 Alpha 101 。 社区俱乐部成员把 WorldQuant Alpha 101 的每个因子都了做一次最详细的解释和回测研究,一层一层的去拆分因子,把每个公式都说清楚。我们不讨论这些因子是否都是有效的,我们更多的是希望通过我们分析因子背后的金融意义,帮助大家
文/kamidox(简书作者) 原文:http://www.jianshu.com/p/1f1d4952669c pandas 是数据分析的瑞士军刀。我们今天使用 pandas 来玩一下股票数据,看看能从数据里得到哪些有意思的信息。 pandas 教程 如果你熟悉 Python 的话,官网上的 10 Minutes to pandas (http://pandas.pydata.org/pandas-docs/stable/10min.html )可以让你在短时间内了解 pandas 能干什么事以及
isNaN() 函数用于确定一个值是否为 "NaN"(非数字)。它接受一个参数,并尝试将该参数转换为数字类型。如果参数不能转换为数字,或者转换结果是 "NaN",则函数返回 true;否则,返回 false。
本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析和用户价值RFM分析。
股票收益率是反映股票收益水平的指标。投资者购买股票或债券最关心的是能获得多少收益,衡量一项证券投资收益大小以收益率来表示。反映股票收益率的高低,一般有三个指标
有效市场假说和分形市场假说是资本市场两个重要的理论,有效市场假说建立在正态性的假说上,但大量证据表明,金融数据具有尖峰厚尾的特性,这也是分形市场假说的出发点。
前几日,《Systematic Trading》的作者,在其博客中探讨了这样一个问题,当市场波动加剧时是否应该调整动量策略的参数(从长周期到短周期)?
随着线上互动需求的增加,直播连麦、语音/视频聊天的应用越来越广泛。我们一直在说“追求用户的极致体验”,但是体验是一个抽象的概念,很难量化和统计。如何从用户的行为中得到所在场景的优化“极值”,如何依据“极值”建立统一的质量指标体系以指导业务优化?如何迁移抖音的服务经验,满足toB用户的体验需求?LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实时通信场景下火山引擎RTC对体验的理解与应用落地。 文/杨智超 编辑/LiveVideoStack 大家好,本次
👆点击“博文视点Broadview”,获取更多书讯 在 JavaScript 中如何判断两个值相等,这个问题看起来非常简单,但并非如此,在 JavaScript 中存在 4 种不同的相等逻辑,如果你不知道他们的区别,或者认为判断相等非常简单,那么本文非常适合你阅读。 ECMAScript 是 JavaScript 的语言规范,在ECMAScript 规范[1]中存在四种相等算法,如下图所示: 上图中四种算法对应的中文名字如下,大部分前端应该熟悉严格相等和非严格相等,但对于同值零和同值却不熟悉,下面我
最近我们被客户要求撰写关于MVGARCH的研究报告,包括一些图形和统计输出。在本文中,当从单变量波动率预测跳到多变量波动率预测时,我们需要明白,现在我们不仅要预测单变量波动率元素,还要预测协方差元素
简单数据类型(也称为原始类型):Undefined、Null、Boolean、Number、String 和 Symbol。ES6 中新增了一种 Symbol 。这种类型的对象永不相等,即始创建的时候传入相同的值,可以解决属性名冲突的问题,做为标记。 复杂数据类型叫 Object(对象)。Object 是一种无序名值对的集合。
要成为一个优秀的前端工程师,系统的学习Javascript,有夯实的Javascript基础,以及对语言本身的深刻的理解,是基本功。从Javascript数据类型开始,我将对Javascript知识体系进行系统的梳理。
由于文件标题是中文,直接读取会报错,所以加了encoding编码申明。一般encoding设置成GBK、utf-8、GB2312即可满足读取需求。
Prometheus 提供了其它大量的内置函数,可以对时序数据进行丰富的处理。某些函数有默认的参数,例如:year(v=vector(time()) instant-vector)。其中参数 v 是一个瞬时向量,如果不提供该参数,将使用默认值 vector(time())。instant-vector 表示参数类型。
首先对VaR的定义做一回顾,上一篇提到,如果我们假设资产标准化的收益率符合正态分布,那么VaR的理论表达式为
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 前言 Optiver波动率预测大赛于上个月27号截止提交,比赛终于告一段落,等待着明年1月份的最终比赛结果。Kaggle上,由财大气粗的对冲基金大佬主办的金融交易类预测大赛,总能吸引大量的人气。在过去3个月的比赛中,也诞生了很多优秀的开源代码,各路神仙应用各种模型算法,在竞争激烈的榜单你追我赶。 关于这个比赛,网络上陆陆续续也有很多参赛经验的分享。但为了充分吸收大神们的精髓,公众号还是决定从0到1解读各种不同类型的开源比赛代码,方便小伙伴们学习归纳,并应用到实际研究中去。本系列大概安排内容如下:
在pandas中,缺失数据显示为NaN。缺失值有3种表示方法,np.nan,none,pd.NA。
最近我们被客户要求撰写关于梯度下降的研究报告,包括一些图形和统计输出。梯度下降是一种优化算法,能够为各种问题找到最佳解决方案。
之前一直在分享pandas的一些骚操作:pandas骚操作,根据大家反映还不错,但是很多技巧都混在了一起,没有细致的分类,这样不利于查找,也不成体系。
本文总结nan和inf在C语言当中的含义、产生和判定方法。 C语言当中的nan 表示not a number,等同于 #IND:indeterminate (windows) 产生: 对浮点数进行了未定义的操作;
1、在数学计算中,小数会有一定的误差,这是计算机本身的bug,不仅是js语言,其他语言也有这个问题。
本文是 Python 系列的 SciPy 补充篇。整套 Python 盘一盘系列目录如下:
P 和 Q 分别是 GARCH 和 ARCH 多项式中的最大非零滞后。其他模型参数包括平均模型偏移、条件方差模型常数和分布。
1、因子筛选应与所用模型相匹配,若是线性因子模型,只需选用能评估因子与收益间线性关系的指标,如IC、Rank IC;若是机器学习类的非线性模型,最好选用能进一步评估非线性关系的指标,如 Chi-square 及 Carmer's V 等;
大家好,我是零一。我的公众微信号是start_data,欢迎大家关注。今天接着第一篇的内容,我们继续利用excel来做分析。 首先,回应派友的疑问。 我这系列文章,是从0开始的,可能读者的基础并不是太好,我是这么安排的,先学会基本的操作,会操作了后,再回过来学一些分析思路和方法。自己做过之后,再学心法,可能会有更大的收获。 说回主题,上一篇中,我们看出了走势图,也看到了占比图。这两个必须同时看,才能清楚的,因为你单看走势图,是看不出占比的。单看占比图也会看不粗走势。因此,这两个图,是结合一起,才能读出相对完
在多变量波动率预测中,我们有时会看到对少数主成分驱动的协方差矩阵建模,而不是完整的股票。使用这种因子波动率模型的优势是很多的。
风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度
使用场景:用站点数据插值成网格数据时,可以使用散点数据插值方法 参考链接:https://ww2.mathworks.cn/help/matlab/ref/scatteredinterpolant.html
但是您的客户需要快速理解。他们没有意愿或时间去处理任何太乏味的事情,即使模型可以稍微准确一些。简单性是商业中非常重要的模型选择标准。
从这个角度讲,做运营其实很简单,不管你用什么手段,只要能让淘宝认为你是优秀的即可。
一般来说,R2在0到1的闭区间上取值,但在实验中,有时会遇到R2为inf(无穷大)的情况,这时我们会用到R2的计算公式:
在上贴「FMM 大战 LMM 2」中,我们主要推导出了 Fn(t) 在风险中性测度、即期测度和 Tk-远期测度下的 SDE。在估值和 RFR 挂钩产品时
第二种是===比较,它不会自动转换数据类型,如果数据类型不一致,返回false,如果一致,再比较。
事件起因 这其实是一件很偶然的事情,前几天在某大佬群里看大佬装逼。突然一个平日不怎么冒泡的群友发了一条链接。本着“这群里都是好人 ”的想法我就天真的点了进去......这一点可闹大了。电脑猛地变卡直至
最近我们被客户要求撰写关于ARIMA-GARCH的研究报告,包括一些图形和统计输出。
领取专属 10元无门槛券
手把手带您无忧上云