首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DolphinDB:金融中高频量价因子实时计算

1 超高性能分布式时序数据库神器 前段时间,公众号曾推荐过一个超高性能分布式时序数据库神器:DolphinDB。 复杂而又变化多端中高频量价因子研究和开发已经成为众多量化私募最重要工作之一。...DolphinDB作为一个一站式时序数据存储、分析和实时计算平台,可以帮助金工和IT人员将复杂因子快速转化成能在研发或生产环境中高效运行计算机脚本。...具体文章详见: DolphinDB:金融高频因子流批统一计算神器! 2 直播内容 本周四(6月17日),DolphinDB将为我们在线上分享他们在这块内容详细介绍与实际应用。...本次直播主要内容包括: DolphinDB低延时流数据处理架构 5种流计算引擎应用和流水线处理 研发和交易环境因子一体化实现 3 嘉宾介绍 周小华 | 智臾科技CEO。...每个组件功能亦针对量化金融需求进行精心优化。与金融机构现有系统相比,DolphinDB性能有10-1000倍提升,实现行情历史数据毫秒级查询与秒级计算响应,以及亚毫秒级实时因子计算。

90830

DolphinDB:金融高频因子流批统一计算神器!

状态引擎接受在历史数据批量处理(研发阶段)编写表达式或函数作为输入,避免了在生产环境重写代码高额成本,以及维护研发和生产两套代码负担。...这也正是DolphinDB开发响应式状态引擎动机所在。...实现前述因子流式计算。...在后续版本DolphinDB将允许用户用插件来开发自己状态函数,注册后即可在状态引擎中使用。 3.4 自定义状态函数 响应式状态引擎可使用自定义状态函数。...在后续版本DolphinDB将以行函数(rowRank,rowSum等)表示横截面操作语义,其它向量函数表示时间序列操作,从而系统能够自动识别一个因子横截面操作和时间序列操作,进一步自动构建引擎流水线

3.9K00
您找到你想要的搜索结果了吗?
是的
没有找到

从计算、建模到回测:因子挖掘最佳实践

同时,DolphinDB 自带数据回放和流式增量计算引擎可以方便地解决因子挖掘研发和生产一体化问题。DolphinDB 分布式存储和计算框架,天生便于解决工程可靠性、扩展性等问题。...DolphinDB 包含 row 系列函数以及各类滑动窗口函数,在下面两个因子计算例子,原本复杂计算逻辑,在面板数据,可以用一行代码轻松实现。...前面三个例子展示了 DolphinDB 如何通过流计算引擎实现因子在生产环境增量计算。...DolphinDB 不建议在因子计算采用 peach 或 ploop 方式来实现并行。DolphinDB 可用于计算线程分为两类,分别称之为 worker 和 executor。...以第三章权重偏度因子为例,此因子计算只用了一个字段,且计算逻辑不涉及前后数据,所以在SQL调用时,DolphinDB会自动在各分区内并行计算。

6.2K22

新型行情中心:基于实时历史行情指标计算和仿真系统

三、DolphinDB 行情中心解决方案 作为国内领先高性能时序数据库厂商,DolphinDB 在服务众多券商、私募、公募、资管和交易所客户过程,持续总结和吸收行情中心项目建设经验,并不断融入到...DolphinDB 数据库系统,最终归纳形成了一套新型行情中心解决方案。...表5:DolphinDB 宽表存储 如表5所示,在一张宽表存储4500只股票1098个因子。DolphinDB支持32767列大宽表。一部分时序数据库不支持大宽表或者存在明显性能问题。...多级存储 DolphinDB支持多级存储,可以将最常用热数据存储到SSD固态硬盘中提高数据读写速度,较冷数据存储到HDD机械硬盘,不太使用历史数据存储到S3。...向量化编程 向量化编程是DolphinDB中最基本编程范式。DolphinDB 绝大部分函数支持向量作为函数入参。

3.2K21

干货 | 高频多因子存储最佳实践

对于读取随机标的(A股市场目前约5000 股票)、随机多个因子(10000个因子随机取1000个因子)场景,要能从海量因子数据尽可能高速并精准读取数据,减少无效 IO ,并以需要方式(通常是因子面板模式...下文中,将基于高频多因子存储场景,为大家介绍一个基于 DolphinDB 实现因子库和因子存储方案,对比不同存储模式下性能。...为了方便用户计算因子,DolphinDB 实现了所有 191 个因子函数,并封装在模块 gtja191Alpha 。...2、更新因子:量化投研,重新计算因子数据是常见场景。...直播,我们将进一步为大家介绍更丰富因子库,并使用更贴近实际用户生产环境硬件配置和数据量来进行测试,以提供可以参考性能基准。

1.6K20

Alertmanager对接Loki实现日志告警 | 坑我已经帮你们踩好了

为什么要创建名为fake文件夹,这个因为Loki定义单租户Loki系统,fake为其默认租户名,如果是多租户系统,则/monitor/loki/rules 下多个其他名字文件夹也可以。...: {{ $labels.filename }}" annotations: summary: Too many election logs in dolphindb logs...description: 10分钟之内DolphinDB日志内election日志出现10次以上 重启Loki,重启脚本在上一篇推文中有写到。...值得注意是,修改rule配置文件并不需要重启Loki,在Loki运行日志里面可以看到如下日志,提示rule文件正在被修改 如果不确定rule表达式写是否正确,可以在Grafana先进行预跑,.... - job_name: dolphindb-datanodelog static_configs: - targets: - localhost labels: #

5K41

随机森林 – Random forest

随机森林属于 集成学习 Bagging(Bootstrap AGgregation 简称) 方法。如果用图来表示他们之间关系如下: ? 决策树 – Decision Tree ?...当我们进行分类任务时,新输入样本进入,就让森林中每一棵决策树分别进行判断和分类,每个决策树会得到一个自己分类结果,决策树分类结果哪一个分类最多,那么随机森林就会把这个结果当做最终结果。...注意整个决策树形成过程没有进行剪枝。 按照步骤1~3建立大量决策树,这样就构成了随机森林了。...本文对 scikit-learn、Spark MLlib、DolphinDB、XGBoost 四个平台随机森林算法实现进行对比测试。评价指标包括内存占用、运行速度和分类准确性。...测试过程及说明忽略,感兴趣可以查看原文《随机森林算法 4 种实现方法对比测试:DolphinDB 速度最快,XGBoost 表现最差》 随机森林 4 个应用方向 ?

1.2K10

预算 630 万、275 万标:智臾科技投诉称涛思数据涉嫌提供虚假材料谋取中标

浙江智臾科技有限公司(DolphinDB)未通过初审: 符合性审查未通过:未提供时序数据库“集群节点数要求”有效证明材料。...浙江智臾科技有限公司(以下称投诉人) 被投诉人:中央国家机关政府采购中心(以下称国采中心) 当事人:中国地震台网中心 相关供应商:北京涛思数据科技有限公司(以下称涛思公司) 四、基本情况 投诉人因对国采中心就本项目作出质疑答复不满...五、处理依据及结果 根据《政府采购质疑和投诉办法》(财政部令第94号)第二十九条第(二)项规定,投诉事项1、2、3缺乏事实依据,驳回投诉。 财 政 部 2022年5月26日

70040

11年逆袭,寒门专升本职高生终成MIT博士生!自学CMU课狂发5篇顶会,全网热议

论文地址:https://dl.acm.org/doi/10.1145/3448016.3452819 离开腾讯之后,周信静又来到了知名数据库公司DolphinDB。...在入职之后,便直接让他以实习生身份参与到了DolphinDB分布式时序数据库内核研发当中。 期间,团队在用哈希方法来改进SQL引擎分组计算性能时,遇到了瓶颈。...回顾这段经历时,周信静总结道:在DolphinDB实习时,自己发现了AndyDB课程,被深深吸引。 他希望能将经典idea应用到DB系统里,甚至创造一些idea。因此,他研究生入坑了DB。...v=8e8KMnGKHwE 从视频可以看出,他英文口语水平也是极佳。...在这项工作,来自MIT、威斯康星大学麦迪逊分校和谷歌团队提出了一种2-Tree结构,从而解决现有方法在管理大于内存索引时存在局限性。

45920

国货之光:时序数据库与图数据库最新排名

DB-Engines根据数据库当前受欢迎程度进行排名,主要使用以下参数来衡量一个系统受欢迎程度: 该系统在网站上被提及次数:以搜索引擎查询结果数量来衡量。...大众对系统感兴趣程度:对于这个度量,我们使用谷歌趋势搜索频率。...工作JD中提到系统数量:我们使用是领先工作搜索引擎Indeed和Simply Hired上招聘数量。 在职业社交网站:专业人士简历系统被提及数量。...在榜单前20我们也看到了来自国内数据库DolphinDB和TDengine,能够在这样一份主要基于英文媒体及网站为统计源榜单,在众多数据库挤入前20,也确实是实力象征。...当然Neo4j依然霸榜,榜单前10也有阿里云发布GraphDB,及维加星信息科技发布TigerGraph。 希望以上榜单能够给大家在实际应用选型时有个参考。

2.5K50

Python常用函数合集2—where函数

本文和你一起探索Python常用函数合集,让你以最短时间明白这些函数原理。 也可以利用碎片化时间巩固这些函数,让你在处理工作过程更高效。...本文目录 where函数定义 where函数实例 一、where函数定义 where函数是numpy库,通常需要先加载numpy库,再调用该函数。...函数基本调用语法有两种,一种是: import numpy as np np.where(arry) 此时,np.where函数输出arry“真”值坐标(‘真’也可以理解为非0)。...或者说np.where函数从arry返回满足特定条件元素。比如,它会返回满足特定条件数值索引位置。...例4:数列是2倍数取一个值,否则取另一个值 y = np.array(range(1, 10)) print(y) print(np.where(np.mod(y, 2)==0, '2b', 'n_

48440

对比Excel,用Pandas轻松搞定IF函数操作

在 Excel IF 函数是最常用函数之一,它可以对值和期待值进行逻辑比较。因此IF 语句可能有两个结果:第一个结果是比较结果为 True,第二个结果是比较结果为 False。...0,"不及格";60,"及格";90,"高分"}) # 性别标识 =LOOKUP(E2,{0,"女";1,"男"}) LOOKUP技巧 需要注意是,LOOKUP条件是向后兼容哈 3....(df['性别']==0, '女性', '男性')) data.insert(0,'姓名', df['姓名']) data 输出结果 以上实现方案,用到两个where函数,其实就和excel里...和ExcelIF函数更接近其实就是np.where这个函数,如果条件满足则赋值x,否则赋值y。...']==0, '女性', '男性') 需要注意是,这里咱们对性别标识处理稍微区别于开头完整代码,大家知道为什么可以这么写吗?

1.8K20

完整图解:特征工程最常用四个业务场景演示

数据检测、筛选、处理是特征工程中比较常用手段,常见场景最终都可以归类为矩阵处理,对矩阵处理往往会涉及到 阈值处理 特征拼接、记录拼接 多条记录筛选包含特定值记录 取top N值 对于矩阵处理没有趁手兵器可不行...主要使用函数有,np.vstack, np.hstack, np.where, df.loc, heapq.nlargest。这几个方法应用已经基本上满足矩阵处理大部分需求。...思路应该是: 定位label==4分别在第几行,或者说index等于多少,获取这样一列数组 根据得到index数据,分别从matrix取出。...np.where函数能够得到满足条件index. np.where(trains[:,-1]==4) ? 从输出来看可以看到,第0行,7行,...299行label等于4....import pandas as pd df=pd.DataFrame(trains) results=df.loc[np.where(trains[:,-1]==4)] pandasloc接口,可以根据给定行索引直接获取行数据

1K20

如何使用Python找出矩阵中最大值位置

通过np.max和np.where通过np.max()找矩阵最大值,再通过np.where获得最大值位置,测试如下:a = np.random.randint(10, 100, size=9)a =...代码r, c = np.where(a == np.max(a))作用是找到数组a最大值,并确定该最大值所在行和列。...np.max(a)返回数组a最大值,然后np.where(a == np.max(a))返回一个包含最大值位置索引元组。这个元组被解包给了变量r和c,其中r表示行索引,c表示列索引。...然后,我们使用np.argmax(a)函数来找到数组a最大值,并返回其在展平(flatten)数组索引。np.argmax函数返回数组中最大值索引,我们在这里直接将结果保存在变量m。...第二种方法优点:使用了np.argmax()函数,直接找到展平数组最大值索引,避免了使用np.where()函数额外操作。使用了divmod()函数,将索引转换为行索引和列索引,代码更简洁。

71310
领券