首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

MLQuant:基于XGBoost金融时序交易策略(附代码)

在这篇文章我们将一系列资产时间序列数据分解成一个简单分类问题,看看机器学习模型能否更好地预测下一个周期方向。目标和策略是每天投资一项资产。...()函数应用于它,而不会出现资产类任何重叠或混合,我们这样做是为了为每个周期创建时间序列特征。...为了创建时间序列变量,我们使用tsfeatures包,但也有个feasts包在这里。...——此时应执行适当交叉验证,但是由于时间序列交叉验证非常棘手,R没有函数可以帮助这种类型交叉验证。我们将在后面的文章给读者介绍其方法。 一旦模型被训练好,我们就开始做预测。...() return(preds) } 我们可以应用上述模型来创建时间序列特征,通过运行以下内容对我们每项资产进行训练和测试。

2.7K41

R 机器学习预测时间序列模型

机器学习在时间序列数据上应用 随着疫情变化,急性传染病数据经常会随时间变化,我们通过对每天传染病记录,就形成了时间序列数据,周期可以是天,周,月,年。...modeltime通过将tidymodels机器学习软件包生态系统集成到简化工作流进行tidyverse预测来实现此目的。modeltime结合了机器学习模型,经典模型和自动化模型等。...这里只需要日期与当日使用量“date” and “value”。然后可以简单绘制一下。 注意这里时间序列tibble格式。...该过程使用“日期”列创建了我要建模45个新列。这些列包含了时间序列详细信息及傅立叶变化数据。...现在我们有了几个时间序列模型,让我们对其进行分析,并通过模型时间工作流程预测未来变化趋势。 Modeltime使用ID来定位我们之前建立模型,帮助我们识别模型。

87430

R入门?Tidyverse学起!

数据整理 tibble格式 R对多变量数据标准保存形式是 dataframe,而tibble是dataframe进化版,它有如下优点: 1....数据操作速度会更快 如下图,直接查看tibble格式数据,可以一目了然看清数据大小和每列格式 ? 有两种方式来创建tibble格式数据 1. 直接创建 ? 2....x %>% f(y) means that x is‘piped’ into the function f(x,y) R自带iris(鸢尾花数据集)为例: ?...统计:broom broom是一个用于数学建模包,回归分析为例,R各种回归分析往往不会返回一个整齐data frame结果,而broom 则帮助我们直接将统计结果转化为data frame格式直接将统计结果转化为...当然,入门之后如果使用者在未来需要使用R完成更细腻分析时,再分配较充足时间学习base R

2.5K30

TidyFriday 如何编写一个自动获取和展示疫情数据 R 包?

创建一个 R 包开发 Project 运行: usethis::create_package("~/Desktop/ncov") 即可在 ~/Desktop/ncov 位置创建一个 R项目了,...查看创建项目文件夹 我们可以桌面上找到这个文件夹: ?...这个目录结构是这样: $ tree . ├── DESCRIPTION ├── NAMESPACE ├── R └── ncov.Rproj 接下来操作我们只需要关注这两个文件(夹):DESCRIPTION...使用非常简单,这里我只声明了 public 对象,然后使用 initialize 方法为所有的 public 对象进行赋值。...编写 ncov 包 DESCRIPTION 文件 使用下面的命令把该包依赖 R 包写入 DESCRIPTION 文件 Imports 字段下: for(pkg in c("jsonlite",

1K10

R数据科学整洁之道:使用 tibble 实现简单数据框

install.packages('tidyverse') 创建 tibble 因为 tibble 是 tidyverse 标准功能之一,所以 tidyverse 几乎所有函数都可以创建 tibble...tidyverse 许多函数都可以创建 tibble,因为 tibble 是 tidyverse 标准功能之一。 可以通过 tibble() 函数使用一个向量来创建tibble。...可以在 tibble 中使用在 R 无效变量名称(即不符合语法名称)作为列名称。例如, 列名称可以不以字母开头,也可以包含特殊字符(如空格)。...,如果想要访问列不存在,它会生成一条警告信息。...tibble 不能进行部分匹配,如果想要访问列不存在,它会生成一条警告信息。 tibble 打印时更美观。

1.6K10

基于 mlr 包 K 最近邻算法介绍与实践(上)

tidyverse 是一个 “专为数据科学设计 R 包集合”,创建目的是让 R 数据科学任务更简单、更人性化、更可复制。 本期将先从常用 k 近邻算法 出发!...KNN 算法基本要素 KNN 算法,所选择邻近实例都是已经正确分类对象,该算法只依赖于最邻近一个或者几个实例类别来决定待分样本所属类别,分类器不需要使用训练集进行训练,训练时间复杂度为 0,...即若训练集中文档总数为 n,那么 KNN 分类时间复杂度为 O(n)。...应用举例 本文将先介绍 mlr 包 KNN 算法使用方法, mclust 包 diabetes 数据集为例。...3.1 加载数据 library(mclust) library(tibble)#属于 tidyverse,合理方式组织和显示数据 data(diabetes, package = "mclust"

2.1K21

《高效R语言编程》6--高效数据木匠

与基本R类似函数不同,变量无需使用 $ 操作符就可直接使用,设计与magrittr包%>%管道操作符一起使用,允许每个数据阶段写成新一行。其是一个大型包,本身可以看成一门语言。...改变列分类 R对象类是性能关键,as.numeric()、data.matrix()等改变类,或者vapply(data, class,chracter(1))。...,数据库是硬盘获取数据。...RODBC是一个资深包,提供R与SQL server接口。DBI包提供了通用接口与驱动程序类集,如RSQLITE,是访问数据库统一框架,允许其他驱动程序模块包添加。...数据库与dplyr 必须使用src_*()函数创建一个数据源。# 使用data.table()处理数据 是dplyr替代,两个哪个好存在争议,最好学一个一直坚持下去。

1.9K20

R语言中生存分析Survival analysis晚期肺癌患者4例

癌症例子 手术到死亡时间 治疗开始到进展时间 响应到复发时间 其他领域例子 事件发生时间数据在许多领域都很常见,包括但不限于 艾滋病毒感染到艾滋病发展时间 心脏病发作时间 药物滥用发生时间...数据中提供了观察时间和事件指示 时间天为单位生存时间(YiYi) 状态:审查状态1 =审查,2 =死亡(δiδi) 在R处理日期 数据通常带有开始日期和结束日期,而不是预先计算生存时间。...创建一个生存对象。对于每个主题,将有一个条目作为生存时间,+如果主题是经过审查,则后面跟一个。...界标方法零假设是,界标生存过程不依赖于界标的响应状态。 Anderson, J., Cain, K., & Gelber, R. (1983)....tmerge 为每个患者不同协变量值创建一个具有多个时间间隔长数据集 event 创建事件指示器,与新创建时间间隔一致 tdc 创建时间相关协变量指标,与新创建时间间隔一致 时间相关协变量

1.7K10

R数据科学|第七章内容介绍

本文将介绍tidyverse核心R包之一——tibble创建tibble 使用as_tibble()函数直接将数据转换成tibble形式。...通过tibble()函数使用一个向量来创建tibbletibble() 会自动重复长度为 1 输入,并可以使用刚刚创建新变量。...1 2 #> 2 2 1 5 #> 3 3 1 10 #> 4 4 1 17 #> 5 5 1 26 可以在 tibble 中使用在 R 不符合语法名称作为列名称。...( ~ 开头)定义,数据条目逗号分隔,这样就可以用易读方式对少量数据进行布局。...取子集 提取方式相同,但tibble 更严格:它不能进行部分匹配,如果想要访问列不存在,它会生成一条警告信息。 [[ 可以按名称或位置提取变量;$ 只能按名称提取变量。

1K30

使用 ncov 包获取并分析疫情数据

昨天推文里,我介绍了开发一个最简单 R工作流程,相信不少同学已经对 R开发流程有所了解了,今天我们就用这个 ncov 包获取疫情数据然后分析分析吧!...,初始化过程中所有的数据都会准备好存储在 df : df <- ncov$new() # 可以查看 df 所属类 class(df) #> [1] "ncov" "R6" 可以看到 df 是一个...ncov 类,而这个类是基于 R6 类进行封装,下面再看下这个对象存储数据,首先是一些字符串: # 当前时间: df$times #> [1] "截至2月8日12时08分"# 确诊人数 df$confirm...sweep 包提供了一套时间序列预测整洁工具(tidy tool),首先我们加载需要一些包: library(sweep) library(forecast) library(timetk) library...(sweep) 去除 R0DF 第一列: R0DF <- R0DF[,2:3] 建模预测: # 根据 R0DF 生成一个时间序列,start 不重要,等下再处理 R0TS <- tk_ts(R0DF

1.3K20

R数据科学|3.5内容介绍及习题解答

创建新变量多种函数可供你同mutate()一同使用。...偏移函数:lead()和lag()函数 它们可以返回一个序列领先值和滞后值。它们可以计算出序列移动 差值(如 )或发现序列何时发生了变化 () 。它们与group_by()组合使用时特别有用。...= 如果需要进行一系列复杂逻辑运算,那么最好将中间结果保存在新变量,这样就可 检查是否每一步都符合预期。 排秩 min_rank()可以完成最常用排秩任务(如第一、第二、第三、第四)。...在这种情况下,时间差异应该是24小时(1,440分钟)。有些航班跨越时区,总飞行时间将以小时(60倍数)为间隔。所有航班都是纽约起飞,都是美国国内航班。...,生成与较长向量相同长度向量。

2.5K50

R语言中生存分析Survival analysis晚期肺癌患者4例

时间天为单位生存时间(YiYi) 状态:审查状态1 =审查,2 =死亡(δiδi) 在R处理日期 数据通常带有开始日期和结束日期,而不是预先计算生存时间。...第一步是确保将这些格式设置为R日期。 让我们创建一个小示例数据集,其中sx_date包含手术日期和last_fup_date上次随访日期变量。...创建一个生存对象。对于每个主题,将有一个条目作为生存时间,+如果主题是经过审查,则后面跟一个。...界标方法零假设是,界标生存过程不依赖于界标的响应状态。 Anderson, J., Cain, K., & Gelber, R. (1983)....tmerge 为每个患者不同协变量值创建一个具有多个时间间隔长数据集 event 创建事件指示器,与新创建时间间隔一致 tdc 创建时间相关协变量指标,与新创建时间间隔一致 时间相关协变量

1.2K10

Highcharter包制作交互图表

下面是因INFORnotes分享 Highcharter是基于HighCharts javascript库及其模块R包。...这个包主要功能是:可以创建交互式各种图表,如散点图、气泡图、时间序列、热图、树形图、条形图等;支持各种R对象;支持Highstocks图表、Choropleths;支持管道方法和各种各样主题与外观...Highcharter有两个主要函数:数据创建图表,向现有对象添加数据。...hchart():一个泛型函数,它接受一个对象(如向量、时间序列、数据框、likert对象等)并返回一个对象(chart),和ggplot2qplot()用法类似。...hc_add_series():根据数据类型将数据添加到现有对象通用函数,和ggplot2geom_类似。 hcaes():和ggplot2ase()用法相似。

1.1K20

学习R语言,一篇文章让你懵圈到入门

broom:用于将统计模型结果整理成数据框形式 zoo:定义了一个名zooS3类型对象,用于描述规则和不规则有序时间序列数据。...geoms ggradar:绘制雷达图 ggTimeSeries:时间序列数据可视化 ggtree:树图可视化 ggseas:季节调整工具 lattice:生成栅栏图 rgl:交互式3D绘图...tibble:高效显示表格数据结构 stringr:一个字符串处理工具集 lubridate:用于处理日期时间数据 xts:xts是对时间序列数据(zoo)一种扩展实现,提供了时间序列操作接口。...rmarkdown :用于创建可重复性报告和动态文档 knitr:用于在PDF和HTML文档嵌入R代码块 flexdashboard:基于rmarkdown,可以轻松创建仪表盘 bookdown:...详见统计之都文章 R6:R6是R语言一个面向对象R包,可以更加高效构建面向对象系统。

3.6K60

基于R语言股票市场收益统计可视化分析|附代码数据

我们将其转换为xts对象。...at Risk)和回测分析股票数据R语言GARCH建模常用软件包比较、拟合标准普尔SP 500指数波动率时间序列和预测可视化Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用MATLAB...用GARCH模型对股票市场收益率时间序列波动拟合与预测R语言GARCH-DCC模型和DCC(MVT)建模估计Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列R语言中时间序列分析模型...R语言时间序列GARCH模型分析股市波动率R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测matlab实现MCMC马尔可夫转换ARMA - GARCH模型估计Python使用GARCH...模型对金融时间序列数据建模R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析R语言多元Copula GARCH 模型时间序列预测R语言使用多元AR-GARCH模型衡量市场风险R语言中时间序列分析模型

1.7K00

学习R语言,一篇文章让你懵圈到入门

broom:用于将统计模型结果整理成数据框形式 zoo:定义了一个名zooS3类型对象,用于描述规则和不规则有序时间序列数据。...geoms ggradar:绘制雷达图 ggTimeSeries:时间序列数据可视化 ggtree:树图可视化 ggseas:季节调整工具 lattice:生成栅栏图 rgl:交互式3D绘图...tibble:高效显示表格数据结构 stringr:一个字符串处理工具集 lubridate:用于处理日期时间数据 xts:xts是对时间序列数据(zoo)一种扩展实现,提供了时间序列操作接口...:R Markdown为基础,用于创作书籍和长篇文档 rticles:提供了一套R Markdown模板 tufte:用于实现Tufte讲义风格R Markdown模板 DT:用于创建交互式数据表...详见统计之都文章 R6:R6是R语言一个面向对象R包,可以更加高效构建面向对象系统。

3.7K40

玩转数据处理120题|R语言版本

R语言解法 # R没有字典概念,故直接创建dataframe/tibble #> 第一种 df <- data.frame( "grammer" = c("Python","C","Java","...df %>% tibble::column_to_rownames('createTime') 42 数据创建 题目:生成一个和df长度相同随机数dataframe 难度:⭐⭐ R解法 df1...R解法 df %>% ggplot(aes(`涨跌幅(%)`)) + geom_histogram(bins=30) 61 数据创建 题目:data列名创建一个dataframe 难度:⭐⭐...0, 99, 5)") 84 数据创建 题目:NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个指定分布(如标准正态分布)R语言解法 df3 <- as.data.frame...:CSV文件读取指定数据 难度:⭐⭐ 备注 数据1前10行读取positionName, salary两列 R语言解法 #一步读取文件指定列用readr包或者原生函数都没办法 #如果文件特别大又不想全部再选指定列可以用如下办法

8.7K10
领券