supported','\n') } 股票曲线 我们使用滞后函数将时间序列移动一个位置,因此我们使用前一天的价格来做决定 pos 0,1...,-1) pos <- Lag(pos) pos[1] <- 0 正确的股票曲线 交换位置 注意到这个策略在所有四个股票上都表现不佳,但在其中三个股票上表现特别差。...这表明对策略进行了明显的改变:做完全相反的事情,即交换多头和空头交易,如下所示 pos 0,1,-1) 切换式股票曲线 ---- 【视频...如果我们成功了,我们就可以在价差远远低于其平均值时买入价差(做多廉价产品,做空昂贵产品),在价差高于其平均值时卖出价差。 连续积分理论正是处理平稳的时间序列的线性组合,但我们不会去研究数学。...# RSI 策略 pos <- long + short pos <- Lag(pos); pos[is.na(pos)] <- 0 return(pos) } 样本内和样本外回测 resultsIn
滑点--我们回顾一下什么是滑点,我们探讨在交易策略中考虑滑点的问题 - 使用价差的策略,它是两个价格时间序列的线性组合 简单的策略:模仿策略- 如果收盘价高于开盘价,则在第二天买入- 否则,在第二天卖出我们希望这个策略在什么时候能发挥作用...')} 复制代码股票曲线 我们使用滞后函数将时间序列移动一个位置,因此我们使用前一天的价格来做决定pos 0,1,-1)pos 0,1,-1)复制代码切换式股票曲线移动标准差和布林带类似于移动平均线...如果我们成功了,我们就可以在价差远远低于其平均值时买入价差(做多廉价产品,做空昂贵产品),在价差高于其平均值时卖出价差。连续积分理论正是处理平稳的时间序列的线性组合,但我们不会去研究数学。...# RSI 策略 pos <- long + short pos <- Lag(pos); pos[is.na(pos)] <- 0 return(pos)}复制代码样本内和样本外回测resultsIn
群内反馈助教解决 RStudio安装失败,怎么解决?...报错了 不知道有没有什么解决的方法 或者有没有什么可以用来拼png格式的包?...不行 如何检查数据框中的NA,只能肉眼去看吗? 函数,is.na,加table来检查 我的R是3.6版本的 经常装包出现上面这种情况 用conda装包会简捷一些么?...你在把数据读入到R的时候,需要设置一下读取的参数 只写函数名,不打括号,可以看写函数的代码 大家好,我在做探针注释的时候,用getGEO和idmap得到的探针/基因名的数据框差别很大,请问有同学知道是哪里出问题了吗...dat=Log2(CPM+1),画热图包括做后续的分析,用的是CPM的数据,并且是取过log的,但是差异分析和这个是没有关系的,后面那是可视化,还有做后续分析用的差异分析,用的就是原始的count数据。
它兼具线性模型求解器和树学习算法。因此,它快速的秘诀在于算法在单机上也可以并行计算的能力。这使得xgboost至少比现有的梯度上升实现有至少10倍的提升。它提供多种目标函数,包括回归,分类和排序。...3、模型的交互性 能够求出目标函数的梯度和Hessian矩阵,用户就可以自定义训练模型时的目标函数 允许用户在交叉验证时自定义误差衡量方法,例如回归中使用RMSE还是RMSLE,分类中使用AUC,分类错误率或是...2、one-hot encode 独热编码——独有的数据结构 参考:[译]快速上手:在R中使用XGBoost算法 这个词源于数字电路语言,这意味着一个数组的二进制信号,只有合法的值是0和1。...如果它被设置为一个正值,它可以帮助更新步骤更为保守。通常不需要此参数,但是在逻辑回归中当分类是极为不均衡时需要用到。将其设置为1 - 10的价值可能有助于控制更新。参数范围是0到∞。...λ默认值假设是1和α= 0。 lambda_bias : L2正则化项在偏差上的默认值为0。
1.R与Rstudio 主要是学习到了会创建project啊,之前不会如此高效整理自己的项目....都是直接复制粘贴代码进去,所以各种报错,唉。...如果打函数时,遇到比较长需要自动补齐的函数,在出现选项时,可以直接上下键来挑选,然后点Tab或者enter键自动补齐 老师推荐了一个everything的软件,找东西比电脑内带的快很多。...ggplot2和example(ggplot2) 5.进阶知识 如果有什么包装不上,什么空间原因,可能是包的版本更新了,直接去原始的包存放的地方删掉这个包,重新装就好了。...那是1.删掉有缺失值的样本还是2.使缺失值在分组中也是缺失值呢?目前我两种方法好像都不会欸,找一找。...最后发现不管怎样删除都不行了,数量为什么会不对等呢。 ? 然后我直接返回前面去没有删掉缺失值不取年龄分组,然后继续做下去,发现也得不到后面的图,卒。 ?
如果我们可以通过删除有效的代码来缩小问题代码的范围,则可以更快地迭代解决方案。这是我一直使用的技术。 阅读错误追踪 每个错误都伴有一个追溯或调用堆栈,它实际上是追溯导致该错误的调用堆栈。...例如,采取以下简单的调用顺序:f() 调用 g() 调用 h(),而 h() 使用了乘法操作。...此功能可以在发生错误之后以交互方式运行以查看导致错误的调用顺序。我们无法在 Shiny 中使用此功能,因为我们无法在应用运行时以交互方式运行代码,而是 Shiny 会自动为我们打印调用堆栈。...例如,以使用我上面定义的 f() 函数的简单应用程序为例: library(shiny) ui <- fluidPage( selectInput("n", "N", 1:10), plotOutput...接下来的几个功能是内部的,我们可以忽略它们。 最后,在最底部,我们将看到编写的代码函数。
对于统计学家来说,离群值和缺失值通常是一个棘手的问题,如果处理不当可能会导致错误。离群值可能会导致我们的结果偏离真实结果,而缺失值造成的信息损失可能会导致建模失败。...因此,在执行数据分析之前,正确识别离群值并处理缺失值非常重要。本推文讨论的内容应该在建模之前执行。虽然本推文在整个统计模型系列中较为置后,却至关重要,望警醒。 ? 01 离群值的识别 什么是离群值?...()和max()函数返回对象的最小值和最大值。...自定义函数只有两个参数,第一个参数是数据集的名称,第二个参数是变量名;只要正确替换数据集和变量名,读取就可以直接运行代码。...R中的数值变量和字符变量使用相同的缺失值符号。R提供一些函数来处理缺失值。要确定向量是否包含缺少的值,可以使用is.na()函数。“is.na()”函数是用于确定元素是否为na类型的最常用方法。
生存分析,大多就是说的KM方法估计生存函数,并且画出生存曲线,然后还可以根据分组检验一下它们的生存曲线是否有显著的差异。 在R中,有个包survival做生存分析就很方便!...既然是要说明如何对任意癌症的任意基因做生存分析,那么我们首先需要理解cgdsr下载TCGA任意数据的用法(见之前的教程),下面的例子是获取TCGA数据库的乳腺癌的BRCA1和BRCA2基因的表达,以及涉及到的病人的临床资料...虽然上面我挑出的临床信息还有很多,但是我们只需要用到OS_MONTHS和OS_STATUS就可以来估计KM生存函数,画出最简单的生存曲线!...如果在生存期上有小幅度的提高,可以认为是有意义的临床受益证据。作为一个终点,生存期应每天进行评价,可通过在住院就诊时,通过与患者直接接触或者通过电话与患者交谈,这些相对比较容易 记录。...img 可以看到这个survminer包对生存分析可视化的效果很赞,之所以可以显示P值,是因为我们的survfit函数已经做了检验,返回的kmfit这样的对象里面本身就含有非常丰富的信息,大家可以自行摸索
1.勤做记录、多记笔记、学好思维、勤复习!2.耐心学基础、多练习、多思考!3.要听话!练习和思考ppt上的内容!...【学习的好处】然而使用R语言与Rstudio最大的好处就是能批量处理数据和画图!突出批量处理的效率!【我们需要了解的知识】什么是函数?数据要怎么组织?...【梳理正确观念】文件在哪也很重要代码正确也很重要代码的顺序也很重要【从第一行开始运行&不能强行任意行运行】代码报错了,不代表代码错了可能文件没放对位置、包装错了、环境错了处理报错,是数据分析的常态!...【最初了解Rstudio步骤】最初学习的步骤:安装R包--读写文件--函数与数据有什么规则【安装R包出现的问题】按照上课需要,安装了一些R包,而R包是需要install(安装)后,在console(控制台中...且要打引号逻辑型:true-Tfalse-FNA-缺失值【未知】class()函数,判断什么内容放在括号内class(T)1 "logical"class(0)1 "numeric"class("a")
转换列:基础部分 您可以使用mutate()函数创建新列。 mutate中的选项几乎是无穷无尽的:你可以对普通向量做任何事情,可以在mutate()函数内完成。...使用ifelse(),首先指定一个逻辑语句,然后在语句返回“TRUE”时需要发生什么,最后如果它是“FALSE”则需要发生什么。...如果我想在几分钟内完成,我可以使用mutate_at()并将包含列的所有'sleep'包装在vars()中。 其次,我在飞行中创建一个函数,将每个值乘以60。...如上所述,ifelse()采用逻辑表达式,然后如果表达式返回“TRUE”则该怎么办,最后当它返回“FALSE”时要做什么。...不幸的是,似乎没有简单的方法让case_when()返回一个有序的因子,所以你需要自己做,之后使用forcats :: fct_relevel(),或者只是一个因子()函数。
电梯有(1)或没有电梯(0)(数值) 五年期:业主拥有不到5年的财产(数字) 数据清理、特征创建 从最初的数据看: 从网址上,我发现它有位置信息,如chengjiao/101084782030。...我既不能在建模中使用这个特性,也不能删除NA,但它也会减小数据帧的大小。...ifelse(is.na(df$DOM),median(df$DOM,na.rm=T),df$DOM) 用于将数字转换为类别的自定义函数 对于某些特征,需要一个函数来处理多个标签,对于其他一些特征(客厅...any(is.na(df3)) ## [1] FALSE 探索性分析 由于有数字和分类特征,我将使用的EDA技术有: 数值:相关矩阵 分类:箱线图和地图 我们必须关注价格(单位价格/单位价格)以及总价格..."MSE: 15952.845934 RMSE : 126.304576 R2 :0.795874" 所以看起来残差还不错(分布是正态的,以0为中心),但对于低价格来说似乎失败了。
现在我们来看一下以下示例: if 1>10: 以上代码使用了if关键字,之后接上了一个条件,这个条件是1>10;我们现在先别管条件是怎么写,刚刚说了,条件满足后将会触发指定的流程。...以上表现形式中使用了#号来修饰一些说明,这是什么东西?这是表示这是注释,注释表示这一行或者这一块代码的说明,方便你进行查看解释的标注,在通过解释器时并不会去翻译使用#号标注的内容。...("是其它数") 以上示例中,在使用了if判断值是否是1,使用两个等于号“==”表示判断左右两边的值是否相等,在python中使用一个等于“=”表示赋值;假设值等于1则输出"输入的是1",假设需要判断是否输入的值等于...) else: print("错了") 以上示例中使用了and运算符,表示“与”;and运算发坐标为一个条件(表达式)右边也是一个条件,首先判断坐标条件a是否小于10,如果成立则判断右边a除2取余数是否为...0: print("打开盒子") else: print("错了") 假设我输入一个值100,它是大于10的条件1不成立,但是它却可以被2整数余数为0,在使用or的情况是会显示“打开盒子
原来图的函数用错了,是boxplot ? 可以使用ggplot2画更高品质的图。...,来保证系统上的正确(否则,名字中的空间可能变为.)。...= 0) [1] 865 一些图形函数 par()函数用来设置和查询图形参数,mar, mfcol,mfrow最常用。打印边距的大小是以文本行为单位来衡量的。...= 0))/length(x)}) > cutoff),]) 4.1.7 其他有用的R函数 转置t() 分类和排序 sort() #升序,降序可用rev(sort()) order() #返回的是一个序号向量...正则表达式中,R语言的通配符$,*等,如果匹配它们需要用"\",如果匹配“\”,得上“\\”了。其他的还是和别的语言一致的。 ?
左边的 请问一下,r code里面提到使用镜像是什么意思,不用镜像会有什么影响么 不使用下载速度会慢,甚至失败。如果你人在海外的话,在自己的电脑上安装,建议找一个离自己近的镜像地址。...,这个公式的0是什么含义呢?...你现在C盘还有多少空间,一般有10G就够用了,如果你现在用着没什么问题,也可以,只是以后可能会遇到问题。现在改的话卸载重装就好 老师,请问一下现在有问题还是在腾讯文档里截图反馈吗?...但是不加载的话,后面的函数为什么能用? 你不加载 r不知道你要用啥函数,但你指定了具体的R包,他就知道了 老师,想请教个问题,数据b的结构和代码如图。...不大 老师我想写一个当i=1时返回Hi,当i>1时返回i的命令,您能帮我看看哪里出问题了吗,谢谢 这里是多了一个fi 读取文件使用 fread函数 安装clusterProfiler遇到的问题。
电梯有(1)或没有电梯(0)(数值) 五年期:业主拥有不到5年的财产(数字) 数据清理、特征创建 从最初的数据看: 从网址上,我发现它有位置信息,如chengjiao/101084782030。...我既不能在建模中使用这个特性,也不能删除NA,但它也会减小数据帧的大小。...ifelse(is.na(df$DOM),median(df$DOM,na.rm=T),df$DOM) ---- 点击标题查阅往期内容 01 02 03 04 用于将数字转换为类别的自定义函数...any(is.na(df3)) ## [1] FALSE 探索性分析 由于有数字和分类特征,我将使用的EDA技术有: 数值:相关矩阵 分类:箱线图和地图 我们必须关注价格(单位价格/单位价格)以及总价格... "MSE: 15952.845934 RMSE : 126.304576 R2 :0.795874" 所以看起来残差还不错(分布是正态的,以0为中心),但对于低价格来说似乎失败了。
这里可调整第二张图的调色板: ? 默认情况下是做这两张图,可能有小伙伴就会说,我这个第一张图只能随机生成颜色,可不可以为每个分类自定义颜色呢?...下面给大家简单讲讲我的设计思路。 设计思路 网页界面(ui.R) 因为这个网站的主要目的是作图,那么其实不难想到我们大概要分成四个板块,分别完成上传,预览数据,设置作图参数和绘图的功能。 ?...因为我想等按下按钮后再出现绘图区,所以这里使用了 uiOutput() 来生成绘图区 UI 。...下面开始写主程序,这里我只会介绍一些关键的代码片段,完整代码在最后。...= ""),"Please upload count file") ) reactable(counts()) }) 如果程序没有正确读取输入文件,会输出提示信息。
如果你想要在载入tidyverse包后仍然使用这些函数,你需要使用函数的全名stats::filter()和stats::lag()进行调用。...,这里适配地显示了在一个屏幕前几行和所有的列(我们可以使用View(flights)在Rstudio中查看数据集的所有信息。...R提供了标准的比较符:>,>=,<=,!=和==。 如果你是初学R,一个常见的错误是用=而不是==来检测相等。...NA 最简单理解为什么这是TRUE的方式是带入一点语境: # 把x看作小明的年龄,我们不知道他多大 x <- NA # 把y看作小红的年龄,我们不知道她多大 y <- NA # 小明和小红一样大吗...x == y ## [1] NA # 我们不知道 如果你想确定一个值是不是缺失了,使用is.na(): is.na(x) ## [1] TRUE filter()仅仅会包含条件是TRUE的行,把是
3.对Up DEM进行Cox风险回归分析(文章没有说用的什么数据去进行后续的COX回归分析,我推测出用的log2(x+1)进行分析,其实还可以用EdgeR包中的标准化好的logCPM进行后续分析,或者RPKM...()函数,对Expr这个数据框的行进行批量,然后返回的是每个miRNA在10个样本中的表达量是否>1的逻辑向量,TRUE还是FALSE #只取那些逻辑值为True的miRNA的表达量,过滤掉FALSE的...#文章使用筛选出的上调的DEMs做Cox生存分析,不需要Normal组了,只需要Tumor组 #2.1 提取上调的miRNA的表达量数据框,如果是对所有的上调和下调做Cox。...),rownames(BRCA_clinicaldata)),] #使用到match函数,match[A,B],A是被匹配的,B是要匹配的,返回的是Up_DEM_expr的列名(样本名)在BRCA_clinicaldata...没有说预测是几年的 我下面分别用了两个函数 rm(list = ls()) #### 魔幻操作,一键清空~ options(stringsAsFactors = F)#在读入数据时,遇到字符串之后,
如果面对任何Web数据获取问题,你都不假思索“上大锤”,有时候很可能是“杀鸡用了牛刀”。 在“别人准备好的数据”和“需要自己爬取的数据”之间,还有很宽广的一片地带,这里就是API的天地。...我们在浏览器里,看到上图中那一长串文字。你可能感觉很奇怪——这是什么玩意儿? 恭喜你,这就是我们需要获得的数据了。只不过,它使用了一种特殊的数据格式,叫做JSON。...JSON是目前互联网上数据交互的主流格式之一。如果你想搞清楚JSON的含义和用法,可以参考这个教程。 我们在浏览器里,初始只能看到数据最开头的一部分。...数据能够正常返回,下面我们在RStudio中采用语句方式来调用。 注意下面的代码中,程序输出部分的开头会有##标记,以便和执行代码本身相区别。 一上来,我们就需要设置一下时区。...与本文的介绍比起来,这些工具有什么特点?欢迎留言,把你的心得经验分享给大家,我们一起交流讨论。 如果你对我的文章感兴趣,欢迎点赞,并且微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。
3.7 分组新变量(和筛选器) 虽然与summarize()函数结合起来使用是最有效的,但分组也可以与mutate()和filter()函数结合,以完成非常便捷的操作。...一般不使用分组筛选器,除非是为了完成快速、粗略的数据处理,否则很难检查数据处理的结果是否正确。 在分组新变量和筛选器中最常使用的函数称为窗口函数(与用于统计的摘要函数相对)。...你可以在相应的使用指南中学习到更多关于窗口函数的知识:vignette("windowfunctions")。 习题解答 问题一 查看常用的新变量函数和筛选函数的列表。...使用 lag() 函数探究一架航班延误与前一架航班延误之间的关系。 解答 #计算同一机场前一航班的起飞延误。...is.na(dep_delay), !is.na(dep_delay_lag)) 下面绘制了前一航班所有值与平均延误之间的关系。
领取专属 10元无门槛券
手把手带您无忧上云