首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

问题之书-Rtudio中基础R问题汇总

问题之书 一、序 二、三、如何认识、组织和提出自己的问题 四、Rtudio中基础R问题汇总 已经太久没有遇到很基础性的问题,因此很多刚开始学代码时候的问题已经忘了。...如果数据是Excel弄好,有时候可能会多出来几行或者几列空的东西。这个在Excel里面是看不出来的。 R中读入文件的时候,read.table()或read.csv()最常用。...注意默认输出是有引号的,可用quote = FALSE去掉引号。另外还有一个新手会遇到的问题,输出的文件第一行和下面的内容会错一行。可使用col.names=NA,左上角会空一格,这样数据就对齐了。...sink固定模式如下: sink("out.txt") #第一行为自己命名输出文件的名字 file1 # 每一行跟一个要输出的文件,几个无所谓。...路径中有中文 虽然Rstudio可以识别中文,大部分时候没有问题,但是还是在一些情况下可能报错,比如开发R包的时候。如果确认是字符的问题,可以试试全英文路径。

64532
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R数据框一个有趣的小问题

    ') 然后如果想把第一行去掉,只保留第二行数据,我们一般的操作可以有两种 直接中括号减去第一行:test[-1,] dplyr的slice函数:slice(test,-1) 此时就发现了,第一种方法会只得到了一个向量...,而不是像第二种依然得到一个数据框 那么问题出在哪里呢?...首先是因为我们的数据框就只有2行1列,一共就2个单元格,去掉第一行,其实也就是只剩下一个单元格的元素了; 其次[] 这个符号,它其实也是一个函数,存在于base包中,它有一个默认参数drop = TRUE...如果剩下的内容是字符串,那么就直接返回字符串;如果剩下的还是一个数据框,那么就返回数据框) 这个函数其实也可以看帮助文档,只要在这种特殊符号的函数两边加上引号即可:?"...[" 【至于我是怎么知道的,因为我有个花花,她说她看了好几本R语言的书里面有提到】 最后的那个dplyr::slice ,当然就是将参数默认调整成了:drop = TRUE ,所以会返回数据框,而没有对数据进行降级

    5500

    深度 | 在 R 中估计 GARCH 参数存在的问题

    我们提交论文的期刊正在要求我们进行修订,其中一个修订是更好的示例应用(我们最初使用上述博客文章中讨论的工资 / 生产率数据,审稿人抱怨这些变量是被相同因素决定的(codetermined),所以使用一个对另一个做回归没意义...我在本文中强调的问题让我更加意识到选择在优化方法中的重要性。我最初的目标是编写一个函数,用于根据 GARCH 模型中的结构性变化执行统计检验。...这是一个我自认知之甚少的主题,如果 R 社区中的某个人已经观察到了这种行为并且知道如何解决它,我希望他们会在评论或电子邮件中告诉我。...也许我们的检验所要求的连续优化可以使用先前迭代中的参数作为初始值,从而有助于防止优化计算找到离群的、局部最优而全局次优的解。 虽然这使得问题比我最初想找一个我们检验的例子更难。...我现在正在计划检测 GARCH 模型中的结构性变化,但是仅涉及使用线性回归的示例(一个更易处理的问题)。但我希望听到别人对我在这里写的内容的意见。

    6.6K10

    深度 | 在R中估计GARCH参数存在的问题(续)

    本期作者:徐瑞龙 未经授权,严禁转载 本文承接《在 R 中估计 GARCH 参数存在的问题》 在之前的博客《在 R 中估计 GARCH 参数存在的问题》中,Curtis Miller 讨论了 fGarch...包和 tseries 包估计 GARCH(1, 1) 模型参数的稳定性问题,结果不容乐观。...rugarch 包的使用 rugarch 包中负责估计 GARCH 模型参数的最主要函数是 ugarchfit,不过在调用该函数值前要用函数 ugarchspec 创建一个特殊对象,用来固定 GARCH...不过当样本量极端大时,rugarch 的稳定性大幅改善,这似乎印证了机器学习中的一个常见观点,即大样本 + 简单算法胜过小样本 + 复杂算法。...为了解决非大样本情况下估计的稳定性问题,有必要找到一种 bootstrap 方法,人为扩充现实问题中有限的样本量;或者借鉴机器学习的思路,对参数施加正则化约束。

    2K30

    一个shell中诡异问题的解决

    前两天上线,同事碰见个shell脚本的问题,当时场景,异常诡异。...这个时候,sh命令的-x这个参数,就开始起作用了,他的意思是显示shell执行过程中的命令,通过执行,我们看到了区别,变量a的值,不是期待的AA,而是"AA\r", + a='AA\r' 不要小瞧\r,...\n是LF或ASCII中的0x0A(10),\r是CR或ASCII中的0x0D(13)。 问题来了,LF和CR是什么?...在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。...既然明确了问题,解决就很清晰了,可以在curl加个tr -d,就达到了删除\r,保证对的换行, a=`curl ... | tr -d '\r'` 在科学技术上,任何你看到的现象都会有他的原因,所谓存在即合理

    1.4K20

    Gitlab的使用中的一个小问题

    GitLab中的一个小问题 在团队合作开发的项目中,大家可能经常会用到GitLab,GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的web服务。...但是,正是这次“图省事儿”的环境导入,导致了一个奇怪的问题,见下图: ?...于是查询了一下GitLab的相关配置,仔细检查了代码Merge过程中的每一个细节。终于,在commit file的页面找到了问题所在,见下图: ? ?...到这里,问题就很明确了:Git---Commit文件的过程中,默认的Author是别人的账号,需要修改成自己的账号。...回过头来看,问题很简单,但是在实际探索的过程中还是花费了一些时间,所以把它记录下来,也算是积累一点儿工作经验吧。

    82320

    【R语言】R中的因子(factor)

    R中的因子用于存储不同类别的数据,可以用来对数据进行分组,例如人的性别有男和女两个类别,根据年龄可以将人分为未成年人和成年人,考试成绩可以分为优,良,中,差。...R 语言创建因子使用 factor() 函数,向量作为输入参数。...以下实例把字符型向量转换成因子: #构建一个字符串向量 x <- c("male", "female", "male", "male", "female") #构建因子 sex 的标签 #构建一个字符串向量 x <- c("male", "female", "male", "male", "female") x #设置因子水平为male和female #设置标签为...关于这个参数后面我们还会给大家举个更实际的,跟临床数据相关的例子。 R中的因子使用还是更广泛的,例如做差异表达分析的时候我们可以根据因子将数据分成两组。

    3.4K30

    【R语言在最优化中的应用】lpSolve包解决 指派问题和指派问题

    造纸厂到客户之间的单位运价如表所示,确定总运费最少的调运方案。 解:总产量等于总销量,都为48 个单位,这是一个产销平衡的运输问题。R代码及运行结果如下: ?...R中,lpSolve包提供了函数lp.assign() 来求解标准指派问题,其用法如下: lp.assign(cost.mat,direction = "min", presolve = 0, compute.sens...该公司应对5 家建筑公司怎样分配建筑任务,才能使总的建筑费用最少? ? 解:这是一个标准的指派问题。...在实际应用中,常会遇到各种非标准形式的指派问题,有时不能直接调用函数,处理方法是将它们化为标准形式(胡运权, 2007),然后再通过标准方法求解。...同运输问题一样,LINGO 在解决指派问题时,也必须通过各种命令建立数据集、模型、目标函数、约束函数等,比较繁琐,相比之下,R两三句代码就可以快速解决问题,较之LINGO 软件,的确方便快捷了许多。

    5.2K30

    Sqlmap使用中遇到的一个小破问题

    本文因我一个不好的小习惯引起,于是我进行了一番探究 在一次攻防演练过程中,发现了靶标SQL注入,基于时间的盲注 ? ? 使用 SQLMAP一把梭 ? ?...要么手写脚本,要么解决这个问题 更改Method 就在一筹莫展之际,小伙伴扔过来一个方法,将 POST 改成 GET ,之后使用 SQLMAP 进行注入 ? ? 成功注入!...---- 不正经的来了 当然,事实情况并不是如此顺利,因为网络问题,第一次GET并未成功,所以我怀疑sqlmap 中没有这个 payload ,于是走上了 sqlmap payload 修改之路,哎,都因为这破网...像我这种不信邪的人,遇到这种问题高低得整明白,目前来看,导致 POST 方法有问题的就是这个301了,为啥GET不会产生 301 呢? 使用 burp change method ? ???...经过一段时间的思考,我发现了一个小细节,我抓sqlmap的包,之后放到repeater里的是http的包,301 的 Location 地址就是其 https 的地址,难道说,使用 -r 数据包 的形式来注入

    1.2K20

    MySQL 5.7中锁的一个通用问题

    前几天分析了一个死锁的问题,有一个网友看了以后,就发了邮件给我问一个问题。一般来说,能够发送邮件提出问题的同学,都是很认真的,因为他要准备好日志,准备好操作过程,准备好他已经在做的事情。...这位网友提的一个问题,我看了以后感觉很是奇怪,因为有些颠覆我对MySQL锁的一些认识。这该如何是好。 这个环境的事务隔离级别是RR,存在主键,存在范围查询。...但是MySQL 5.7中出现这个问题,自己还是带着一丝的侥幸心理,在MGR上测试了一把,能够复现,结果今天继续耐着性子看了下这个问题,在5.6上模拟了一下,5.6全然没有这个问题,问题到了这里,就有了柳暗花明的一面...,能够肯定的是这个问题在MySQL 5.7中可以复现,在MySQL 5.6中是正常的。...如此一来,问题的定论就有了方向,很快就在bugs.mysql.com里面找到了一个相关的bug(85749) 里面也做了类似的测试,能够复现,MySQL官方做了确认。

    2.3K90

    一个关于npm中scripts的小问题

    今天发现了一个关于npm的小问题,大家应该知道每个node工程都有一个package.json文件,里面会记录一些该项目的概要信息,例如项目名称、版本、作者、git库、项目的协议(MIT这种)、依赖包等等...如果你用过express,相信你对 npm start 不陌生,其实 npm start 执行的就是以上定义好的 scripts 对象中键为 start 的命令,也就是相当于你在命令行中输入 node...如上图所示,npm 中的command必须是那一堆的其中之一,这样的话那必须选一个才行吗,这还叫什么自定义。当然不是这样的。...而再执行 npm run start,同样ok,这也就是说完整的执行scripts中的脚本,应该是 npm run ,而 npm 为了使用方便使用,对某些默认的指令...以上就是这些,顺便说一下,作者本人也并不是什么大神,公众号以后会多记录下自己发现的种种问题,权当是一个学习成长的过程,我也很希望更多的node开发者能与我学习交流,直接搜索微信号 rifewang 就可以找到我

    41421

    「R」R 中的方差分析ANOVA

    ANOVA y ~ B * W + Error(Subject/W) 表达式中各项的顺序 当因子不止一个,并且是非平衡设计;存在协变量两者之一时,等式右边的变量都与其他变量相关。...R中的ANOVA表的结果将评价: A对y的影响 控制A时,B对y的影响 控制A和B的主效应时,A与B的交互影响。 一般来说,越基础性的效应需要放在表达式前面。...单因素方差分析 单因素方法分析中,你感兴趣的是比较分类因子定义的两个或多个组别中的因变量均值。...ANOVA对治疗方式的F检验非常显著,说明五种疗法的效果不同。 多重比较 虽然ANOVA对各种疗法的F检验表明五种药物的治疗效果不同,但是没有告诉你哪种疗法与其他疗法不同。多重比较可以解决这个问题。...单因素协方差分析 ANCOVA扩展了ANOVA,包含一个或多个定量的协变量。 下面的例子来自multcomp包中的litter数据集。怀孕的小鼠被分为四个小组,每组接受不同剂量的药物处理。

    4.7K21

    R tips: R中的颜色配置方案

    数据可视化不可避免的就是要选择一些颜色方案,颜色方案除了手动设置之外,在R中也有自动生成颜色方案的工具。...R中的HCL配色方案 HCL本意是和RGB HSV等一样的颜色空间的术语,由于这里所用的颜色方案在R中是hcl.pals函数,所以就称为HCL配色方案了。...HCL相比较HSV等颜色空间的一个重要优点就是颜色的视觉明度是均一的,在R中也是推荐使用hcl颜色方案,不推荐使用rainbow等颜色方案了。...# 定义一个函数用于查看颜色的效果 showColors <- function(x, ...){ barplot(rep(1, length(x)), col = x, axes = FALSE,...,它的颜色在深浅上存在一个中心点,中心点两侧颜色逐步加深过渡,这样的颜色方案适合有中心点的连续变量,比如相关性数据:数据范围是-1到1,0是中心点,于是两端的颜色需要两个深色,而中心点可以使用最浅的颜色

    3.8K40

    数据迁移中需要考虑的问题(r2第15天)

    在生产环境中,做数据迁移需要考虑很多的可能性和场景,尽量排除可能发生的问题。我自己总结了下,大体有如下需要注意的地方。...3)网络 网络带宽 网络是很重要的一个因素,数据迁移的时候肯定会从别的服务器中传输大量的文件,dump等,如果网络太慢,无形中就是潜在的问题。...可以使用scp来进行一个简单的测试,如果存储还不错的话,一般在50M左右/每秒 的速度 网络临时中断 网络的问题需要格外重视,可能在运行一些关键的脚本时,网络突然中断,那对于升级就是灾难,所以在准备脚本的时候...的影响 有些外部系统可能为了数据同步,可能会在系统中创建一些物化视图日志,可以和他们做一个确认,删除物化视图日志,减少数据插入的时候物化视图日志的影响, 还有一个问题就是物化视图日志会使rename table...14)constraint级的数据不一致 这种问题存在而且很隐蔽,比如如下的错误。就是not null constraint在源schema中不存在,在导入目标库的时候出问题了。

    1.4K90
    领券