我使用ave()函数来查找数据中每个单独主题的偏自相关(pacf)。
# return pacf coefficient
pacf1 = function(x) {
return(pacf(x, lag.max = 1, na.action=na.pass)$acf[1])
}
ave(df$score, df$id, FUN=pacf1) # get pacf coefficient for each ID
Error in ts(x) : 'ts' object must have one or more observations
在我的原始巨大数据帧上,我一直收
我的图有分类的X轴和多种类型的元素可供绘制: dt1 <- fread('
ID type value
a1 bar 40
a1 point 30
b1 bar 50
b1 point 20
c1 bar 30
c1 point 50
c1 point 20
d1 point 30
d1 point 50
e1 none 50
a2 bar 45
我是R的新手,我正在尝试使用ggplot和一些逆向工程来绘制一些图形。我有一个数据框如下所示:
> data
experiments percentages
1 A 72.11538
2 A 90.62500
3 A 91.52542
4 B 94.81132
5 B 96.95122
6 B 98.95833
7 C 83.75000
8 C
我有一个表,其中一个变量是注册国家。
table(df$reg_country)
返回:
AR BR ES FR IT
123 202 578 642 263
现在,如果我对原始表进行子集以排除其中一个国家
df_subset<-subset(df, reg_country!='AR')
table(df_subset$reg_country)
返回:
AR BR ES FR IT
0 202 578 642 263
第二个结果对我来说是非常令人惊讶的,因为R似乎神奇地
为什么用大笔预测和预测有区别?
下面是我生成数据的代码:(诚然是草率的)
require(data.table)
require(biganalytics)
#create a data set with factor variables and one continuous numerical variable
LETTERS702 <- c(LETTERS, sapply(LETTERS, function(x) paste0(x, LETTERS)))
data = data.table(ded = runif(100), cont = runif(100), fac1 = a
我有一个包含三列的数据框: ref,target,distance。每个ref都有一个到同一组目标的测量距离,我想为每个ref得到一个最小距离的向量。现在我正在使用for循环来做这件事,但似乎应该有一种方法来向量化这一点。
下面是我的代码:
refs <- levels(data$ref)
result <- c()
for (ref in refs) {
# Find the minimum distance for observations with the current ref
# but be sure to protect against ref ==
当我试图定义一个定制的调色板时,比如蓝色和红色,我得到的是洋红而不是蓝色。让我们考虑一下从文档中获取的一个示例--巧妙地文档:
library(plotly)
pal <- c("red", "blue", "green")
p <- plot_ly(data = iris, x = ~Sepal.Length, y = ~Petal.Length,
color = ~Species, colors = pal)
p
这如预期的那样起作用。三个物种中的每一个都有自己的颜色:红色、蓝色或绿色。
然后,我准备一个新的数据集,
我试图将一个data.frame对象(由161个国家之间的大量双边贸易数据组成)的列值映射到一个161 x 161邻接矩阵(也属于data.frame类),以便每个单元格表示任意两个国家之间的并进贸易流。
数据如下所示
# load the data from dropbox folder
library(foreign)
example_data <- read.csv("https://www.dropbox.com/s/hf0ga22tdjlvdvr/example_data.csv?dl=1")
head(example_data, n = 10)
rid
在SAS中,有能力通过一个简单的if语句删除一个观察。例如,如果我想删除其中的年份= #的行。我可以写:
If year == "#" then delete;
在r中有类似的方法吗?我试过这个:
DF<- DF[!(DF$Year == "#"),]
R中的数据集:
Year Month
# June
# July
# August
2015 August
但是当我运行DF$year时,我仍然得到#作为一个因素水平,当我认为它会被过滤掉?