我有一个包含数百行的数据集,结构如下
User Date Value1 Value2
A 2012-01-01 4 3
A 2012-01-02 5 7
A 2012-01-03 6 1
A 2012-01-04 7 4
B 2012-01-01 2 4
B 2012-01-02 3 2
B 2012-01-03 4 9
B 2012-01-04 5 3
由于面板数据
我见过一个列表应用(lapply)的示例,它很好地获取数据对象的列表,并返回回归输出的列表,我们可以将该列表传递给Stargazer以获得格式良好的输出。Using stargazer with a list of lm objects created by lapply-ing over a split data.frame library(MASS)
library(stargazer)
data(Boston)
by.river <- split(Boston, Boston$chas)
class(by.river)
fit <- lapply(by.river, f
我一直在使用glm函数进行回归分析,它对我很好。不过,我想知道的是,一些我想回归的东西涉及到大量的回归因素。我有两个主要问题:
是否可以为回归者提供文本向量?
summary(glm)的p值部分能被排序吗?最好是每个回归者的p值。
例如。
A # sample data frame
names(A)
[1] Dog Cat Human Limbs Tail Height Weight Teeth.Count
a = names(A)[4:7]
glm( Dog ~ a, data = A, family = "binomial")
我正在用python和scikit教自己更多的技巧,我正在尝试绘制一个线性回归模型。下面可以看到我的代码。但是我的程序和控制台给出了以下错误:x and y must be the same size。另外,我的程序直到我的代码结束,但是没有任何东西被绘制出来。
要修复大小错误,首先想到的是用类似于len(x) == len(y)的东西测试x和y的长度。但据我所知,我的数据似乎是相同的长度。也许这个错误指的是长度以外的东西(如果是的话,我不确定是什么)。会很感激你的帮助。
from sklearn import cross_validation
from sklearn.naive_
我的R脚本试图聚合excel电子表格,这些电子表格位于相关文件文件夹中的不同文件夹中(如下面的目录所示),并将所有数据放入一个主文件中。但是,脚本正在随机选择要从其中复制信息的文件,当我运行代码时,下面的错误会显示出来,所以我假设这就是为什么它没有选择文件夹中的每个文件?
all_some_data <- rbind(all_some_data, temp)
Error in rbind(deparse.level, ...) :
numbers of columns of arguments do not match
整个守则:
#list of people's name
我有一个独立变量回归的matlab代码,但是如果我有两个独立变量(x1和x2)呢?我应该如何修改这个多项式回归的代码?
x = linspace(0,10,200)'; % independent variable
y = x + 1.5*sin(x) + randn(size(x,1),1); % dependent variable
A = [x.^0, x]; % construct a matrix of permutations
w = (A'*A)\(A'*y); % solve the normal equation
y2 = A*