我有东南亚国家的数据,看起来像这样:
这份清单还包括柬埔寨、印度尼西亚、老挝等国家。
我打算以HDI为自变量,以GTD (恐怖事件数量)为因变量进行回归分析。然而,据我所知,进行OLS回归只占一年的时间?
我如何使用所有年份(1996-2017)的国家数据进行时间序列分析和随后的回归?我希望在这方面寻求一些澄清。谢谢您:)
发布于 2019-11-19 12:13:45
这似乎是一个更适合https://stats.stackexchange.com/的问题(正如@Jason在他的评论中指出的那样,有一些危险)。简而言之,你会使用所有的年份,因为你在简单的回归中问的是‘一个变量对另一个变量的依赖性有多大’。在您的情况下,您将使用所有的数据HDI和GTD,它们只是碰巧分布在很多年。
简单的例子:
library(gapminder) #if you do not have these packages then install.packages("gapminder"), install.packages("tidyverse")
library(tidyverse)
head(gapminder) #first 6 rows of the data
plot(gapminder$lifeExp, gapminder$gdpPercap) #Probably not a linear relationship but let's go on anyway for demonstration purposes
fit <- lm(lifeExp ~ gdpPercap, data = gapminder) #Simple regression using all data from all countries for all years
summary(fit)
plot(fit)理想情况下,您将希望做一次完整的探索(线性回归确实合适吗?)包括残差的分布和按国家进行子集的实验,因此我建议阅读有关如何进行简单回归的许多资源中的一些。
附注:忽略这个简单例子的糟糕的现实性,这实际上是一个非常糟糕的线性回归的使用!
https://stackoverflow.com/questions/58926140
复制相似问题