在Stata中,我最近发现,当我在一个回归模型中的多个交互项中使用相同的变量时,Stata会将该变量标记为共线性。例如,运行: regress dep i.gender##c.age i.ethnicity##c.age 标记以下消息: note: age omitted because of collinearity 年龄仍然包括在随后的回归表中,但有两次,第一次带有系数,SE等,正如人们所预期的,但第二次说的是omitted。 我以前做过很多次类似的分析,但从来没有(或者至少从来没有注意到)。这是不和谐的,因为不言而喻,年龄与其自身是共线的。但这并不重要,因为我试图同时输入的并不是两个名
我有一个关于岭回归的问题,以及当数据集很大时它的好处(相对于OLS)。当数据集较大时(例如50,000 vs 1000),脊线回归的好处是否消失了?当数据集足够大时,常规的OLS模型难道不能确定哪些参数更重要,从而减少对惩罚项的需求吗?当数据集较小且存在高方差的空间时,岭回归是有意义的,但对于大型数据集,我们是否期望它的预期好处(相对于OLS)消失?