我正在尝试解析.dta文件,并将每一行输入到单独的表中。.dta文件由许多不同的变量组成,我想将每个变量插入到一个单独的“变量表”中。我使用的是pandas的新.dta阅读器,名为statareader。我没有很多使用python的经验,我希望在我的语法方面能得到一些帮助。我也在使用python 2.7.5t = 1
while t
我的想法是计算每个变量的VIF,然后取出最高值的变量(如果它高于某个阈值),重新计算每个剩余变量的VIF,并重复该过程,直到没有VIF高于treshold。这种方法没有什么新奇的想法,但是我无法在Python中创建一个函数来自动化这个过程。X是删除了目标变量的数据集import numpy as np
from stats