我正在阅读一个500万的观察管道分隔的文本文件。一列的前250,000个值为数字,其余为字符串。下面的代码导入了前250,000个数值,将变量声明为数值(long),并将字符串值视为缺失。
import delimited "mixed_types.txt", delimiter("|")
解决方案:将所有vars导入为字符串,然后解压缩:
import delimited "mixed_types.txt", delimiter("|") stringcols(_all)
destring, replace
我的问题是,为什么?导入分隔状态的帮助文件,“导入分隔符将检查该文件是否由标签或逗号根据第一行数据分隔。”是否为分配var类型遵循了这条规则?
发布于 2015-07-26 22:29:47
这不是预期的行为。
从http://www.stata.com/help.cgi?whatsnew中读到:
你需要update
。见help update
。
(运行help whatsnew
可以访问相同的信息。更新为Stata 14。)
https://stackoverflow.com/questions/31641372
复制相似问题