我有一个Excel表格作为Stata的输入。在Excel中,单元格中的一个点标记一个缺失的值,例如:
Column1 Column2
1 10
2 .
. 13
. 15
3 .
但是,当将Excel导入Stata时,上述两列都被标识为字符串。
如何在导入期间告诉Stata,所有点都应该被识别为缺失值,因此我的数字列仍然是数字列,尽管它们包含一些点/缺失值?
发布于 2017-10-18 21:40:26
假设您可能是从Excel或csv导入的。
来自指南的Excel:如果列包含至少一个带有非数字文本的单元格,则整个列作为字符串变量导入。
所以最简单的解决方案是:destring
变量。您可以通过destring
一次完成整个列表:
destring var_1 var_2 var_3, replace
将这些变量重写为数值变量。会被编码为失踪。
导入CSV,就像在中一样,如果有非数字字符,我相信Stata会认为它可能是一个字符串。导入时可以使用numericcols
选项
import delimited, numericcols()
然后,无论您在numericcols
选项中指定什么列,都必须是数值列,并且。应该被解释为失踪。
同样容易的仍然是destring
,如上文所述。
https://stackoverflow.com/questions/46797286
复制相似问题