我有一个数据库,其中一些观察具有标识符标识符,而另一些则没有。我想要创建一个新的数据库,在这个数据库中,我删除了与ident变量重复的观察结果,但是在缺少ident的地方保留观察结果。如果我只是做一个proc排序nodupkey by ident;然后,它也消除了缺失的值。是否有一种简单的方法(即不破坏数据集,proc排序nodu
我想使用egen和group为观察值创建一个标识符变量,其中包含一组特定变量的相同值。但是,一些变量包含缺少的数据,导致相应的标识符具有缺失值。有没有办法绕过这个问题(除了暂时填写一些随机值)?如果v1和v2具有相同的值,我希望观察值具有唯一的id。我想做一些类似的事情:
egen id = group(v1 v2)