我想使用egen和group为观察值创建一个标识符变量,其中包含一组特定变量的相同值。但是,一些变量包含缺少的数据,导致相应的标识符具有缺失值。有没有办法绕过这个问题(除了暂时填写一些随机值)?例如,我有变量v1和v2。如果v1和v2具有相同的值,我希望观察值具有唯一的id。我想做一些类似的事情:
egen id = group(v1 v2)
让我们这样说:我正在做一个机器学习项目,我正在处理一个4250,13形状的数据集,它已经被归为7类了!请注意,不能将这些类别视为预测器。5.132556 % of the datasetFSDC 2.969247 % of the dataset
我有一个连续的输出,我想预测'CGPA',所以任务是一个回归,我的目标是在每个类别中预测它,最后的决定将是预测输出最大化的类别。对于一个新的输