我正在将一个数据集分解成一个训练和测试数据集。在我开始之前,这一切对我来说都是比较新的。因此,根据我的理解,标签是输出,功能是输入。我的模型会检测恶意软件,所以我的数据集充满了恶意软件可执行文件和非恶意软件可执行文件(我认为这是良性的?)
我已经开始了一些拆分数据集的代码,尽管我想澄清标签和特性之间的区别。因此,我的数据集相当大,包含了许多行和许多列。我要从我的数据集中删除“恶意软件”列。我是通过使用以下代码来做到这一点的:
y = data.Malware
X = data.drop('Malware', axis=1)
我相信这是我代码中的标签,因为这就是我要预测的模型(恶