用机器学习分析流行音乐(三):构建模型
本文是本教程的第三部分,在本文中,我将构建不同的预测模型,并比较结果。 你可以先阅读本教程的第一部分和第二部分,也可以在文末找到本文完整代码的链接。 现在,让我们来构建模型!
对数据帧进行子集化,并将分类变量转换为虚拟变量
为了构建模型,我去掉了“ fav_grp ”一列,因为我们在教程第二部分探索性数据分析中看到的那样,有太多的团体,而 BTS 是占主导地位的团体。
df_model = df[['popl_by_co_yn', 'reason', 'yr_listened', ...