这样做的优点是加倍的,它可以让我们从一次运行中收集所有必要的信息;同时,也帮助我们从用户的定义中对音乐流派关键词进行分类。...当音乐流派可以被识别时,我们就可以抽取关键词列表,之后将它们分入“脏列表”(脏,表示数据还未被清洗——译者注)。这一列表充满了错别字、名称不统一的名词、引用等等。...#添加”key”列,如果key是流派字典的键值则为1,否则为0。拷贝数据帧,使
#用.loc[(tuple)]函数以避免切片链警告。...b', 'alt','latin', 'reggae', 'electronic', 'punk',
'grunge', 'metal',
]
#对数据帧重新排序并对所有行求平均
gdf =gdf...b', 'alt','latin', 'reggae', 'electronic', 'punk',
'grunge', 'metal',
]
#对数据框重新排序并对求平均
gdf =gdf[