AI项目体验地址 https://loveai.tech
使用爬虫爬取了网易云音乐中80w首歌400w+次收藏的歌单,存储格式为json格式,数据大小为3.59G,格式说明如下:
抽取 歌单名称,歌单id,收藏数,所属分类 4个歌单维度的信息 抽取 歌曲id,歌曲名,歌手,歌曲热度 等4个维度信息歌曲的信息
组织成如下格式:
主流的python推荐系统框架,支持的最基本数据格式为movielens dataset,其评分数据格式为 user item rating timestamp,把数据处理成这个格式。
保存 歌单id=>歌单名 和 歌曲id=>歌曲名 的信息
当然也可以使用其他的算法来实现,如:
可以使用不同的评估准则,如: