SlopOne推荐算法（附Python源码）

昱良

发布于 2018-04-08 15:45:51

9700

发布于 2018-04-08 15:45:51

文章被收录于专栏：机器学习算法与Python学习

关键字全网搜索最新排名

【机器学习算法】：排名第一

【机器学习】：排名第二

【Python】：排名第三

【算法】：排名第四

SlopOne是一个非常简单的协同过滤算法。他的基本思想非常简单，如果用户u已经对物品j打过分，现在对物品i进行打分，那么只需要计算出同时对物品i和物品j打分的用户中他们分数之差的平均，那么我们就可以根据这个分数之差来计算用户u对物品i的打分了，当然，这样的物品j也有很多歌，有的物品和j共同大份的用户比较少，有的比较多，那么显而易见的是共同打分多的那个物品在评分是所占的比重应该大一些。举个例子，如下图所示

现在要预测Lucy对Item1的评分。首先可以知道用户Lucy对Item2和Item3打过分，现在计算Item1和Item2的平均差值，即（（5-3）+（3-4））/2 = 0.5，在计算Item1和Item3的平均差值，即5-2 = 3，那么根据Item1和Item2的平均差值来看Lucy对Item1的评分可能为2+0.5 = 2.5，同时根据Item1和Item3的平均差值Lucy对Item1的评分可能为5+3=8，最终用户Lucy对Item1的评分为（2.5*2+8*1）/（2+1）=13/3=4.33。

使用movielens数据

链接：https://grouplens.org/datasets/movielens/

Python代码如下

#coding:utf-8  
import re  
import math  
#读取数据，并生成矩阵  
def getMatrix():  
    mat = {}  
    f = open("u.data", "r")  
    for line in f:  
        list = map(int, line.strip("\n").split("\t"))  
        if list[0] in mat:  
            mat[ list[0] ][ list[1] ] = list[2]  
        else:  
            mat[ list[0] ] = { list[1] : list[2] }  
    f.close()  
    return mat  
#计算某个用户的平均分  
def getAvg(usr):  
    res = 0.0  
    for i in usr:  
        res += usr[i]  
    return res / len(usr)  
#预测分数, 返回矩阵mat中用户usr对item的评分  
def getSlopOne(mat, user, item):  
    #用户user的所有item的列表  
    list = mat[user]  
   #分子  
    mole = 0.0  
    #分母  
    demo = 0.0  
    #对于每一个物品，都计算它和物品item的差值，最终算出相对它item的score  
    for it in list:  
        diff_sum = 0.0  
        user_num = 0  
        for us in mat:  
            us_it = mat[us]  
            #如果该user同时评价过这两个item，则采纳他的评分  
            if item in us_it and it in us_it:  
                diff_sum += us_it[item] - us_it[it]  
                user_num += 1  
        #如果item被人评价过  
        if user_num:  
            diff_avg = diff_sum / user_num  
            mole += (list[it] + diff_avg) * user_num  
            demo += user_num  
    #如果没有人评价过，则取这个人的平均分  
    if user_num == 0:  
        return getAvg(list)  
    #否则返回最终的score  
    return mole / demo  
def main():  
    mat = getMatrix()  
    rf = open("u.data", "r")  
    wf = open("o.data", "w")  
    for line in rf:  
        list = map(int, line.strip("\n").split("\t"))  
        score = getSlopOne(mat, list[0], list[1])  
        output = str(list[0]) + "\t" + str(list[1]) + "\t" + str(list[2]) + "\t" + str(score) + "\n"  
        wf.write(output)  
    rf.close()  
    wf.close()  
if __name__ == "__main__":  
    main()

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-05-29，如有侵权请联系 cloudcommunity@tencent.com 删除

编程算法

本文分享自机器学习算法与Python学习微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

编程算法

登录后参与评论

0 条评论

热度

SlopOne推荐算法（附Python源码）

SlopOne推荐算法（附Python源码）

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐