首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

基于协同过滤的推荐引擎(理论部分)

记得原来和朋友猜测过网易云的推荐是怎么实现的,大概的猜测有两种:一种是看你听过的和收藏过的音乐,再看和你一样听过这些音乐的人他们喜欢听什么音乐,把他喜欢的你没听过的音乐推荐给你;另一种是看他听过的音乐或者收藏的音乐中大部分是什么类型,然后把那个类型的音乐推荐给他。当然这些都只是随便猜测。但是能发现一个问题,第二种想法很依赖于推荐的东西本身的属性,比如一个音乐要打几个类型的标签,属性的粒度会对推荐的准确性产生较大影响。今天看了协同过滤后发现其实整个算法大概和第一种的思想差不多,它最大的特点就是忽略了推荐的东西

09

基于协同过滤的推荐引擎(理论部分)

记得原来和朋友猜测过网易云的推荐是怎么实现的,大概的猜测有两种:一种是看你听过的和收藏过的音乐,再看和你一样听过这些音乐的人他们喜欢听什么音乐,把他喜欢的你没听过的音乐推荐给你;另一种是看他听过的音乐或者收藏的音乐中大部分是什么类型,然后把那个类型的音乐推荐给他。当然这些都只是随便猜测。但是能发现一个问题,第二种想法很依赖于推荐的东西本身的属性,比如一个音乐要打几个类型的标签,属性的粒度会对推荐的准确性产生较大影响。今天看了协同过滤后发现其实整个算法大概和第一种的思想差不多,它最大的特点就是忽略了推荐的东西

05

你“被平均”过吗?揭露“平均数”的诡计

平均数(如均值、众数、中位数)也许是人们最喜欢拿来作为证据的数:当你想证明中国人营养改善了,你可以比较中国人的平均身高的变化;当你想说明你调研的社区确实很贫困,你会摆出当地居民的人均年收入;当你在校园里推销一个英文培训课程,你会告诉前来咨询的学生,这个培训班的学员的GRE平均分数能有多高……类似的例子不计其数。平均数似乎是一个人人会用、人人能懂的指标。但在很多情况下,平均数也是最容易产生误导的指标,单单一个平均数,很多时候根本说明不了任何问题。本期趣味统计学将揭开“平均数”的诡计。 ---- 偷梁换柱的“平

05
领券