腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

余林丰

专栏作者

155

文章

141371

阅读量

46

订阅数

初学数据挖掘——相似性度量(二)

数据挖掘编程算法 python

　　上一篇中介绍了四个算法，并用四个算法分别计算了两个人的相似度。这篇就来讲讲相似性算法在实际当中怎么用。第一：将指定的人与其他人作相似性比较，并从高到低进行排序；第二：对指定的人推荐未看过的电影。同样还是先给出具体分析，然后给出相应算法，再最后一起给出代码。　　根据相似性从高到底排序。 def topMatchs(prefs, person, n=5, similarity=sim_pearson): scores=[(similarity(prefs, person, other),

2018-01-12

9860

初学数据挖掘——相似性度量(一)

数据挖掘数据处理

　　好久没有写这个了。也就是在去年到今年这个时间段里，同时决定好几件事情。第一：考研。第二：以后方向就是大数据或者是叫数据挖掘。这两件事当然是有联系的，第一件事就是考研考到北京，接着研究生的方向就是数据挖掘了吧。在一边准备考研的同时，还必须得一边准备着数据挖掘方面的知识。无奈本科前三年这方面接触得极少，只好利用现在的时间来恶补了。　　不久前买了一边《集体智慧编程》，开篇即开始讲算法，或者是整本书都是在讲算法，而第一个算法就是——相似度度量。这个在现在用得非常多，在QQ音乐等音乐播放器上有类似“猜你喜欢”，

2018-01-12

9440

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态