首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于SOM的推荐引擎

基于SOM的推荐引擎
EN

Stack Overflow用户
提问于 2012-03-09 01:27:19
回答 1查看 904关注 0票数 3

我和我的朋友已经决定在python.Initially中做一个关于推荐引擎的项目我们决定使用支持向量机做我们的项目,但很快发现它很难,因为它的监督学习,现在我们正计划使用自组织映射和可能的耦合与协同过滤(不知道这是否可能)来建立engine.Would任何人建议一个好的参考自组织map.Also除了使用协同过滤之外的任何其他选择。

非常感谢。

EN

回答 1

Stack Overflow用户

发布于 2013-06-13 21:24:32

我不确定自组织映射是否真的最适合您的应用程序。它可能会保留输入空间的拓扑属性,但它并不能很好地适应稀疏数据集,这是推荐引擎中经常遇到的问题。我不会说支持向量机更好,事实上,它可能离你真正想做的事情更远,但SOM只会稍微好一点。也就是说,如果您想学习如何构建SOM,请按有用程度排序,以下资源值得一看。值得一提的是,SOM实际上在理论上非常接近卷积神经网络,因此任何用于这些资源的资源都应该很好地继承。

代码语言:javascript
运行
复制
http://en.wikipedia.org/wiki/Self-organizing_map
http://ftp.it.murdoch.edu.au/units/ICT219/Papers%20for%20transfer/papers%20on%20Clustering/Clustering%20SOM.pdf
http://www.eicstes.org/EICSTES_PDF/PAPERS/The%20Self-Organizing%20Map%20%28Kohonen%29.pdf
http://www.cs.bham.ac.uk/~jxb/NN/l16.pdf
http://www.willamette.edu/~gorr/classes/cs449/Unsupervised/SOM.html

至于可能对您的特定应用程序更有意义的方法,我可能会建议使用受限Boltzmann Machine。RBM的想法是,您将尝试基于有关每个用户的各种统计数据为每个用户创建一个“推荐配置文件”,为用户定义一个特征向量。这一基本预测将以一种非常类似于深度神经网络的方式发生。

一旦你的网络在一个方向上进行了训练,RBM的真正光辉之处在于你可以向后运行它。您尝试从推荐配置文件生成用户配置文件,这对于这样的应用程序非常有效。有关RBM的信息,请访问以下链接:

代码语言:javascript
运行
复制
http://deeplearning.net/tutorial/rbm.html
http://www.cs.toronto.edu/~hinton/absps/guideTR.pdf
http://www.cs.toronto.edu/~hinton/absps/netflix.pdf

Hinton基本上是这些方面的权威,也是数据科学的BAMF。RBM列表中的最后一个链接实际上能够完全独立构建您的推荐引擎,但如果您想要使用更多预建的库或利用数据科学的其他部分,我强烈建议您在尝试任何协作过滤之前使用某种降维机制。

协同过滤最大的问题是,你通常有一个非常稀疏的矩阵,它不能给你你想要的信息,并最终持有许多对你没有真正用处的东西。出于这个原因,在主题建模领域有一系列算法,它们将为您的数据提供较低的维度,从而使协作过滤变得微不足道,或者可以在上面的任何其他方法中利用,以较低的强度获得更有意义的数据。

gensim是一个python包,它为您完成了大量的主题建模,并且还将利用numpy和scipy为您构建tfidf向量。它也有很好的文档记录。然而,这些示例是针对更直接的NLP的。请记住,它们的单个项目恰好是单词这一事实对底层算法没有影响,您可以将其用于约束较少的系统。

如果你想在主题建模部分获得金牌,你真的应该看看弹球分配(PA),它是主题建模中的一种新算法,比大多数其他主题建模器更有前途,但不是捆绑在包中的。

代码语言:javascript
运行
复制
http://www.bradblock.com /Pachinko_Allocation_DAG_Structured_Mixture_Models_of_Topic_Correlations.pdf

祝您在数据科学方面取得成功!如果你还有其他问题,请告诉我,我可以试着回答他们。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9622023

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档