我试图想出一个平台,可以在互联网上发现的许多关于特定“主题”的文章中综合高质量的内容,该算法应该可以说是推荐在互联网上找到的关于这个主题的前10篇文章。应该使用什么样的算法和方法来评估写作质量,并在“源可信度”等许多其他参数上给出某种评分。我已经注意到爬行和查找内容,寻找算法和方法来评估这一点。请建议资源(课程、研究论文等)。为了同样的。
发布于 2017-08-20 17:52:12
互联网文章的“来源可信度”最好是通过页面排名算法来计算。
从算法上决定写作质量可能是很难的。然而,Page可能是一个代理。如果一篇文章是集线器,那么它就是主题的权威,并且可以假定它写得很好(或者至少非常有用)。
https://datascience.stackexchange.com/questions/19521
复制相似问题