我必须解决一个问题。我有2,3个网站,它们之间有很多联系。我必须找到两个网址之间的较短的方式。然而,在开始时,我需要s.th来映射这个网站,并使邻接列表,我可以使用。每一行都应该包含一个页面和从那里开始的所有连接。我需要软件,可以做这样的扫描,否则我应该写这样的软件。例如,使用php curl就不会那么困难了。:)
发布于 2013-12-12 01:19:40
也许你需要把你的连接想象成图形节点,并用它来计算?对于在新闻文章中检测命名实体的大新闻网站(http://topbitcoinnews.com),我们使用相同的方法并将数据存储在neo4j.org中
https://stackoverflow.com/questions/15805681
复制相似问题