任务是,给定一个站点url (比如https://stackoverflow.com/ )来返回站点上所有可用提要的列表。方法可接受:
a)使用第三方服务(google?、yahoo?、...)以编程方式使用爬虫/爬行器(以及有关如何配置爬行器以仅返回rss/xml提要的一些提示) c)以编程方式使用c/c++/php (任何语言/库)
在任何情况下,请提供一个简单的使用示例。
发布于 2010-05-05 06:56:11
据我所知,唯一能做到这一点的方法是依靠RSS发现协议,它已经存在了大约4年。抓取站点,并在HTML页面中查找RSS自动发现标记:
<link rel="alternate" type="application/rss+xml" 
      title="Something" 
      href="http://www.example.com/feed1.xml” />https://stackoverflow.com/questions/2767286
复制相似问题