首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我想抓取推特和脸书

我想抓取推特和脸书
EN

Stack Overflow用户
提问于 2014-11-02 21:48:08
回答 1查看 1.3K关注 0票数 0

我现在正在做一个爬虫。它支持web、Facebook和Twitter。我的导师说它需要支持使用Facebook和Twitter API来获取帖子,但我不知道怎么做。我正在使用Solr作为搜索引擎,并计划使用Nutch进行网络爬行。我看到Nutch不支持这些API。你能推荐其他的网络爬虫或使用Nutch或其他方式获取帖子的方法吗?非常感谢!

EN

回答 1

Stack Overflow用户

发布于 2014-11-07 20:10:06

你到底想在facebook/ twitter上抓取什么?

只有特定的搜索引擎机器人才能爬行facebook。

访问https://facebook.com/robots.txt

在底部,他们已经禁止了所有的机器人,除了列出的一个。

因此,要从facebook获取数据(如果需要的话),可以使用API。

https://developers.facebook.com/

在twitter中,你可以抓取一些url

代码语言:javascript
运行
复制
Allow: /?lang=
Allow: /hashtag/*?src=
Allow: /search?q=%23

同样,如果您的目标是获取一些数据,则更好的方法是使用API。

https://dev.twitter.com/

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26699984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档