新浪微博是一个中文微博网站,我正在做一个抓取项目,这个项目涉及到获取每个用户在这个网站上的博客帖子数量,
网址:http://blogus.sina.com/gb/hotbloger/#top
在这个页面中,你们可以看到所有用户的列表,点击每个用户,我们将被重定向到相应的博客页面,我想获得每个用户的帖子数量(通过检查日期和时间)。
他们提供获取详情的接口接口:http://open.weibo.com/wiki/API%E6%96%87%E6%A1%A3/en
但我找不到任何api调用来获取这些指定的详细信息。有没有其他方法可以获取详细信息?或者我们可以直接抓取网站吗?请帮帮忙。
发布于 2014-06-12 22:04:43
您可以通过接口方法2/users/show
获取用户信息。
例如,您提到的页面中的第一个链接是:
http://redirect.sina.com/blogus/u/blog.sina.com.cn/u/1763875377
这是到用户id为1763875377的页面的重定向。因此,您可以简单地调用https://api.weibo.com/2/users/show.json?uid=1763875377
,它将返回该用户的帖子数量("statuses_count":1583
)等。
您还可以使用/2/users/counts
端点一次获取多个用户的帖子数量。
需要一个访问令牌来执行这些经过身份验证的调用(基本上,您需要向微博注册一个应用程序)。
https://stackoverflow.com/questions/23100498
复制相似问题