var bobik = new Bobik("YOUR_AUTH_TOKEN");
bobik.scrape({
  urls: ['amazon.com', 'zynga.com', 'http://finance.google.com/', 'http://shopping.yahoo.com'],
  queries:  ["//th", "//img/@src", "return document.title", "return $('script').length", "#logo", ".logo"]
}, function (scraped_data) {
  if (!scraped_data) {
    console.log("Data is unavailable");
    return;
  }
  var scraped_urls = Object.keys(scraped_data);
  for (var url in scraped_urls)
    console.log("Results from " + url + ": " + scraped_data[scraped_urls[url]]);
});

在这里，抓取是远程执行的，只有当结果准备就绪时，才会向代码发出回调(还有一个选项可以在结果可用时收集结果)。

您可以在https://github.com/emirkin/bobik_javascript_sdk下载Bobik client proxy SDK

票数 5

Stack Overflow用户

发布于 2012-04-25 05:16:06

您并不总是需要jQuery。例如，如果您使用从jsdom返回的DOM，就可以很容易地自己获取所需的内容(同时考虑到您不必担心xbrowser问题)。看：https://gist.github.com/1335009根本不是从node.io中拿走的，只是说你可以自己做这件事，这取决于...

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5211486

复制

相似问题

问使用Node.js实时抓取网页
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Node.js实时抓取网页EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Node.js实时抓取网页
EN