有没有办法从wikipedia api中通过一次抓取请求来搜索页面并提取其信息？

javascript、async-await、wikipedia-api

我正在尝试写这个函数，它得到一个搜索字符串，并返回它得到的第一个结果，但是在所说的结果中，我只得到页面url和一些其他基本信息，没有id，没有页面内容。我想把它作为一个单独的json来获取，而不是发出另一个请求。而且这种方法也不起作用，因为即使我只发送标题，它似乎也找不到页面。我有没有可能在没有图像和链接的情况下以某种方式提取页面信息？term) term = 'Nto'

浏览 13提问于2020-04-19得票数 0

2回答

Twitter API 1.1 :搜索api

android、twitter

我想使用twitter API在我的android移动应用程序中检索带有hashtag的tweet，但它需要身份验证。有没有一种不需要身份验证的方法？

浏览 5提问于2013-07-31得票数 0

2回答

有没有搜索Google Cache的API？

ruby-on-rails、google-search-api

我正在尝试在Google Cache中进行搜索，因此需要执行以下查询：并从页面中获取一些内容，如时间戳。但是当我使用curl (ruby)来做这件事的时候，它给出了一个权限被拒绝的错误，即抓取被阻止了，这是意料之中的。那么，有没有办法搜索</

浏览 0提问于2010-10-23得票数 7

回答已采纳

2回答

获取专辑last.fm api的发布日期。

last.fm

在last.fm中，就像文档中描述的那样，它足以向服务器发出一个HTTP，并且它将使用包含"“字段的XML (或JSON)进行答复(如在网站上的示例响应中所示)。问题是，如果我在文档中使用相同的请求调用，除了我需要的字段外，答复是相同的。网站中示例响应的部分： <name>Believe</name> <artist>Cher</

浏览 3提问于2020-01-21得票数 3

回答已采纳

1回答

如何在不使服务器过载的情况下抓取数据？

php、csv、web-scraping、screen-scraping

我正在尝试建立一个脚本，从网站上抓取特定的数据。该脚本使用的是网站搜索api。搜索结果给出页面的结果，每个页面有大约20个帖子，然后我必须深入每个帖子并提取数据。这会导致数据通过500 Internal Server Error。我认为这是服务器过载的结果，因为有时它必须搜索大约400个页面。我尝试每隔特定数量的结果刷新一次页面，并将数据保存在CSV文件中

浏览 0提问于2014-06-23得票数 0

1回答

用Python抓取Web应用程序

python、web-scraping

到目前为止，我在网络抓取方面的大部分经验都是非常简单和容易理解的。发送请求，下载HTML，并提取所需的信息。目前，我对从Spotify Web应用程序中抓取顶级游戏数据感兴趣。这些数据无法通过API访问，但在浏览不同的艺术家页面时可以看到。我的问题是，这些数据是如何在幕后生成的，是否有可能抓取这些数据？

浏览 5提问于2015-02-09得票数 2

4回答

爬行维基百科

web-scraping、web-crawler

我正在使用was for windows爬行维基百科，我正在浏览这个工具中的所有选项，以找到在特定时间段(例如从2005年到现在)下载维基百科页面的选项。 有没有人知道如何在特定的时间段内抓取网站？

浏览 0提问于2011-09-06得票数 0

回答已采纳

1回答

python处理来自wikipedia* api的大型json响应*

python、json、api、mediawiki

我正在访问wikipedia api，以便从页面抓取文本。我使用带有页面名称的parse api调用。它将整个站点的html作为json对象中的一个元素提供给您，并允许您通过为wiki页面中的每个部分提供一个字节偏移量来解析所需的项目。有没有更好的方法来处理这个问题而不是把整个响应加载到内存中？现在，我所能想到的就是使用json.loads()创

浏览 3提问于2016-01-15得票数 1

1回答

我正在尝试使用维基百科API按部分进行搜索。我已经知道的:关于以下内容：https://en.wikipedia.org/w/api.php?&prop=revisions&titles=Game_of_Thrones_(season_1)&rvprop=content&rvsection=0 我知道rvsection=0会给我提供维基百科页面的第0部分，我可以改变它来获得页面的不同部分，例如。我

浏览 33提问于2021-10-03得票数 1

3回答

使用Graph api获取facebook页面评级和评论

facebook、facebook-graph-api、facebook-page

我正在创建网站来搜索使用图形API的地方。我从图形API中得到了位置的详细信息。有没有办法通过图形API来获取页面评分和位置的评论？

浏览 2提问于2013-12-17得票数 8

1回答

包装器函数来解析多个API请求。

jquery、ajax、json、parsing

我正在构建一个简单的聚合型应用程序，它可以从多个网站(通过app )获取数据，然后将数据显示在同一个页面上。例如，在搜索John时，该应用程序可以从维基百科获得他的页面上的数据，从Goodreads获得他的最高评价的书，从IMDb获得他的作者页面(依此类推)。现在我有了jQuery代码，可以分别从这些API请求和解析JSON响应，然后使用$.when/$.done函数更新页面</e

浏览 2提问于2012-03-04得票数 1

回答已采纳

1回答

如何判断某个网站是否阻止了我的抓取代码

python、web-scraping、beautifulsoup

我正在学习web抓取，我写了一些使用Python和Beautiful Soup4从抓取信息的代码，有时代码会停止，然后崩溃。该错误消息与应填充的列表为空相关。在它崩溃后，我尝试在我的浏览器中手动访问该网站，但页面永远不会打开。如果我稍后再试一次，它会正常打开。所以我猜这个网站不喜欢我在短时间内访问它太多，并暂时阻止我或类似的东西。我的问题是，有没有一种方法可以确定阻止我请求的网站是问题所在？还有，有没有办法

浏览 0提问于2019-01-08得票数 0

1回答

使用安卓或Java查询来自MediaWiki /维基百科的多个结果

java、android、http、mediawiki、wikipedia

我目前正在使用MediaWiki的URL示例来查询android上的HTTP GET请求。http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=content 然而，在这个例子中，我总是需要某种直接的标题，并且只得到一个结

浏览 0提问于2012-11-11得票数 1

回答已采纳

1回答

如何通过chrome扩展获取所有CSS和Javascript文件

javascript、css、google-chrome、google-chrome-extension

我想做一个chrome扩展，它可以通过点击page Action中的一个按钮来获取网页中所有CSS和Javascript文件的名称和内容，但我不知道哪个API可以做到这一点。

浏览 1提问于2015-03-17得票数 0

1回答

获取尽可能多的与一天的趋势相关的推文

twitter、tweets

我在一个数据库中存储，每30分钟，推特的国家Y的热门话题。这没有问题。现在，为了研究的目的，我想获得尽可能多的与这些热门话题相匹配的推文。如果我在X-2天内有100个热门主题，并且我发出了20个GET搜索请求/趋势，那么我最终将完成总共2000个请求，这超过了Twitter每小时350个请求的限制。如果请求速度达到300次/小时，那么需要超过6个小时才能获得一天的数据……提前

浏览 1提问于2012-03-27得票数 0

3回答

laravel输入(‘php://file_get_contents’)不工作

php、laravel、http

我正在尝试从我的应用程序正在使用的api服务中获取响应。有没有办法在laravel中使用POST路由控制器让file_get_contents('php:&#

浏览 0提问于2017-12-24得票数 4

1回答

将输入从一个html表单发送到其他多个html表单(客户端)

html、forms、client-side

我正在构建一个html web表单，一个登录页面，我希望能够提交给数量可变的其他web表单，这取决于几个复选框。是否可以创建完成此任务的客户端代码？将用户的登录

浏览 1提问于2010-11-15得票数 0

1回答

如何从谷歌的知识中获取社交媒体链接

facebook、instagram、social-media、google-knowledge-graph

目前，我正在从事一个项目，要求我收集名人粉丝号码(从instagram或facebook)。要想得到那个号码，我必须 "license": "en.wikipedia.org/wiki/

浏览 3提问于2016-11-08得票数 1

回答已采纳

2回答

jQuery + Ubiquity:从URL返回文档对象

javascript、jquery、ubiquity

我正在尝试编写一个简单的命令，它将在上运行一个查询，并将结果显示在Ubiquity预览对象中。previewBlock.innerHTML = page.getElementById('results').innerHTML如何使用我正在使用的URL来完成此操作？更新下面是我正在使用的Ubiquity脚本--它将

浏览 7提问于2009-05-22得票数 2

回答已采纳

1回答

在Android中从Java执行html自动按钮

java、android

应用程序经常与Web服务器中的内容进行通信。在服务器中，我有一个HTML文件，它有另一个按钮。我希望当我按下Android应用程序中的按钮时，HTML文件中的按钮是自动点击的。

浏览 4提问于2022-06-03得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Twitter API 1.1 :搜索api

有没有搜索Google Cache的API？

获取专辑last.fm api的发布日期。

如何在不使服务器过载的情况下抓取数据？

用Python抓取Web应用程序

爬行维基百科

python处理来自wikipedia* api的大型json响应*

Wikipedia API -按部分搜索

使用Graph api获取facebook页面评级和评论

包装器函数来解析多个API请求。

如何判断某个网站是否阻止了我的抓取代码

使用安卓或Java查询来自MediaWiki /维基百科的多个结果

如何通过chrome扩展获取所有CSS和Javascript文件

获取尽可能多的与一天的趋势相关的推文

laravel输入(‘php://file_get_contents’)不工作

将输入从一个html表单发送到其他多个html表单(客户端)

如何从谷歌的知识中获取社交媒体链接

jQuery + Ubiquity:从URL返回文档对象

在Android中从Java执行html自动按钮

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐