抓取请求url来自哪个url响应

文章/答案/技术大牛

发布

1回答

对于Scrapy，我们可以得到response.url，response.request.url，但是我们怎么知道response.url，response.request.url是从哪个父url中提取出来的呢

浏览 26提问于2019-03-14得票数 1

2回答

识别特定卷曲多响应

、、

我使用curl_multi_exec()并行请求多个网站。比如说，URL1、URL2和URL3。一旦其中一个网站返回结果，我就可以处理它，然后等待下一个响应。现在我需要知道，根据请求的响应，这个结果来自哪个URL。我不能简单地检查响应中的URL，因为可能会有重定向。那么，识别响应来自哪个URL (URL

浏览 2提问于2013-06-20得票数 2

1回答

我有一个服务，它接收来自许多客户端的请求，并在经过一些处理后向客户端发送响应。我使用ThreadPoolExecutor (threadExecuterClient)来处理客户端请求，并将它们放入BlockingQueue (requestQueue)中。许多客户端可以发送并发请求。我还有另一个用requestQueue处理请求的ThreadPoolExecutor (threadExecuterServer)。这个处理基本上包括将请求发送到服务器并获取响应</

浏览 1提问于2013-03-06得票数 0

2回答

HTML屏幕抓取-并非所有元素都在HttpWebResponse中

、

我目前正在尝试使用以下代码进行屏幕抓取：HttpWebResponse不幸的是，这个页面不是公开的，所以我不能粘贴URL。

浏览 0提问于2012-06-22得票数 2

回答已采纳

1回答

关于图像缓存代码功能的说明

、

但是forKey: url.absoluteString作为NSString有什么用呢？func downloadImage(from urlString: String ) { storeCache(url: url) if let

浏览 10提问于2021-02-13得票数 1

2回答

异步回调

、、

我已经编写了一个使用jQuery发出异步请求的函数。var Site = { $.ajax({ onSuccess: function(data){ $(containerId).html(data);返回两个响应，这是我所期望的。但是，我希望container1和contain

浏览 3提问于2012-03-21得票数 5

回答已采纳

1回答

如何获取URL然后立即返回

、、、

java appengine servlet有没有可能做一个简单的URL抓取(异步)，然后立即返回。我不需要url抓取的响应，因此希望一旦发起url抓取就返回。如果我从servlet返回，我的请求处理程序是等待异步url获取完成(因此没有节省)，还是我的请求处理程序和URL获取完成？

浏览 2提问于2013-10-03得票数 0

1回答

用PHP查询服务器和接收XML响应

、、

有人告诉我，我可以“看一看网络传输，你会从服务器上得到的响应都是基本的xml”。或者，我是不是走错了路？我是否需要知道Flash应用程序正在访问哪个服务器，然后打开到该服务器的连接？这感觉像是一个糟糕的SO问题，但我完全不知所措。我得到的建议相当模糊，所以我不知道去哪里找。

浏览 3提问于2010-12-17得票数 0

回答已采纳

1回答

在没有URL的情况下从网站获取数据

、

我能够解析来自正常网站的数据，但在这个问题上，网站只能使用IP地址作为URL.Is才能访问，它可以被提取，什么解决方案可以使用？

浏览 0提问于2016-05-12得票数 0

1回答

抓取请求url和响应url是不同的。

、

namelist.replace(" ", "_")) yield scrapy.Request(urlparseresponse(self, response): response.meta.get("lister")['responseurl'] = unquote(response.url

浏览 0提问于2019-05-21得票数 0

回答已采纳

7回答

如何在Golang中设置http.Get()请求的超时时间？

、、、

我在Go中做了一个URL抓取器，并且有一个要抓取的URL列表。我向每个URL发送http.Get()请求并获得它们的响应。resp,fetch_err := http.Get(url)

浏览 6提问于2013-06-03得票数 138

回答已采纳

2回答

哪个URL向我的Google Apps脚本发出了请求？

、

如何确定发送到Google Apps脚本web应用程序的GET或POST请求的源URL？我正在制作一个(PayPal IPN)侦听器脚本，希望能够区分请求是来自测试环境(沙箱)还是来自真实环境。对监听程序的请求来源决定了脚本的响应。侦听器必须将响应发送回PayPal，并且根据请求来自哪个环境，响应需要返回到沙箱服务器或实时服务器。我希望在我的Google Apps脚本中区分<em

浏览 3提问于2016-02-18得票数 1

1回答

异步方法:程序员必须解决的并发问题吗？

、、

假设这个getPhotoAsync方法可以每秒调用几次，来自远程服务器的响应可以花费半秒到三十秒不等，这取决于有效负载的大小。因此，将有几个并发请求正在等待。.NET是否“在幕后”跟踪哪个响应与哪个请求对应？info是否有可能与远程服务器的错误响应相关联？public async Task<PhotoWithInfo> getPhotoAsync(object info, string photoid) /

浏览 0提问于2016-08-01得票数 3

回答已采纳

1回答

在Drupal发送404状态下使未找到错误页

、

我有一个用Drupal构建的网站，没有找到的页面将用户重定向到：当我检查这个页面的错误代码时，它有一个“成功200确定”。现在我应该做些什么来产生404错误，这样点击这个破链接并登陆这个页面的用户就会得到404错误，同时Google会知道它是404错误，并防止链接被索引？

浏览 0提问于2013-07-10得票数 2

1回答

通过PHP使用VPN的服务

、、、

我希望通过PHP程序从不同的国家抓取不同的网址，这样我就可以记录他们去哪里了。这将是检查，以确保链接真的到达他们应该去的地方。(不是死链接等。)如果指定的国家/地区不匹配，URL将自动将我路由到其他地方，因此我正在寻找一个具有多个国家/地区的VPN服务，该服务可以接受来自PHP的请求。我可以发送简单的访问URL的请求，然后告诉我它跳过的URL，以及它在哪个URL上结束。我理解PHP并不关心我在哪个</em

浏览 1提问于2016-02-24得票数 0

1回答

动态json渲染页面更新facebook opengraph？

、、、、

url传递一个id，并接收填充页面的json数据，并用参数更新url。谢谢

浏览 0提问于2012-01-28得票数 0

回答已采纳

1回答

检查是否重定向，然后更改查询字符串

、、

我想从所有重定向请求中删除查询参数'mobile‘。页面Redirect.aspx将访问者重定向到Default.aspx?步骤:因此，如果当前请求是重定向的，则必须从查询字符串中删除查询参数"mobile“。问题是:我正在检查状态代码是否为3xx，查询是否有“mobile”参数，但这个条件永远不等于true。readOnlyProperty.SetValue(collection, true, null); {} 为什么模块中的请求

浏览 1提问于2013-11-04得票数 0

回答已采纳

4回答

为什么我不能用Python加载一个Facebook应用程序页面？

、、

我正在设计一个链接抓取程序，它可以抓取给定URL的基本链接预览字段，如页面标题、描述和图像等。到目前为止，我已经有了一个非常好的工作版本，使用了Python库和。大多数url看起来都很完美，但是当我尝试Facebook应用程序的url时，我会得到一个与直接从浏览器访问它不同的HTML响应。我试图了解Facebook应用程序页面是如何向我的浏览器提供某种HTML响应的，以及如何将另一个HTML响应传递给我的Python服务器。Facebook应用程序示例

浏览 2提问于2012-03-15得票数 0

回答已采纳

3回答

NodeJS速成网络抓取头问题

、、

，我试图在我的请求中使用承诺，但我想我可能对我的代码实际上在做什么有一个根本的误解。 }) return bosses; rp(url) .then(res.send('Bosse

浏览 1提问于2018-01-31得票数 1

回答已采纳

5回答

刷新已发布URL中的元数据

、、

在Facebook中，当我发布链接时，Fascebook会包含旧的元数据(标题、描述等)。我最近添加了Open Graph Protocol元标签，但Facebook仍然使用旧的东西。Facebook如何刷新此元数据，我可以强制刷新吗？

浏览 4提问于2011-07-20得票数 23

点击加载更多