php网页抓取不到 - 腾讯云开发者社区

、

我目前正在开发一个网络爬虫在PHP中，它仍然是一个简单的，但我想知道的是，我怎样才能使我的爬虫在后台爬行页面，而不使用我的带宽，我必须使用一些cron作业，我想它自动存储在数据库中的数据。php ini_set('max_execution_time*>(.*)<\/a>"

浏览 2提问于2015-08-06得票数 0

2回答

Python抓取包含PHP的页面源代码

、

我知道如何抓取源代码HTML，但不知道PHP，有没有可能用内置的函数？

浏览 0提问于2013-02-25得票数 0

回答已采纳

1回答

我的python应用程序不能工作，并给出一个None作为回答

、

嗨，我想知道为什么我的应用程序会给我这个错误，我已经尝试了所有我在谷歌找到的东西，但仍然不知道为什么会这样 import requests URL = 'https://www.amazon.co.uk/XLTOK-Charging-Transfer-Charger-Nintendo/dp/B0828RYQ7W/ref=sr_1_1_sspa?dchild=1&keywords=type+c&qid=1598485860&sr=8-1-spons&psc=1&spLa=ZW5jcnl

浏览 27提问于2020-08-27得票数 0

2回答

Google爬行是否在PHP中包含/要求文件？

、、

我是php的新手，我正在使用一个具有导航条的php网站工作。这个网站将是相当大(超过30页)，我不想改变我的导航栏在每一页，如果我有必要改变它。我也希望谷歌的蜘蛛跟踪导航栏上的链接。

浏览 0提问于2014-11-14得票数 0

回答已采纳

4回答

从格式不佳的网页中刮取数据

、、

我在试着从网页上抓取数据。网页可以是任何网页。例如，我正在使用http://www.google.com/使用curl进行抓取。它发出了这么多警告，却什么也不做。警告在第30行：这个错误重复了好几次。我有网页要解析，但我找不到出路。这是一个非常简单的代码，不起作用。

浏览 3提问于2012-10-03得票数 0

1回答

使用Selenium检索反向链接、HTTP代码和IP地址

、、

我正在使用硒来‘废纸’网页寻找反向链接到我的网站。我一直在使用普通的curl来抓取，但是curl在JavaScript上玩得并不好(实际上它们根本不能玩)。我的问题是，我需要来自我抓取的页面的HTTP头响应(200,301,404,503等)代码。理想情况下，我希望获得的IP地址的域名，我正在抓取以及。我在下面的链接中使用php的facebook PHP webdriver，但我找不到如何检索任何标题信息。我的问题是，有没有办法让Selenium返回头信息和

浏览 0提问于2013-04-06得票数 1

回答已采纳

2回答

用PHP抓取网页

、、、、

我有一个网页，我想要提取所有跨度和锚标签值从一个表中的ticker。像这个LPCL，11.06等，我尝试了curl和php dom文档。它不起作用。

浏览 1提问于2014-01-23得票数 0

1回答

BeautifulSoup Find随机返回None

、、、

我们正在尝试从with中抓取产品，但BeautifulSoup find方法出现了一些奇怪的问题。

浏览 2提问于2016-12-01得票数 0

1回答

如何从url中获取丰富的内容(比如不和谐)？

我想用php或javascript来做。示例：

浏览 4提问于2020-10-04得票数 0

回答已采纳

1回答

如何将CURLOPT_HTTPHEADER页面放入iframe？

、、、、

他是/m/index.php页面的源代码：$ch = curl_init(); curl_setopt($ch

浏览 1提问于2012-11-25得票数 1

1回答

通过map抓取在线地图中的信息

、、

我正在尝试从这个网页中的地图上抓取信息任何帮助都将不胜感激。

浏览 4提问于2016-06-28得票数 0

1回答

为什么BeautifulSoup无法从页面源代码中抓取完整的脚本？

、、

然而，抓取的结果脚本与我在Chrome上查看页面源代码时观察到的脚本并不相同。有没有办法在不求助于其他库的情况下抓取我想要的东西？在此之前，非常感谢您。

浏览 3提问于2020-07-23得票数 0

2回答

在网页的“源代码”中看不到数据时，从https://nforlanwebdmz.phs.org中刮取和提取数据

、、、

我正在尝试编写一个自动化的PHP脚本来抓取和提取所有的“作业ID”(3262,3197,3196等)。来自URL 。任何帮助都将不胜感激。

浏览 7提问于2017-02-04得票数 0

回答已采纳

1回答

验证来自cURL的完整响应

、、

有时，当使用多个并发连接和抓取我的PHP脚本中的cURL时，会返回不完整的网页。curl_getinfo()中有没有一些值可以让我知道一个网页是100%被抓取还是只有90%被抓取？

浏览 0提问于2013-04-12得票数 0

回答已采纳

1回答

Facebook Feed (使用PHP的RSS)

、

我如何在我的网站上使用PHP实现这一点？我需要学习什么才能实现它？

浏览 1提问于2010-11-02得票数 0

回答已采纳

10回答

使用Java进行Web抓取

、、

我找不到任何好的基于Java的web抓取API。我需要抓取的站点也不提供任何API；我想使用一些pageID遍历所有网页，并在它们的DOM树中提取HTML标题/其他内容。除了网络抓取之外，还有其他方法吗？

浏览 1提问于2010-07-08得票数 72

回答已采纳

1回答

如何使用XPath在iOS上进行刮擦？

、、、、

我的目标是通过XPath抓取网页，但是我找不到任何有关这方面的信息，而不是XPath，我使用HTMLKit。有没有一种使用XPath脚本在iOS平台上抓取网页的方法？

浏览 2提问于2021-04-22得票数 2

回答已采纳

2回答

无法在html中使用j五十四获取图像src。

、、

我正在尝试使用这个查询来获取这个帖子的instagram img，但是没有得到任何result.Please帮助！ doc = Jsoup.connect("https://www.instagram.com/p/BQGyI2JjKUN/").get(); System.out.println("Title:"+title); Elements images = doc.select("img[src~=

浏览 5提问于2017-02-05得票数 0

回答已采纳

2回答