从表中通过网络抓取链接_抓取表中的链接，单击链接和抓取数据_通过BS4抓取表中的url链接 - 腾讯云开发者社区

python、regex、web-scraping、data-science

我想从网上抓取的链接和他们各自的文本从一个表。我计划使用正则表达式来完成此任务。假设在这个页面中我有多个<a href="url_i">text_i</a>标记。我想把所有的text_i放到一个列表中，然后把所有的href放到一个单独的列表中。*><a .*>(.*)</a></table>, web_text)' 正则表达式在HTML表中找到

浏览 15提问于2020-09-16得票数 1

2回答

未从ipv4网络解析ipv6 dns名称

python、dns、screen-scraping、cdn、ipv6

我有一个实时刮板，运行在我的服务器上，运行在ipv6网络上。抓取之后，这个抓取器通过ajax调用将一些urls返回给网页上的图像，然后这些图像通过抓取器返回的链接显示在我的本地机器上的浏览器中。但是这些urls不能在我的本地网络上解析。我的本地计算机不能在ipv6网络上运行。此外，被抓取的网页通过CDN托管图像，因此抓取器将根据其运行的机器/位置返回图像

浏览 2提问于2012-06-27得票数 1

回答已采纳

1回答

rails将两个表连接在一起

ruby-on-rails

到目前为止，我还没有创建第二个表，但是第一个表已经存在。基本上，我让这个web抓取返回数据，如下所示： ["formatted_sum_fees", "Â£5.60"],新表大概会有这样的结构： ID

浏览 1提问于2016-05-31得票数 0

1回答

在网络抓取morningstar时获取空列表

python-3.x、web-scraping

我正在尝试迭代不同共同基金的符号，并使用这些符号从他们的Morningstar个人资料中提取一些信息。网址如下：在上面的例子中，ZVGIX是符号。第一个链接的答案建议使用selenium和chromedriver，但考虑到我对抓取的数据量感兴趣，这是不切实际的。那么，我如何将该解决方案应用到我的案例中？编辑:上面的代码返回[]，如果不清楚的话。

浏览 12提问于2019-07-10得票数 0

回答已采纳

1回答

无法通过网络抓取从Google搜索页面中抓取所有链接

python、web-scraping、beautifulsoup、python-requests、python-requests-html

我是一个网络抓取的初学者。最近我试着从Google SERP的搜索结果中抓取域名。执行此操作时，输出中缺少一些链接。问题似乎是，当我将获取的文本与Chrome上的源代码进行比较时，请求似乎没有完全获取页面(缺失的标记存在于缺失的代码中)。我想知道是什么原因！

浏览 1提问于2021-06-08得票数 0

4回答

通过selenium单击链接

python、python-2.7、python-3.x、selenium-webdriver、web-scraping

我正在尝试通过Selenium做一些网络抓取。我的问题很简单:如何找到一个链接，然后如何点击它？例如:以下是我试图从web上抓取的HTML： <a href="javascript:selectDodasaDetdasdasy(220011643,'Kdasdası');" target="_self"> &l

浏览 40提问于2013-09-04得票数 37

回答已采纳

1回答

在R中，使用rvest和xml2从网站上的<script>元素中提取JSON对象

r、web-scraping、rvest、xml2

之前在PGA网站的页面上发布了一篇关于刮表的文章。总之，由于这个页面使用javascript呈现页面和表的方式，所以领导板表很难抓取。我可以检查并在标记中看到有一个包含有用信息的对象global.leaderboardConfig：是否可以在R中以列表的形式得到这个对象？我能够使用xml2::read_html('https://www.pgatour.com/leaderboard.html') %>% html_nodes('

浏览 3提问于2021-04-16得票数 6

回答已采纳

1回答

如何从多个页面的搜索结果中抓取数据？

xpath、web-scraping

我对使用Xpath和google sheets函数IMPORTXML( URL；Xpath)从包含多个页面的搜索结果的URL进行web抓取有疑问:我希望从其中提取数据(特别是每个结果的链接)的页面是：为了澄清我的解释，我通过链接附上了几张图片： //td[@class='msDataText gridFundName Shrink']/a/@href以下是我的疑虑：

浏览 26提问于2018-10-08得票数 1

回答已采纳

1回答

从Excel导出数据的有效解释方法

excel、export

我们必须做每小时/每天的指标报告，这涉及到导出数据&复制/粘贴到google工作表中，然后得到我们的数字。我的问题是，如果后台访问数据库被拒绝，有没有更有效的方法来获取这些数据。理想情况下，我想做我自己的查询，但由于我没有访问权限，我在网页上运行查询，导出到excel，然后将数据复制粘贴到google表格中，然后使用查询功能来获取我需要的内容。你有什么建议的解决方案？

浏览 1提问于2018-03-14得票数 0

1回答

用Python抓取Web应用程序

python、web-scraping

到目前为止，我在网络抓取方面的大部分经验都是非常简单和容易理解的。发送请求，下载HTML，并提取所需的信息。目前，我对从Spotify Web应用程序中抓取顶级游戏数据感兴趣。这些数据无法通过API访问，但在浏览不同的艺术家页面时可以看到。我的问题是，这些数据是如何在幕后生成的，是否有可能抓取这些数据？

浏览 5提问于2015-02-09得票数 2

1回答

在R中刮取<div>标记中的所有链接

r、web-scraping

我是一个网络抓取新手，需要帮助。我试图从一个有大约20页的属性站点中抓取数据，在每个页面中有到不同属性的18条链接。我的最终目标是从每个属性链接中抓取所有数据。为此，我考虑通过将页面参数增加1来运行20页的循环。但在这样做之前，我需要从单个页面上的每个属性中抓取数据，为此我需要链接到单个页面上的所有属性，因此需要从页面中抓取所有链接</

浏览 1提问于2018-09-26得票数 0

回答已采纳

2回答

从整个web上抓取数据

web-scraping

我需要开发一个抓取工具，从整个网络上抓取产品的数据(价格，标题等)。现在，我确实有抓取的经验，但这是一个单一的网站。我不知道如何抓取整个网络。一种可能的解决方案是查询google，然后从google中出现的链接中抓取每个网站。这是一种好的方法吗？

浏览 0提问于2012-04-14得票数 1

回答已采纳

2回答

从与数据库中的数据不同的链接复制文档

php、mysql

我从网络上抓取了pdf链接，我想通过检查数据库中存在的文档的名称(我从链接中获得)来复制数据库中还不存在的pdf。

浏览 3提问于2012-10-12得票数 1

回答已采纳

1回答

等待网站改变一些东西

web、web-testing

有一个表Rem，其中它显示了用户界面中剩余的位置数。另外，你会用什么语言来解决这个问题呢？

浏览 2提问于2016-11-02得票数 0

回答已采纳

3回答

Python错误：'NoneType‘对象没有使用Beautiful Soup的属性'find_all’

python、html、beautifulsoup

我在运行一些网络抓取代码时遇到了问题。要从一系列链接中抓取信息，如下所示： http://www2.congreso.gob.pe/Sicr/TraDocEstProc/CLProLey2006.nsf/ec97fee42a2412d5052578bb001539eeOpenDocument 我正在尝试从表中抓取某些元素，但收到以下错误： Python Error:

浏览 44提问于2020-04-18得票数 1

回答已采纳

1回答

CakePHP -从表中检索出现次数最多的值

php、mysql、cakephp

我有一个简单的名为“Services”的表。然后，客户在“customers表”中使用这些服务，并通过服务ID进行链接。我如何使用蛋糕从“客户”表中抓取最常用的服务？

浏览 1提问于2013-08-05得票数 0

2回答

在PGA网站上从JavaScript表中抓取Python

javascript、python、beautifulsoup

我刚刚开始学习Python，并且一直在与BeautifulSoup一起工作，从网络上抓取体育数据。下面是一个示例链接"“--表是所有的播放器统计表。谢谢!

浏览 8提问于2017-03-13得票数 0

回答已采纳

1回答

如何利用c#从网站中抓取表格并导出到excel中

c#、excel、web-scraping

我有一个链接，我想应用网络抓取，通过它我可以获得表的信息，然后将这个表导出到excel.Please建议 HtmlDocument doc = new HtmlAgilityPack.HtmlDocument

浏览 2提问于2014-04-01得票数 0

1回答

如何使用python/大熊猫从这个网页中读取表格？

python、pandas、web-scraping

网页链接- 我试过使用熊猫、read_html和bs4这样的网络抓取库，但是没有运气，因为网页上的数据没有包装在一个表标签中。请帮帮我!

浏览 3提问于2021-02-17得票数 0

回答已采纳

1回答

PHP从表中抓取链接

php、web-scraping

如何从表中只获得一个链接？

浏览 2提问于2015-05-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云