使用selenium和漂亮汤的Web抓取代码不能正常工作_我想使用GitLab ci和ssh在我的网站服务器上推送我的gitlab代码，但当我拉出时它不能正常工作 - 腾讯云开发者社区

python、selenium、web-scraping、beautifulsoup、python-requests

我正在尝试从以下html文件中抓取iFrame (id=“id=”)的内容：我试着使用selenium和漂亮的汤，但是代码仍然看不到iFrame中的元素。有没有一种有效的方法从这个html文件中抓取上述iFrame的内容(最好不使用selenium)？

浏览 3提问于2020-05-27得票数 0

回答已采纳

5回答

LinkedIn网络抓取

data-mining、social-network-analysis、crawling、scraping

最近，我发现了一个用于连接到新R包 API的LinkedIn。不幸的是，从一开始，LinkedIn API似乎是非常有限的；例如，您只能获得公司的基本数据，这与个人的数据是不同的。我想获取某一公司所有员工的数据，您可以使用在现场手动操作，但是通过API是不可能的。如果import.io是识别LinkedIn分页，那么它将是完美的(参见页面末尾)。是否有人知道适用于LinkedIn站点当前格式的任何web</

浏览 0提问于2015-05-13得票数 11

回答已采纳

2回答

如何使用selenium* web驱动程序托管由web抓取支持的后端服务？*

python、selenium、selenium-webdriver、flask、web-scraping

因此，我正在开发一个项目来抓取一个网站并将数据传递给用户，但是我正在使用带有python/flask的selenium/selenium web驱动程序。我本来打算用漂亮的汤，但我抓取的网站需要在页面上进行一些交互。我有一切工作与刮刀，我只是试图找出一种方法，使这项工作，如果我想要托管在一个网站上使用的服务

浏览 20提问于2020-05-03得票数 1

2回答

抓取特定文本的网页(字符串)

python

在stackoverflow上的第一个帖子，所以如果我没有正确发帖，我道歉。我试图抓取网页的信息，只有当一个特定的文本字符串存在。我只是使用了漂亮的汤，但找不到包含我正在寻找的文本的元素。经过更多的研究，我尝试使用selenium，因为我知道一些动态加载的元素在漂亮的汤中是找不到的</

浏览 0提问于2020-06-06得票数 1

1回答

Selenium:在不被重定向到页面的情况下单击时获取按钮的url

python、selenium、beautifulsoup、request

在抓取页面时，我尝试在不被重定向的情况下获得下一页。问题是这个按钮在html中没有下一个页面url，所以我不能直接用漂亮的汤或selenium获得它，只有单击：nav_list = div_list.find_elements(by=By.TAG_NAME, value = "butto

浏览 8提问于2022-05-12得票数 1

回答已采纳

1回答

有没有可能用漂亮的汤刮出一个“动态网页”？

python、html、selenium、beautifulsoup

我现在开始用漂亮的汤来抓取网站，我想我已经掌握了基本的知识，虽然我缺乏网页的理论知识，但我会尽我最大的努力来表达我的问题。我所说的动态网页是这样的:一个网站，它的HTML会根据用户的动作而改变，在我的例子中，它是可折叠的表格。我想获得一些"div“标签中的数据，但是当你加载页面时，数据在html代码中

浏览 1提问于2016-11-22得票数 4

1回答

为什么python抓取结果与浏览器中的结果不同

python、web-scraping、beautifulsoup、selenium-chromedriver、referrer

我可以在浏览器中浏览页面https://www.xiami.com/artist/O9fc383，但是当我用chrome驱动解析它时，我得到了不同的源代码，如下所示，所以我不能刮掉那个页面，我该怎么办？浏览器中没有源代码的此表单。 ...

浏览 2提问于2018-08-31得票数 0

4回答

如何将web* scraping python项目转换为桌面应用程序？*

python、web-scraping、beautifulsoup

我已经在漂亮汤的帮助下用python创建了一个web scraping项目，但我希望我的项目能作为桌面应用程序工作。因此，我可以运行该应用程序，并在特定的url上执行web抓取。有没有可能使用python和美汤，或者我必须用不同的语言制作这个项目？

浏览 0提问于2020-04-05得票数 0

1回答

如何从这个html中提取链接

python、html、beautifulsoup

我是HTML的新手，我正在尝试用漂亮的汤抓取一些web数据。我能得到这样的标题value.find(&

浏览 1提问于2020-08-13得票数 0

3回答

用python刮网站

python、web-scraping、beautifulsoup、scrapy、libraries

我试图在网上刮一个网站，以获取价格和标题从它。我已经看过多个教程和博客，最常见的库是漂亮汤和scrapy。如果有一种方法可以在不使用任何第三方库(如beautifulsoup和scrapy )的情况下抓取一个网站，那么就可以使用beautifulsoup。

浏览 1提问于2020-06-09得票数 1

回答已采纳

1回答

当导出到csv时，会重复爬行的数据。

python、selenium、web-scraping、beautifulsoup、web-crawler

我正在尝试从这个中抓取数据我的想法是爬行网络上的所有链接，然后使用for发送请求到每个链接，以获得详细的数据。这是我的，正如您所看到的，我使用selenium web驱动程序打开URL，然后使用漂亮的汤来抓取数据。它的工作非常成功，但是当它被导出到CSV文件时，第一个链接的

浏览 1提问于2021-02-03得票数 0

回答已采纳

2回答

urllib.request + BeautifulSoup不能刮某些页面，而只能刮根页

python、web、web-scraping、beautifulsoup、urllib

我在从url 中抓取信息时遇到了问题，但是由于网站处理事情的方式，BeautifulSoup只是从根页面收集数据，也就是。<main class="site-content" id="content"> <div class="loading-spinner" data-request="epsilon-&quo

浏览 0提问于2017-01-26得票数 0

回答已采纳

1回答

尝试使用"from bs4 import BeautifulSoup“时出现错误

python、selenium、web-scraping、beautifulsoup

from selenium.webdriver import Chrome fromselenium.webdriver.chrome.options import Options` import pandas aspd to ‘您试图在Python2下使用Python3特定版本的美丽汤。这是行不通<

浏览 7提问于2022-09-24得票数 0

1回答

Python抓取td类跨度

python、html、web、beautifulsoup、screen-scraping

新来的Python和Web抓取..。我一直在寻找刮擦突出显示的一段代码，以便我可以检索数字1.16，7.50和14.67，但没有joy在使用td，类，表-matches_pageSoup.find_all_ of .有人知道我在这里错过了什么吗我用的是漂亮的汤。

浏览 2提问于2018-02-25得票数 0

回答已采纳

2回答

调用Twitch时BeautifulSoup不返回html

python、web-scraping、twitch

我正在尝试为Twitch做一个网络抓取器，它将获得流的标题和流信息。我可以从其他网站中取出页面的特定部分，但当我放入一个流时，它看起来不像inspect元素中的html。它看起来就像一团乱麻。

浏览 20提问于2021-01-08得票数 0

2回答

用硒美汤寻找元素

python、python-3.x、selenium、beautifulsoup

一般来说，我对网络抓取和数据科学是个新手。根据不同的消息来源，美丽的汤比硒更快的抓取网页。我正在写一些在社交媒体评论中爬行的代码。我使用Selenium自动单击检索旧注释的按钮，并使用以下命令从注释中获取文本我知道feature没有允许我直接输入xpath来查找元素的特性在这种情况下，我是否应该摆脱对

浏览 18提问于2019-07-24得票数 0

回答已采纳

3回答

网络刮板的多线程或多处理

python、multithreading、web-scraping、multiprocessing

所有这些网页刮板访问不同的网站，其中一些利用硒，而另一些不需要硒。有些需要30秒才能跑，而另一些则需要45分钟。还是多处理是在最快的时间内运行所有这些刮板的更好的方法？

浏览 6提问于2022-04-27得票数 0

1回答

利用漂亮汤刮网时的颜色编码

python、web-scraping、beautifulsoup

我正在使用Python中的漂亮汤来做web 抓取。网站上的文字有红色字体颜色的名字，我需要有颜色代码。我正在使用网站上的文本作为我的培训数据的纳(仅为正确的名称)。我怎么才能用漂亮汤得到颜色码呢？现在我的代码看起来是这样的。

浏览 2提问于2021-08-07得票数 1

回答已采纳

1回答

selenium Web驱动程序不返回Wikipedia表

python、selenium、web-scraping、selenium-chromedriver、webdriverwait

我正在努力搜集一张表，里面有美国所有总统选举的结果。为此，我想使用selenium。我相信我要抓取的表是由客户端脚本(javescript)执行的，因此在抓取site.Note之前，我试图注意某个特定标记的存在:我尝试过用漂亮的汤直接抓取页面，但总是得到“无”的响应。这是我的代码。BeautifulSoup(page,'

浏览 16提问于2020-11-21得票数 1

回答已采纳

3回答

“美丽的汤”查找()并不能找到类的所有结果

python、html、web-scraping、beautifulsoup

我有代码试图在tracklist容器中提取所有html内容，它应该有88首歌曲。信息肯定在那里(我打印了汤以检查)，所以我不知道为什么前30 react-contextmenu-wrapper之后的所有东西都丢失了。= BeautifulSoup(html, "html5lib") print(main)

浏览 6提问于2019-10-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用python无源抓取iframes

LinkedIn网络抓取

如何使用selenium* web驱动程序托管由web抓取支持的后端服务？*

抓取特定文本的网页(字符串)

Selenium:在不被重定向到页面的情况下单击时获取按钮的url

有没有可能用漂亮的汤刮出一个“动态网页”？

为什么python抓取结果与浏览器中的结果不同

如何将web* scraping python项目转换为桌面应用程序？*

如何从这个html中提取链接

用python刮网站

当导出到csv时，会重复爬行的数据。

urllib.request + BeautifulSoup不能刮某些页面，而只能刮根页

尝试使用"from bs4 import BeautifulSoup“时出现错误

Python抓取td类跨度

调用Twitch时BeautifulSoup不返回html

用硒美汤寻找元素

网络刮板的多线程或多处理

利用漂亮汤刮网时的颜色编码

selenium Web驱动程序不返回Wikipedia表

“美丽的汤”查找()并不能找到类的所有结果

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐