用ChromeDriverManager (Python)从网页中提取文本

文章/答案/技术大牛

发布

1回答

、、

from selenium import webdriverfrom selenium.webdriver.chrome.optionschrome_options = Options()driver = webdriver.Chrome(ChromeDriverManager

浏览 18提问于2021-05-11得票数 0

回答已采纳

1回答

如何从乌德米那里提价？

、、、

我的问题是如何使用python & selenium从Udemy中提取课程价格？我的尝试是在下面。webdriverfrom webdriver_manager.chrome import ChromeDriverManageroptions = Options() driver = webdriver.Chrome(ChromeDriverManager().i

浏览 1提问于2021-10-27得票数 0

回答已采纳

1回答

为我的任务写一些文字？

、、、

基本上，我需要一个工具(最好用于linux)，用于从网页中获取一些数据，打开其他一些数据，在它们上填写表单，关闭窗口并单击一些按钮。这样做的工具是什么呢？像Perl或Python这样的脚本语言可以帮我吗？这可能是困难的，所以给我的方式，是最友好的用户。-)我不熟悉Perl或Python，但我有很强的意志使它发挥作用，因为它对我很重要。开放网页 从</

浏览 4提问于2014-05-11得票数 1

回答已采纳

1回答

无法使用pandas、python更新数据帧中的值

、、、

我正在尝试使用python中的pandas库来更新csv文件中名为'Stock'，'Regular Price'，'Sale price‘的列。用于更新csv的值是从网站提取的。我使用selenium登录网站并输入所需的页面，BeautifulSoup解析页面，json从解析后的网页中提取特定值。我已经成功地提取了所需的数据，但我无法用提取的valu

浏览 17提问于2020-09-25得票数 0

1回答

用python和scrapy从网页中提取文本

、、

我试图使用scrapy在python上使用一个简单的蜘蛛代码提取的每个标题的文本。下面是html代码的一部分。from scrapy.item import Field from

浏览 1提问于2020-04-06得票数 1

回答已采纳

1回答

从网页中提取主题/关键字

、、

我正在寻找一个系统，以提取主题或简单的关键字从一个网页，只有从指定的网页，没有跟随所包含的链接。要分析的页面属于不同的站点，特别是我想分析一个人在Facebook上共享的链接，并从这些页面中提取主题或简单的关键字。非常感谢。

浏览 5提问于2014-04-11得票数 0

3回答

如何在带有re(gex)的Python中找到像252.63.71.62这样的模式？

、

我有一个网页，我使用Python中的resources模块从该网页获取文本。但是，我不明白，如何从文档中获取像126.23.73.34这样的数字模式，并使用re模块将其提取出来？

浏览 1提问于2013-05-03得票数 0

回答已采纳

2回答

如何在没有额外信息的情况下有效地从网页簇中提取文本

、、、、

我有大约一百万的网页列表，我想有效地从这些网页上提取文本。目前我正在使用python中的BeautifulSoup库从HTML中获取文本，并使用请求命令来获取网页的html。这种方法除了文本之外还提取一些额外的信息，比如在body中是否列出了任何javascript。你能给我推荐一些合适而有效的方法来完成这项工作吗？我看了scrapy，但它看起来像爬行特定的网站

浏览 24提问于2019-05-22得票数 0

1回答

我在一个项目中工作，我正在爬行数千个网站来提取文本数据，最终的用例是自然语言处理。编辑*由于我正在爬行100个数以千计的网站，我不能为每个网站定制一个抓取代码，这意味着我不能搜索特定的元素id，我正在寻找的解决方案是一个通用的* 我知道一些解决方案，比如美丽汤中的.get_text(这种方法的问题是，它从网站获取所有文本，其中大部分与特定页面上的主要主题无关。在大多数情况下，网站页面将致力于一个单一的主要主题，但在侧面和顶部和底部可能有关于其他主题或促销或其他内容的链接或文本。是否还有另

浏览 16提问于2020-05-18得票数 0

3回答

元素在使用Python/Selenium时不具有可交互异常。

、、、、

我正在尝试在python中使用selenium登录一个网站()。from selenium.webdriver.common.keys import Keysimport time username = 'example@hotm

浏览 8提问于2022-10-29得票数 -1

回答已采纳

1回答

从网页中提取文本，使用Perl/Python进行处理，然后重建添加了链接的页面

、、、

我正在构建一个web应用程序，它处理网页中的文本，添加到某些实体的链接，然后重新显示页面，但添加了一些链接。我的服务器端代码是用Perl和Python编写的，我目前正在使用HTML::Parser从页面中提取文本。我可以清理标记、提取和处理文本，但我希望完全显示原始页面，只向以前未链接的文本添加一些链接。我希望找到最好的方法来重新显示与添加到文本中某些单词或短语的

浏览 1提问于2012-04-13得票数 0

回答已采纳

3回答

“汤”和“美汤”中的“汤”是什么意思？

、

“汤”和“美汤”中的“汤”是什么意思，为什么它被称为“汤”？

浏览 1提问于2014-05-19得票数 10

3回答

在浏览器(由BeautifulSoup生成)中直接从Python启动HTML代码

、、、

我已经使用Python3.3的BeautifulSoup成功地从网页中提取了所需的信息。我还使用了BeautifulSoup生成新的超文本标记语言代码来显示此信息。目前，我的Python程序打印出HTML代码，然后我必须复制、粘贴并另存为HTML文件，然后我可以在浏览器中测试它。所以我的问题是，有没有办法用Python语言在浏览器中启动由BeautifulSoup生成的HTML代码，这样我就不需要使用复制粘贴的方法了

浏览 2提问于2014-01-30得票数 26

回答已采纳

1回答

perl中的Web Crawler问题

、、

我用Perl构建了一个网络爬虫。HTML::ContentExtractor 从网页中提取文本。示例代码的参考链接问题是，它不会从具有.aspx扩展名的网页中获取文本。它非常适合其他网页，我不知道为什么这个爬虫在aspx页面上会失败。

浏览 8提问于2014-04-25得票数 0

1回答

从网页中提取文本

、、、、

我正在尝试从开始解析网页中的文本。这个页面有到最终页面的链接(也可以手动移到文本文件中，以避免额外的编码工作)。在左侧的最后一页上有一个页面索引。并且每个页面也有一个页面索引。从这个项目列表中，我只需要提取一行以“Configuring”、“Configuration Examples”或“Example”开头的行。如果可以从任何工具中提取此信息，则该工具会在找到时按分层顺序爬行和记录项目。可能是一些简单的格式，其中

浏览 0提问于2012-09-08得票数 0

2回答

新手Python正则表达式问题:从网页中提取日期

、

我希望使用Python从网页中拉出一个常规的文本字符串-源代码运行如下：它总是开始的结束(&E)我已经抓取了网页的文本，只想提取日期和类似结构的信息。

浏览 0提问于2010-12-17得票数 1

回答已采纳

2回答

在带有多个html标记的网页中查找带有BeautifulSoup的文本？

、、

我正在尝试使用BeautifulSoup和Python从网页中提取文本。我已经做了很多次不同的网页，总是得到我需要的信息，但这一次，从网页的html源代码有很多脚本和其他东西。这是我想从以下页面中提取信息的页面之一：这个网页的问题在于它有很多iframe标记，每个标签都有一个开始标记(html)和一个关闭标记(/html)，我可以从主页中提取信息，但不能提取<

浏览 5提问于2015-10-16得票数 0

回答已采纳

3回答

无硒头与无头硒

、、、、

我目前正在使用python中的Selenium进行一个working抓取项目。 opts = webdriver.ChromeOptions() driver = we

浏览 1提问于2021-06-01得票数 4

1回答

无法在Selenium中不使用time.sleep()打印文本

、

无法从Python中的print语句中获得以下代码的文本，但是当我试图在print(new_cases.text)语句之前添加time.sleep(4)时，我能够获得文本，我正在使用显式wait.Canfrom selenium import webdriverfrom selenium.webdriver.common.byselenium.webdriver.suppo

浏览 6提问于2022-02-20得票数 0

2回答

如何使用BeautifulSoup提取网页“关于我们”的文本

、、

我是新的网络抓取，我不知道如何从网页上的“关于我们”下的文本。请您指点我，或者提供代码，以便在这样的网页中提取“关于我们”的文本。我可以在头文件中看到“关于我们”，但是无法用这个标题提取数据。

浏览 1提问于2019-08-03得票数 0

点击加载更多