腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用
ChromeDriverManager
(
Python
)
从
网页
中
提取
文本
、
、
from selenium import webdriverfrom selenium.webdriver.chrome.optionschrome_options = Options()driver = webdriver.Chrome(
ChromeDriverManager
浏览 18
提问于2021-05-11
得票数 0
回答已采纳
1
回答
如何
从
乌德米那里提价?
、
、
、
我的问题是如何使用
python
& selenium
从
Udemy中
提取
课程价格? 我的尝试是在下面。webdriverfrom webdriver_manager.chrome import
ChromeDriverManager
options = Options() driver = webdriver.Chrome(
ChromeDriverManager
().i
浏览 1
提问于2021-10-27
得票数 0
回答已采纳
1
回答
为我的任务写一些文字?
、
、
、
基本上,我需要一个工具(最好用于linux),用于
从
网页
中
获取一些数据,打开其他一些数据,在它们上填写表单,关闭窗口并单击一些按钮。这样做的工具是什么呢?像Perl或
Python
这样的脚本语言可以帮我吗?这可能是困难的,所以给我的方式,是最友好的用户。-)我不熟悉Perl或
Python
,但我有很强的意志使它发挥作用,因为它对我很重要。开放
网页
从</
浏览 4
提问于2014-05-11
得票数 1
回答已采纳
1
回答
无法使用pandas、
python
更新数据帧
中
的值
、
、
、
我正在尝试使用
python
中
的pandas库来更新csv文件
中
名为'Stock','Regular Price','Sale price‘的列。用于更新csv的值是
从
网站
提取
的。我使用selenium登录网站并输入所需的页面,BeautifulSoup解析页面,json
从
解析后的
网页
中
提取
特定值。我已经成功地
提取
了所需的数据,但我无法
用
提取
的valu
浏览 17
提问于2020-09-25
得票数 0
1
回答
用
python
和scrapy
从
网页
中
提取
文本
、
、
我试图使用scrapy在
python
上使用一个简单的蜘蛛代码
提取
的每个标题的
文本
。下面是html代码的一部分。from scrapy.item import Field from
浏览 1
提问于2020-04-06
得票数 1
回答已采纳
1
回答
从
网页
中
提取
主题/关键字
、
、
我正在寻找一个系统,以
提取
主题或简单的关键字从一个
网页
,只有
从
指定的
网页
,没有跟随所包含的链接。要分析的页面属于不同的站点,特别是我想分析一个人在Facebook上共享的链接,并从这些页面中
提取
主题或简单的关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
3
回答
如何在带有re(gex)的
Python
中找到像252.63.71.62这样的模式?
、
我有一个
网页
,我使用
Python
中
的resources模块
从
该
网页
获取
文本
。但是,我不明白,如何
从
文档
中
获取像126.23.73.34这样的数字模式,并使用re模块将其
提取
出来?
浏览 1
提问于2013-05-03
得票数 0
回答已采纳
2
回答
如何在没有额外信息的情况下有效地
从
网页
簇中
提取
文本
、
、
、
、
我有大约一百万的
网页
列表,我想有效地从这些
网页
上
提取
文本
。目前我正在使用
python
中
的BeautifulSoup库
从
HTML
中
获取
文本
,并使用请求命令来获取
网页
的html。这种方法除了
文本
之外还
提取
一些额外的信息,比如在body
中
是否列出了任何javascript。 你能给我推荐一些合适而有效的方法来完成这项工作吗?我看了scrapy,但它看起来像爬行特定的网站
浏览 24
提问于2019-05-22
得票数 0
1
回答
Python
,
从
网页
中
提取
文本
、
、
、
、
我在一个项目中工作,我正在爬行数千个网站来
提取
文本
数据,最终的
用
例是自然语言处理。编辑*由于我正在爬行100个数以千计的网站,我不能为每个网站定制一个抓取代码,这意味着我不能搜索特定的元素id,我正在寻找的解决方案是一个通用的* 我知道一些解决方案,比如美丽汤
中
的.get_text(这种方法的问题是,它从网站获取所有
文本
,其中大部分与特定页面上的主要主题无关。在大多数情况下,网站页面将致力于一个单一的主要主题,但在侧面和顶部和底部可能有关于其他主题或促销或其他内容的链接或
文本
。是否还有另
浏览 16
提问于2020-05-18
得票数 0
3
回答
元素在使用
Python
/Selenium时不具有可交互异常。
、
、
、
、
我正在尝试在
python
中使用selenium登录一个网站()。from selenium.webdriver.common.keys import Keysimport time username = 'example@hotm
浏览 8
提问于2022-10-29
得票数 -1
回答已采纳
1
回答
从
网页
中
提取
文本
,使用Perl/
Python
进行处理,然后重建添加了链接的页面
、
、
、
我正在构建一个web应用程序,它处理
网页
中
的
文本
,添加到某些实体的链接,然后重新显示页面,但添加了一些链接。我的服务器端代码是
用
Perl和
Python
编写的,我目前正在使用HTML::Parser
从
页面中
提取
文本
。我可以清理标记、
提取
和处理
文本
,但我希望完全显示原始页面,只向以前未链接的
文本
添加一些链接。我希望找到最好的方法来重新显示与添加到
文本
中
某些单词或短语的
浏览 1
提问于2012-04-13
得票数 0
回答已采纳
3
回答
“汤”和“美汤”
中
的“汤”是什么意思?
、
“汤”和“美汤”
中
的“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
3
回答
在浏览器(由BeautifulSoup生成)中直接
从
Python
启动HTML代码
、
、
、
我已经使用
Python
3.3的BeautifulSoup成功地
从
网页
中
提取
了所需的信息。我还使用了BeautifulSoup生成新的超
文本
标记语言代码来显示此信息。目前,我的
Python
程序打印出HTML代码,然后我必须复制、粘贴并另存为HTML文件,然后我可以在浏览器
中
测试它。所以我的问题是,有没有办法
用
Python
语言在浏览器
中
启动由BeautifulSoup生成的HTML代码,这样我就不需要使用复制粘贴的方法了
浏览 2
提问于2014-01-30
得票数 26
回答已采纳
1
回答
perl
中
的Web Crawler问题
、
、
我
用
Perl构建了一个网络爬虫。HTML::ContentExtractor
从
网页
中
提取
文本
。示例代码的参考链接问题是,它不会
从
具有.aspx扩展名的
网页
中
获取
文本
。它非常适合其他
网页
,我不知道为什么这个爬虫在aspx页面上会失败。
浏览 8
提问于2014-04-25
得票数 0
1
回答
从
网页
中
提取
文本
、
、
、
、
我正在尝试
从
开始解析
网页
中
的
文本
。这个页面有到最终页面的链接(也可以手动移到
文本
文件
中
,以避免额外的编码工作)。在左侧的最后一页上有一个页面索引。并且每个页面也有一个页面索引。从这个项目列表
中
,我只需要
提取
一行以“Configuring”、“Configuration Examples”或“Example”开头的行。如果可以
从
任何工具中
提取
此信息,则该工具会在找到时按分层顺序爬行和记录项目。可能是一些简单的格式,其中
浏览 0
提问于2012-09-08
得票数 0
2
回答
新手
Python
正则表达式问题:
从
网页
中
提取
日期
、
我希望使用
Python
从
网页
中
拉出一个常规的
文本
字符串-源代码运行如下:它总是开始的结束(&E)我已经抓取了
网页
的
文本
,只想
提取
日期和类似结构的信息。
浏览 0
提问于2010-12-17
得票数 1
回答已采纳
2
回答
在带有多个html标记的
网页
中
查找带有BeautifulSoup的
文本
?
、
、
我正在尝试使用BeautifulSoup和
Python
从
网页
中
提取
文本
。我已经做了很多次不同的
网页
,总是得到我需要的信息,但这一次,
从
网页
的html源代码有很多脚本和其他东西。这是我想从以下页面中
提取
信息的页面之一: 这个
网页
的问题在于它有很多iframe标记,每个标签都有一个开始标记(html)和一个关闭标记(/html),我可以
从
主页中
提取
信息,但不能
提取<
浏览 5
提问于2015-10-16
得票数 0
回答已采纳
3
回答
无硒头与无头硒
、
、
、
、
我目前正在使用
python
中
的Selenium进行一个working抓取项目。 opts = webdriver.ChromeOptions() driver = we
浏览 1
提问于2021-06-01
得票数 4
1
回答
无法在Selenium
中
不使用time.sleep()打印
文本
、
无法
从
Python
中
的print语句中获得以下代码的
文本
,但是当我试图在print(new_cases.text)语句之前添加time.sleep(4)时,我能够获得
文本
,我正在使用显式wait.Canfrom selenium import webdriverfrom selenium.webdriver.common.byselenium.webdriver.suppo
浏览 6
提问于2022-02-20
得票数 0
2
回答
如何使用BeautifulSoup
提取
网页
“关于我们”的
文本
、
、
我是新的网络抓取,我不知道如何
从
网页
上的“关于我们”下的
文本
。请您指点我,或者提供代码,以便在这样的
网页
中
提取
“关于我们”的
文本
。我可以在头文件中看到“关于我们”,但是无法
用
这个标题
提取
数据。
浏览 1
提问于2019-08-03
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券