腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
3
提取
html
标记
之间
的
文本
、
、
、
、
我正在尝试抓取一个网站,我想
提取
链接
的
标题(“高级行政官员关于加强美中经济关系概况
的
新闻简报”),它是在
html
标签
之间
输入
的
。我
使用
的
HTML
源代码如下:office/2013
浏览 17
提问于2018-08-14
得票数 0
1
回答
提取
特定a-
标记
后面的
文本
。
、
、
、
、
我在用
python
从
html
代码中
提取
文本
时遇到了问题。代码如下:<br/><a href="link1.
html
" title="title1">anchor1</a>text1 <br/><a href="link2.
html
" title="title2&quo
浏览 0
提问于2015-01-26
得票数 1
回答已采纳
1
回答
在一个
HTML
标记
中嵌套
的
整个网站破坏
Python
刮板
、
、
、
、
我正在尝试让这个程序工作
的
示例网站是: 我本来打算
使用
BeautifulSoup库来实现这一点,但当我意识到感兴趣
的
网页
的
整个
文本
都嵌套在一个
标记
中时,我就撞到了墙上,如下面的图片所示。有没有人知道我可以从这个
HTML
文本
块中
提取
特定
的
单词和值?例如,我想创建7列。当我
使用
findAll函数在
文本
中找到这些列标题时,打印结果时会返回整个
文本
块,因为所有
文本
浏览 4
提问于2021-12-24
得票数 2
2
回答
在
python
中
提取
指定
html
块
之间
的
文本
、
、
我有下面的一块
html
,只需要
提取
之间
的
文本
Html
块看起来像这样:<a href="some link1">File1</a><a href="some link to somewhere 2
浏览 1
提问于2018-08-03
得票数 3
回答已采纳
1
回答
使用
python
汤在动态
HTML
标记
之间
提取
文本
、
我有一个需要在
HTML
标记
之间
提取
文本
的
要求。我
使用
BeautifulSoup
提取
数据并将
文本
存储到一个变量中以供进一步处理。后来我发现,我需要
提取
的
文本
有两个不同
的
标签。但是,请注意,我需要
提取
文本
并存储到相同
的
变量中。提供了我以前
的
代码和示例
HTML
文本
浏览 0
提问于2016-12-26
得票数 0
回答已采纳
2
回答
用BeautifulSoup/
Python
从
html
文件中
提取
文本
、
、
我正在尝试从
html
文件中
提取
文本
。</span></li> 我想从最后一个span
标记
中
提取
最后一个
文本
。在第一行中,它将是class="toctext"之后
的
"Baden-Würtemberg“,然后将其放入
python
列表。在
Python
中,我尝试了以下操作: names = soup.find_all("
浏览 54
提问于2019-06-21
得票数 1
回答已采纳
1
回答
Python
:
使用
lxml xpath从所有
HTML
子元素
文本
中获取
文本
、
、
我正在
使用
python
的
lxml xpath。如果给出
HTML
标记
的
完整路径,我就能够
提取
文本
。但是,我不能从
标记
中
提取
所有
文本
,并将它
的
子元素
提取
到列表中。例如,考虑到这个
html
,我想得到“示例”类
的
所有
文本
: "
浏览 2
提问于2020-09-01
得票数 0
回答已采纳
2
回答
正则表达式:在两个
标记
之间
提取
文本
、
我试图编写一个
Python
解析器,从
html
页面中
提取
一些信息。我
使用
正则表达式:但是,如果它是它们
之间
的
另一个
标记</em
浏览 4
提问于2014-08-17
得票数 2
回答已采纳
1
回答
Python
Selenium会从父级
提取
子属性吗?
、
、
我试图在特定字段中为
文本
抓取一个webform,但是我不能用xpath完成它,因为有些表单缺少
的
字段在加载时不会包含在页面中(也就是说,如果/
html
/blah/blah/p
3
是一种表单
的
首字母字段,它可能是另一种表单上
的
名字,但具有相同
的
xpath。字段
的
结构如下:因此
浏览 2
提问于2021-05-24
得票数 0
回答已采纳
2
回答
提取
HTML
标记
之间
的
文本
、
、
、
我有许多
HTML
文件,我需要从中
提取
文本
。如果全部都在一行上,我可以很容易地做到这一点,但是如果
标记
环绕或在多行上,我就不知道该怎么做了。我
的
意思是:Some text herelast line of text.</section> 我并不关心<br>
文本
,除非它有助于将
文本
环绕起来。我想要<
浏览 0
提问于2013-05-19
得票数 4
回答已采纳
6
回答
如何
提取
HTML
标记
中
的
文本
(在Selenium IDE中)?
html
如下所示: sometext1 sometext2 sometext
3
我想
提取
段落
标记
之间
的
所有
文本
,包括<br>
标记
。我尝试
使用
storeText函数,但它只存储
文本
,没有标签。我可以存储整个
HTML
源代码,然后在Perl中
提取</e
浏览 2
提问于2011-05-20
得票数 5
3
回答
php:从网页中
提取
特定
标记
之间
的
文本
、
、
可能重复: 如何
使用
提取
特定
标记
之间
的
文本
,例如在h1、h2、h
3
、p、table
之间
获取
文本
?似乎我只能用getelementbytagname对一个
标记
执行此操作。 是否有一个更好
的
html
解析器来完成这样
的
任务?或者我将如何遍历php文档?
浏览 8
提问于2011-10-08
得票数 3
回答已采纳
3
回答
使用
perl
提取
HTML
标记
之间
的
文本
、
我在文档中有如下
HTML
标记
:align="justify"</H2我只想从上面的超
文本
标记
语言
文本
中
提取
ACC
浏览 3
提问于2014-06-21
得票数 1
5
回答
使用
RegEx
提取
html
标记
之间
的
文本
、
、
我必须从visual basic中
的
字符串中
提取
一些
文本
,如下所示:<h2 id="id-date">09.09.2010</h2> , here to extractthe date 我需要从div中
提取
浏览 8
提问于2010-09-14
得票数 0
回答已采纳
5
回答
使用
nokogiri
提取
HTML
标记
之间
的
文本
、
、
我有这样
的
HTML
: <h2>Header 2 is here</h2>我有一个基本
的
Nokogiri CSS节点搜索返回内容,但是我找不到如何定位第N个关闭
的
H2和下一个打开
的
H2
之间
的
所有
文本
的
示例。我正在
使用</em
浏览 0
提问于2011-10-19
得票数 5
回答已采纳
2
回答
如何
使用
html
包在golang中
的
css选择器
之间
打印
文本
?
、
、
我有
html
文档 <value>,1,
3
,5</value> for {
浏览 4
提问于2016-11-22
得票数 0
回答已采纳
1
回答
使用
regex和
python
从网页中
提取
通用
文本
、
我需要
使用
python
中
的
regex从任何类型
的
网页中
提取
文本
。我
的
代码可以很好地处理
html
标记
,但是由于脚本
标记
之间
包含
的
标记
和属性
的
语法不规则,除了有用
的
文本
之外,我想出
的
代码还
提取
了一些脚本数据。有什么办法可以避免吗?
浏览 3
提问于2012-03-03
得票数 0
回答已采纳
4
回答
在Javascript中
提取
HTML
文本
的
更好方法
、
、
、
、
我试图
使用
container.innerText || container.textContent从
HTML
中抓取
文本
,其中container是我想从中
提取
文本
的
元素。通常,我要
提取
的
文本
位于<p>
标记
中。因此,对于下面的
HTML
作为一个示例: <p>This is the first sent
浏览 2
提问于2014-11-24
得票数 1
回答已采纳
1
回答
可以
提取
html
文档中<p>
标记
之间
的
文本
吗?
、
我正在
使用
BeautifulSoup从
html
文件中
提取
内容。我有几千个
提取
的
html
文件,并希望
提取
所有文件中p
标记
之间
的
内容。相关代码如下: soup = bs(line, '
html
.parser') autor = soup.find_all('p').texts = autor.replace(
浏览 11
提问于2019-10-29
得票数 0
回答已采纳
2
回答
在
HTML
标记
之间
提取
文本
、
、
、
、
我有一个<td>,想从中
提取
文本
,也就是说,我只需要
文本
汤姆克鲁兹,荷马辛普森,比尔克林顿,它在每个<td>标签中
使用
一个
python
正则表达式。更新1.如果
HTML
是标准
的
方式,我应该如何做呢?
浏览 1
提问于2016-05-14
得票数 0
点击加载更多
相关
资讯
用python3教你任意Html主内容提取
简单几行代码提取html文件中全部指定标签内的文本
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
解读 Python 2和Python 3 之间的主要差异
如何使用Python提取视频的关键帧?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券