腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
从
html
标签
中
提取
文本
,
而
不
提取
标签
中
的
其他
值
?
python-3.x
、
web-scraping
、
beautifulsoup
如何
提取
标记内
的
代码/
文本
的
某些部分 下面是标记: <li class="price-current"> <abbr title="to">–</abbr>
浏览 22
提问于2019-06-16
得票数 0
回答已采纳
2
回答
用C++
从
html
文件中
提取
纯
文本
html
、
c
、
function
我需要
提取
所有的
html
元素,包括
html
标签
。我只想保留纯
文本
。我被要求用C来做这件事,我
不
鼓励使用正则表达式。如果我使用字符串函数,它只删除分隔符,
而
不是其中
的
字符串。我需要创建一个
从
html
文件中
提取
纯
文本
的
程序。任何关于
如何
做到这一点
的
指南都将不胜感激。谢谢!
浏览 0
提问于2013-03-10
得票数 0
1
回答
正则表达式
从
html
页面中
提取
锚
标签
周围
的
文本
java
、
html
、
regex
有没有办法在
html
页面中
提取
锚
标签
周围
的
文本
?我在java
中
工作,我
的
研究需要我
提取
标签
内和
标签
周围
的
数据。我试过搜索,我找到
的
只是正则表达式,它只
提取
锚
文本
,
而
不是它周围
的
单词。
浏览 1
提问于2014-03-17
得票数 1
1
回答
BS4抓取所有内容栏<h2>
标签
python
、
bs4
我目前正在写一个刮板卡在最后一点,讽刺
的
是,它看起来应该是最容易
的
。
html
是一个小弹出窗口,包含以下代码结构。<
html
lang="en"> <title>Website Title</title> <h2>> 我希望
提取
的
这是
文本
我想<
浏览 8
提问于2017-02-09
得票数 0
1
回答
使用单个类名
从
html
标记
中
获取
文本
,
html
标记将包含多个类。
java
、
html
、
css
、
jsoup
我有一个
html
行,
标签
里面有
标签
,我
的
一个
标签
包含多个类。我需要用单个类名
提取
文本
(我只知道一个类名) <p class="Body1"><span class="style3"></span><span class="style1">W</span><spanstyle5">extract this tex
浏览 3
提问于2014-07-10
得票数 0
回答已采纳
2
回答
以编程方式获取自定义用户配置文件字段
的
字段定义
8
、
forms
我创建了几个自定义用户配置文件字段,包括Full名称(纯
文本
字段)和County (列表(
文本
)字段)。它们显示在/user/#/edit窗体上。我想通过定制模块代码以不同
的
形式显示这些字段(以及
其他
几个字段)。 问:是否可以
提取
字段
的
定义,包括其
标签
、默认
值
,以及在County情况下允许
的
值
列表?我想一个字段是一个可以被
提取
的
实体,但是经过大量<em
浏览 0
提问于2020-04-25
得票数 1
回答已采纳
1
回答
Python web抓取: google搜索结果
中
的
网站
python
、
html
、
web-scraping
、
web-crawler
、
google-crawlers
Python
的
新手。我想从一个谷歌搜索页面
从
多个网站(例如100+)
提取
信息。我只想
提取
关键信息,例如那些带有<h1>、<h2>或<b>或<li>
HTML
标签
的
信息等,但我不想
提取
整个段落
的
<p>。我知道
如何
从
google搜索
中
收集网站URL列表;我还知道
如何
在查看页面的
HTML
后对单
浏览 18
提问于2021-03-31
得票数 1
1
回答
使用Java
中
的
Jsoup
从
HTML
行获取类名
的
Get元素(重写)
java
、
html
、
css
、
jsoup
我有一个
html
行,
标签
里面有
标签
,我
的
一个
标签
包含多个类。我需要
提取
带有单个类名
的
文本
(我只知道
标签
中有一个类名,这可能也会覆盖另一个类)。OverRiddenClass">another text to extract </span></p> 我知道类名"OverRiddenClass“,它凌驾于"AnyClass”类之上,我想使用java
中<
浏览 2
提问于2014-07-17
得票数 0
回答已采纳
1
回答
如何
在java
中
无库情况下解析
HTML
?
java
、
html
、
parsing
我需要解析一个
HTML
文档,并获得所有的网址和网页内容,并将其保存到数据库
中
。我可以使用<a
标签
识别链接
标签
,但
如何
从
html
标签
中
提取
所有内容或有用
的
文本
?
浏览 3
提问于2020-02-09
得票数 0
1
回答
按主题
提取
PDF
文本
python
、
pdf
我试着按主题
从
PDF中
提取
课文。为了做到这一点,我试图识别PDF
中
的
标签
\标题。如果有人知道
如何
克服这个问题,我会很高兴,这样就可以不依赖PDF (我使用
的
大多数PDF文件是文章\书籍)而
提取
标签
(按主题分类)--按主题
提取
文本
的
不同方法也很受欢迎。(如标记所示,我正试图用Python进行此操作)现在我做了两件事: 检查每一行<
浏览 1
提问于2016-04-03
得票数 0
3
回答
“汤”和“美汤”
中
的
“汤”是什么意思?
beautifulsoup
、
jsoup
“汤”和“美汤”
中
的
“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
3
回答
将正则表达式设置为测试包含
HTML
标记
的
输入
文本
javascript
、
jquery
、
regex
我试图创建一个模式,以防止用户输入
从
HTML
标记。我创造了这个彭定康它只在输入以
html
标记开始时才有效,例如:<p> Test但如果输入如下所示
如何
编写模式以考虑任何
html
标记包含
的
内容?
浏览 4
提问于2014-11-20
得票数 1
回答已采纳
1
回答
用于匹配样式标记
的
RegEx
javascript
、
regex
、
string
我有一个
HTML
代码,其中包含CSS代码在
标签
下
的
头
标签
。我想使用正则表达式来
提取
HTML
中
的
所有
文本
,只
提取
纯
文本
(在
HTML
标记之间)。我试过了它用空字符替换了<>之间
的
浏览 0
提问于2019-05-01
得票数 1
1
回答
从
表视图中获取单元格标题
objective-c
、
ios
、
cocoa-touch
、
uitableview
我有一个自定义
的
表格视图,每个单元格都有一个标题和一个按钮。当用户单击按钮时,我需要该单元格
的
标题显示在另一个视图上。我怎么才能得到这个?
浏览 0
提问于2011-10-03
得票数 0
回答已采纳
5
回答
如何
使用PHP
从
HTML
文件中
提取
所有
文本
?
php
、
html
、
regex
、
parsing
、
html-content-extraction
如何
从
HTML
文件中
提取
所有
文本
但是,我不想
提取
样式和脚本标记之间
的
文本
现在,我有以下代码 $string = trim(clean(strtolower(strip_tags($
html
_content)))); $arr = explode(&qu
浏览 0
提问于2009-10-02
得票数 0
1
回答
如何
提取
<strong>和<br>之间
的
文本
并将其存储在字符串数组
中
,这些
文本
位于没有
html
代码
的
<p>标记内(例如,等等
java
、
jsoup
从
段落
标签
中
的
strong和<br>
标签
中
提取
文本
作为单独
的
字符串。我曾尝试使用
HTML
分割
文本
,但
文本
包含<br>代码,如p、strong和nbsp。示例代码: Document doc = Jsoup.parse(
HTML
);Strin
浏览 37
提问于2019-04-29
得票数 1
3
回答
如何
使用BeautifulSoup查找第一个锚
标签
的
文本
python
、
beautifulsoup
我有一个这样
的
HTML
结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p> 我想
提取
第一个锚
标签
<em
浏览 1
提问于2016-04-28
得票数 1
2
回答
使用nodejs cheerio深度嵌套元素标记
的
抓取网站
node.js
、
web-scraping
、
cheerio
我试图
从
网站上抓取
文本
,但似乎无法
提取
任何内容。 //success!let token = "ce-bodytext"; console.log($(token,
html
)).text; .catch(function(err) { console.log(JSON
浏览 18
提问于2019-07-16
得票数 2
1
回答
如何
使用BeautifulSoup搜索被切换选项卡隐藏
的
元素?
python
、
web-scraping
、
beautifulsoup
我试图从一个url中
提取
并打印所有td
标签
的
文本
内容,该url拥有多个选项卡,这些选项卡显示页面的某些元素,并在单击时隐藏所有
其他
选项卡
的
内容(https://www.encodeproject.org具体地说,我正在尝试
从
"File Details“选项卡中
提取
所有td
标签
(在页面中间看到
的
完整选项卡列表是:"Genome Browser”、"Association
浏览 24
提问于2021-08-03
得票数 1
回答已采纳
0
回答
MS Access数据库-来自Lookup控件
的
图表绘制
ms-access
、
graph
、
charts
我正在尝试在MS Access报表
中
创建饼图。问题是,我试图从中
提取
数据
的
表
中
的
字段是一个查找字段,它从另一个表中
提取
数据。因此,当呈现饼图时,
标签
将显示为条目的数字id,
而
不是
文本
标签
。其结构类似于:类别表: ID类别(类别名称) 在差异表单
中
,我将category字段绑定到
浏览 5
提问于2017-11-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简单几行代码提取html文件中全部指定标签内的文本
Python爬虫实例之——小说下载
想看免费小说?就用Python批量下载!
Python 爬虫之网络小说下载
Python爬虫教程:简书文章的抓取与存储
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券