腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Ruby
:
提取
标签
和
标签
属性
之间
的
文本
?
ruby
提取
两个标记
之间
的
文本
以及标记中指定
的
属性
的
最简单方法是什么,例如: some random text heresome other{"id": "12345", "tag": "tag content A"}, {"type": "
浏览 24
提问于2021-04-12
得票数 1
回答已采纳
5
回答
如何使用PHP从HTML文件中
提取
所有
文本
?
php
、
html
、
regex
、
parsing
、
html-content-extraction
如何从HTML文件中
提取
所有
文本
但是,我不想
提取
样式
和
脚本标记
之间
的
文本
现在,我有以下代码这很好用,但是它检索我不想检索
的
脚本
和
样式
标签
,以及另一个问题,我不确定它是否像alt那样检索
属性
,因为strip_tags函数可能会删除所
浏览 0
提问于2009-10-02
得票数 0
1
回答
用正则表达式
提取
文本
的
副词
java
、
regex
我有一个
文本
,我想用regex
提取
文本
的
部分。</p>例如,上文摘录:(3)(4)
浏览 1
提问于2013-12-13
得票数 0
回答已采纳
1
回答
Twitter对URL
的
定义是什么?
api
、
twitter
我已经在上问了同样
的
问题,但是,我在那里没有得到答案。因此,也许有人在这里遇到了同样
的
问题,并得到了答案。 在我
的
应用程序中,我计算用户在撰写tweet时输入
的
字符长度。但是,如果用户输入URL,则在发布tweet时,URL将自动缩短(通过Twitter
的
API)。因此,我必须在字符计数器中将URL
的
长度替换为生成
的
t.co URL
的
长度。然而,现在
的
问题是,Twitter对URL
的
定义是什么,以便我知道您何时调整我
浏览 3
提问于2012-03-22
得票数 1
回答已采纳
1
回答
忽略两个具有正则表达式
的
字符串
之间
的
文本
java
、
regex
我有一个
文本
,我想用regex
提取
文本
的
部分。</p>例如,上文摘录:(3)它不应该在
标签
标签
之间
提取
括号。我使用regex
的
方法如下: (<label>){0,1}[(\\w\\W)&&[^[<
浏览 1
提问于2013-12-13
得票数 0
回答已采纳
1
回答
如何使用SGMLParser从HTML中
提取
指定
的
文本
python
、
html
、
tags
、
sgml
我创建了一个扩展
的
SGMLParser类: SGMLParser.遇到<title>
标签
时调用IMO start_title,遇到普通
文本
时调用handle_data。现在我想
提取
<title>
和
</title>
之间
的
文本
,例如 <html><head><
浏览 0
提问于2012-02-26
得票数 1
回答已采纳
1
回答
从导致pdf文件
的
锚元素中
提取
信息
python
、
html
、
scrapy
我需要
提取
被困在<a>标记
之间
的
文本
:显然,我不能执行response.text或response.css我脑海中浮现
的
一件事是爬行页面,从页面中
提取
所有链接,并将它们保存在
文本
文件中。它起了作用,只是我最终得到了很多重复
的
链接,被破坏
的
链接(比如403,404,500)
浏览 0
提问于2016-12-12
得票数 1
1
回答
使用正则表达式从html标记中
提取
文本
regex
、
python-2.7
、
web-scraping
我刚接触web抓取
和
正则表达式。我知道了如何在html
标签
之间
提取
文本
。问题是我不想要
标签
内
的
文本
,比如class=“",只想要
标签
之间
的
文本
。>)', html) <h1 class="title">Title</h1>顺便说一下,我使用
的
是P
浏览 3
提问于2016-04-17
得票数 1
5
回答
正则表达式,跳过几个单词
python
、
html
、
regex
我很难在“alt”
标签
中
的
引号
之间
找到
文本
。我一直在尝试正则表达式,如!?border="0“跳过它,但仍然不能工作。下面是我试图从regex中
提取
的
文本
<img src="http://www.ebgames.com.au/0141/169
浏览 5
提问于2017-05-18
得票数 0
回答已采纳
1
回答
过滤HTML文档中
的
所有内部
文本
python
、
html
、
beautifulsoup
我想要一个大
的
HTML文档,我想去掉所有
标签
之间
的
所有内部
文本
。我发现
的
所有东西都是关于从HTML中
提取
文本
的
。我想要
的
只是原始
的
HTML标记,它们
的
属性
完好无损。人们可能如何过滤掉
文本
呢?
浏览 3
提问于2014-03-31
得票数 1
回答已采纳
4
回答
Selenium web驱动程序使用
Ruby
从
标签
的
for
属性
获取
文本
ruby
、
selenium
、
xpath
我在Javascript或python中看到了一些如何这样做
的
例子,但我正在寻找如何在
标签
上找到for
属性
的
文本
。thisIsTheTextNeeded">LabelText</label> 我们希望从label元素
的
for
属性
中
提取
文本
。然后使用该
文
浏览 11
提问于2015-04-07
得票数 1
回答已采纳
1
回答
忽略regex中
的
br、b、strong
和
i html标记
regex
我希望从html中
提取
超过100个字符
的
文本
。
文本
可以在任何一组
标签
之间
,忽略br、b、strong
和
i
标签
。<([^>]+)>[^<]{100,})<\1>几乎是正确
的
,但它在所有
标签
处都停止 if not < and not (<b
浏览 1
提问于2012-04-08
得票数 0
1
回答
用于匹配样式标记
的
RegEx
javascript
、
regex
、
string
我有一个HTML代码,其中包含CSS代码在
标签
下
的
头
标签
。我想使用正则表达式来
提取
HTML中
的
所有
文本
,只
提取
纯
文本
(在HTML标记
之间
)。我试过了它用空字符替换了<>
之间
的
所有东西,问题是样式
标签
内
的
浏览 0
提问于2019-05-01
得票数 1
1
回答
红宝石记录仪
的
CloudWatch滤波模式
ruby
、
logging
、
amazon-cloudwatch
、
cloudwatch
对于AWS CloudWatch日志,我想应用一个过滤器,将由
ruby
记录器生成
的
消息中
的
字段分隔开来。I, [26/Oct/2015:04:35:12 +0000#11] INFO -- : (0.000934s) BEGINSeverityID, [DateTime#pid] SeverityLabel -- ProgName: message 如何使用CloudWatch过滤器
提取
标签
?也就是说,如何在
浏览 3
提问于2015-10-27
得票数 0
回答已采纳
3
回答
在~
标签
之间
提取
文本
c#
、
regex
content5content7~header3content10content12我需要使用C#语言中
的
正则表达式来
提取
每个标头(C#)
之间
的
内容。因此,将有一个数组作为输出,假设它
的
名称m及其内容:m[1] = "~header2|content5
浏览 6
提问于2015-09-30
得票数 0
回答已采纳
2
回答
如何使用PHP从此代码中
的
锚标记中
提取
id
和
url?
php
、
html
、
regex
、
tags
、
extract
我试图从锚
标签
中
提取
文本
url(href)
和
id。到目前为止,我可以得到锚
标签
之间
的
文本
。这是我
的
密码 <head> <body>这样,我只能在两个纯锚
标签
之间
打印
文本
(没有任何参数)。但是,当存在诸如href<e
浏览 1
提问于2018-12-01
得票数 1
回答已采纳
2
回答
减少
标签
和
标签
对齐
之间
的
间距
html
、
asp.net
我
的
来源是这样
的
: <asp:TextBox ID="textDepName" runat="server"></asp:TextBox> </div&
浏览 0
提问于2016-06-06
得票数 0
3
回答
如何在两个不同
的
封闭html
标签
之间
提取
文本
,这些
标签
不在
标签
内?
python
、
html
、
web-scraping
在一个有许多具有相同类名
的
b
标签
的
网页上,我想
提取
两个不同
的
封闭html 'b‘
标签
之间
的
文本
,特别是这些b
标签
。inkjet (piezoelectric)"我尝试通过使用findALL创建表来使用漂亮
的
sou
浏览 18
提问于2019-10-22
得票数 1
回答已采纳
3
回答
字符串解析帮助
php
、
regex
</hobbies>1)
提取
字符串中每个<age>
和
<hobbies>
标签
之间
的
文本
。例如,我有一个名为$ages
的
数组,它将包含在所有<age></age>标记
之间
找到
的
所有年龄,然后是另一个数组$hobbies,它将包含在整个字符串中找到
的
<hobbies></hobbies>标记<em
浏览 0
提问于2010-01-29
得票数 0
回答已采纳
3
回答
下面的Regex是什么?
c#
、
.net
、
regex
我想
提取
指定
的
开始
和
结束标记
之间
的
所有
文本
,包括标记。例如:Text Extracted: <NAME>Kai</NAME>以上内容
的
正则表达式是什么?
浏览 0
提问于2011-02-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简单几行代码提取html文件中全部指定标签内的文本
Python爬虫实例之——小说下载
Python学习,还在用正则或者bs4做爬虫吗?来试试css选择器吧
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
想看免费小说?就用Python批量下载!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券