腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
python
regex
xpath
-
regex
XPATH
的
属性
python
、
regex
、
xpath
给定一个灵活
的
正则表达式模式字符串,我需要找到附加
的
所有
属性
。示例字符串:/html/body/div[1]/div/a/(@title|@href) 它需要返回['@title', '@href'] 我做了一些研究,并创建了一个如下所示
的
正则表达式模式:/@\w+/g https://
regex
101.com/r/cO8lqs/9124
浏览 54
提问于2019-03-24
得票数 2
回答已采纳
1
回答
做getallAttributes()
的
正确方法是什么
python
、
xpath
、
web-scraping
、
scrapy
我正在尝试读取给定元素
的
属性
(
属性
)。我想提取所有
属性
名称-值对
的
字典。attributes = node.
xpath
("@*")print len(attributes)
浏览 3
提问于2015-05-18
得票数 1
回答已采纳
1
回答
XPath
-只获取
属性
值或文本节点
的
一部分
python
、
xml
、
xpath
好
的
,我有下面的html,我想从它获得@data-coords
属性
,但是我希望纬度和经度在不同
的
变量中。</div>如果我使用//div[@id='gmap-imovel']/@data-coords作为
XPath
,它将从@data-coords
属性
返回整个内容。latitude, longitude 我希望像上面提到
的
那样将纬度和经度分开,我知道我可以在
Python</
浏览 1
提问于2021-02-22
得票数 2
回答已采纳
3
回答
如何在不使用请求模块和
xpath
的
情况下使用
Python
提取重定向url?
javascript
、
python
、
xpath
、
python-requests
const url = 'REQUIRED LINK';</script>html_tree = html.fromstring(page_2) inside_scripts = html_tree.
xpath
浏览 7
提问于2020-05-15
得票数 0
回答已采纳
1
回答
Xpath
属性
REGEX
python
、
regex
、
xpath
到目前为止,我
的
代码如下:import requests tree = html.fromstring(page.text) event_title = tree.
xpath
('//a[@href="/institute/event/&
浏览 2
提问于2015-03-24
得票数 0
回答已采纳
2
回答
HtmlAgilityPack:
xpath
和
regex
c#
、
regex
、
html-agility-pack
我目前正在使用HtmlAgilityPack通过
xpath
查询搜索某些内容。现在,我想使用正则表达式在所有html源代码(= text、标记和
属性
)中搜索特定
的
内容。如何用HtmlAgilityPack来实现这一点?HtmlAgilityPack能否处理
xpath
+
regex
,或者使用
regex
和HtmlAgilityPack进行搜索
的
最佳方法是什么?
浏览 5
提问于2014-11-04
得票数 2
回答已采纳
4
回答
如何在Nokogiri中搜索匹配某一开始
的
文本?
ruby
、
nokogiri
、
hpricot
> <p id='para-6'>F</p></body>HTML_ENDdivs = value.search('//div[@id^="para-"]') 如何对
X
浏览 8
提问于2009-10-12
得票数 28
回答已采纳
2
回答
在PHP中使用DOMDocument
的
正则表达式
php
、
regex
、
domdocument
$
xpath
= new DOMXPath($dom); $
regex
= '~\?>DUQi_R4SgWo $
xpath
->register
浏览 4
提问于2017-11-20
得票数 3
回答已采纳
3
回答
如何将零或更多与
XPath
匹配?
python
、
regex
、
xml
、
xpath
、
lxml
我在
python
中使用lxml,如下所示:if not trs:所以问题是tbody。我想知道
浏览 4
提问于2015-10-29
得票数 3
回答已采纳
1
回答
如何使用
XPath
'matches‘在C#中选择所有节点?
c#
、
xml
、
regex
、
xpath
我知道可能存在类似的问题,但我无法找到如何在
regex
中使用C#方法中
的
XmlNode.SelectNodes字符串来解决这个问题
的
答案。但不管怎样,我得到了System.Xml.
XPath
.XPathException。我将MS VS 2012与
XPath
2.0结合使用(至少我认为如此)。 如何在我
的<
浏览 3
提问于2014-07-03
得票数 2
回答已采纳
1
回答
Solr仅索引文本具有指定最小长度/大小
的
内容
solr
、
dataimporthandler
但是,我想将索引限制为内容字段长度至少为200个字符
的
文档。但我想不出任何方法来做这件事。我尝试了一些正则表达式,但是索引总是会立即失败(例如(.*){5}似乎不受支持?)。有没有人知道solr支持
的
regex
跳过只有200个字符或更少字符
的
文档?或者,有没有其他方法来实现这一行为?DateFormatTransformer,HTMLStripTransformer,TemplateTransformer"> <field column="origid" <
浏览 4
提问于2013-04-29
得票数 0
1
回答
从路径/值列表中写入xml
python
、
xml
、
xpath
、
lxml
这是对前一个问题
的
后续:。现在,我想添加两个附加
的
内容: 1)
属性
和2)带有父节点
的
多个项。下面是我
的
路径列表: {'Path': 'Item/Info/Name', 'Value': 'Body HD'}, {'Path': 'Item/Info/Synopsis', 'ValueValue': '9.9
浏览 1
提问于2016-08-16
得票数 0
回答已采纳
2
回答
如何在locust中使用css选择器和
xpath
提取器?
locust
我之前使用了jmeter选择器和
XPath
提取器后处理器来检索Csrf令牌。有没有办法在蝗虫中也用到这些? 我想从值
属性
中提取
浏览 0
提问于2020-07-18
得票数 0
1
回答
如何使用DOMDocument和DOMXPath来忽略匹配中
的
一些字符?
php
、
domdocument
、
domxpath
$keyword . '")]'; $doc->loadHTML(strtolower($content));$elements = $
xpath
->query($exp); 我需要识别“关键字: AAA”和“关键字AAA",因此在搜索关键字短语时,我需要向DOMXPath查询指定忽略变量$characters_to_ignore中
的
字符。(并使用$characters_to_
浏览 1
提问于2012-11-19
得票数 3
回答已采纳
1
回答
Xpath
-通过通配符或布尔操作找到以同名开头
的
节点?
java
、
xml
、
xpath
如何找到以相同名称开头
的
Xpath
节点?假设我有以下XML文件,在我
浏览 0
提问于2018-03-15
得票数 3
回答已采纳
1
回答
使用PHP和
XPath
获取匹配
regex
表达式
的
hrefs
php
、
regex
、
xpath
、
href
我有一个包含几个超链接
的
页面。我想得到
的
是格式:<body> <a href="/123" >text2</a><a href="/我知道如何使用$gm = $
xpath
->query("//a")获
浏览 3
提问于2016-02-21
得票数 2
回答已采纳
1
回答
在
XPath
表达式中使用c#函数
c#
、
xpath
是否可以在.Net
XPath
evaluator中添加/使用自定义函数?例如,我想用
xPath
1.0不支持
的
正则表达式进行搜索。我可以添加类似的内容吗并使用类似于这样我就可以在
xPath
查询中使用它了?
浏览 0
提问于2012-03-16
得票数 0
回答已采纳
1
回答
无法刮除邮件ID
python
、
web-scraping
、
scrapy
我正在尝试使用Scrapy、
Python
和
RegEx
从这个页面:中刮取邮件ID。为此,我编写了以下命令,每个命令都返回一个空列表: response.
xpath
('/
浏览 0
提问于2018-05-05
得票数 0
回答已采纳
4
回答
Regex
只与特定类匹配完整
的
超链接。
php
、
regex
、
dom
、
hyperlink
我只想与
regex
匹配,所有这些链接都是特定
的
。我不知道href还是班级排在第一位,可能是不同
的
。,因此,这个示例中
的
匹配应该返回-这是我能得到
的
最接近
的
- /<a\
浏览 5
提问于2011-05-30
得票数 1
回答已采纳
1
回答
在
Python
中使用re将CSV像元值用作正则表达式字符串
python
、
regex
所以我有一个CSV文档,其中每一行都有元数据、一个
XPATH
和一个
Regex
字符串。该脚本使用
xpath
遍历API请求,然后我想使用存储在CSV中
的
regex
和该
xpath
在API结果中搜索某些内容。我
的
问题是如何将CSV行中
的
数据用作文字正则表达式搜索字符串,例如r'^\w{2}.+'与要搜索
的
字符串。in keydict.iteritems(): rulequery = {'t
浏览 1
提问于2015-05-12
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫,登陆神器Selenium之xpath的使用
Java使用WebMagic 爬取网站
python爬虫技术:如何定位网页上的内容?xpath定位元素
scrapy爬取豆瓣热门电影
盘点一个Python网络爬虫过程中Xpath提取器的问题
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券