python regex xpath - regex XPATH的属性 - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

python regex xpath - regex XPATH的属性

、、

给定一个灵活的正则表达式模式字符串，我需要找到附加的所有属性。示例字符串：/html/body/div[1]/div/a/(@title|@href) 它需要返回['@title', '@href'] 我做了一些研究，并创建了一个如下所示的正则表达式模式：/@\w+/g https://regex101.com/r/cO8lqs/9124

浏览 54提问于2019-03-24得票数 2

回答已采纳

1回答

做getallAttributes()的正确方法是什么

、、、

我正在尝试读取给定元素的属性(属性)。我想提取所有属性名称-值对的字典。attributes = node.xpath("@*")print len(attributes)

浏览 3提问于2015-05-18得票数 1

回答已采纳

1回答

XPath -只获取属性值或文本节点的一部分

、、

好的，我有下面的html，我想从它获得@data-coords属性，但是我希望纬度和经度在不同的变量中。</div>如果我使用//div[@id='gmap-imovel']/@data-coords作为XPath，它将从@data-coords属性返回整个内容。latitude, longitude 我希望像上面提到的那样将纬度和经度分开，我知道我可以在Python</

浏览 1提问于2021-02-22得票数 2

回答已采纳

3回答

如何在不使用请求模块和xpath的情况下使用Python提取重定向url？

、、、

const url = 'REQUIRED LINK';</script>html_tree = html.fromstring(page_2) inside_scripts = html_tree.xpath

浏览 7提问于2020-05-15得票数 0

回答已采纳

1回答

Xpath属性REGEX

、、

到目前为止，我的代码如下：import requests tree = html.fromstring(page.text) event_title = tree.xpath('//a[@href="/institute/event/&

浏览 2提问于2015-03-24得票数 0

回答已采纳

2回答

HtmlAgilityPack: xpath和regex

、、

我目前正在使用HtmlAgilityPack通过xpath查询搜索某些内容。现在，我想使用正则表达式在所有html源代码(= text、标记和属性)中搜索特定的内容。如何用HtmlAgilityPack来实现这一点？HtmlAgilityPack能否处理xpath+regex，或者使用regex和HtmlAgilityPack进行搜索的最佳方法是什么？

浏览 5提问于2014-11-04得票数 2

回答已采纳

4回答

如何在Nokogiri中搜索匹配某一开始的文本？

、、

> <p id='para-6'>F</p></body>HTML_ENDdivs = value.search('//div[@id^="para-"]') 如何对X

浏览 8提问于2009-10-12得票数 28

回答已采纳

2回答

在PHP中使用DOMDocument的正则表达式

、、

$xpath = new DOMXPath($dom); $regex = '~\?>DUQi_R4SgWo $xpath->register

浏览 4提问于2017-11-20得票数 3

回答已采纳

3回答

如何将零或更多与XPath匹配？

、、、、

我在python中使用lxml，如下所示：if not trs:所以问题是tbody。我想知道

浏览 4提问于2015-10-29得票数 3

回答已采纳

1回答

如何使用XPath* 'matches‘在C#中选择所有节点？*

、、、

我知道可能存在类似的问题，但我无法找到如何在regex中使用C#方法中的XmlNode.SelectNodes字符串来解决这个问题的答案。但不管怎样，我得到了System.Xml.XPath.XPathException。我将MS VS 2012与XPath 2.0结合使用(至少我认为如此)。如何在我的<

浏览 3提问于2014-07-03得票数 2

回答已采纳

1回答

但是，我想将索引限制为内容字段长度至少为200个字符的文档。但我想不出任何方法来做这件事。我尝试了一些正则表达式，但是索引总是会立即失败(例如(.*){5}似乎不受支持？)。有没有人知道solr支持的regex跳过只有200个字符或更少字符的文档？或者，有没有其他方法来实现这一行为？DateFormatTransformer,HTMLStripTransformer,TemplateTransformer"> <field column="origid" <

浏览 4提问于2013-04-29得票数 0

1回答

从路径/值列表中写入xml

、、、

这是对前一个问题的后续：。现在，我想添加两个附加的内容: 1)属性和2)带有父节点的多个项。下面是我的路径列表： {'Path': 'Item/Info/Name', 'Value': 'Body HD'}, {'Path': 'Item/Info/Synopsis', 'ValueValue': '9.9

浏览 1提问于2016-08-16得票数 0

回答已采纳

2回答

如何在locust中使用css选择器和xpath提取器？

我之前使用了jmeter选择器和XPath提取器后处理器来检索Csrf令牌。有没有办法在蝗虫中也用到这些？我想从值属性中提取

浏览 0提问于2020-07-18得票数 0

1回答

如何使用DOMDocument和DOMXPath来忽略匹配中的一些字符？

、、

$keyword . '")]'; $doc->loadHTML(strtolower($content));$elements = $xpath->query($exp); 我需要识别“关键字: AAA”和“关键字AAA"，因此在搜索关键字短语时，我需要向DOMXPath查询指定忽略变量$characters_to_ignore中的字符。(并使用$characters_to_

浏览 1提问于2012-11-19得票数 3

回答已采纳

1回答

Xpath -通过通配符或布尔操作找到以同名开头的节点？

、、

如何找到以相同名称开头的Xpath节点？假设我有以下XML文件，在我

浏览 0提问于2018-03-15得票数 3

回答已采纳

1回答

使用PHP和XPath获取匹配regex表达式的hrefs

、、、

我有一个包含几个超链接的页面。我想得到的是格式：<body> <a href="/123" >text2</a><a href="/我知道如何使用$gm = $xpath->query("//a")获

浏览 3提问于2016-02-21得票数 2

回答已采纳

1回答

在XPath表达式中使用c#函数

、

是否可以在.Net XPath evaluator中添加/使用自定义函数？例如，我想用xPath 1.0不支持的正则表达式进行搜索。我可以添加类似的内容吗并使用类似于这样我就可以在xPath查询中使用它了？

浏览 0提问于2012-03-16得票数 0

回答已采纳

1回答

无法刮除邮件ID

、、

我正在尝试使用Scrapy、Python和RegEx从这个页面：中刮取邮件ID。为此，我编写了以下命令，每个命令都返回一个空列表： response.xpath('/

浏览 0提问于2018-05-05得票数 0

回答已采纳

4回答

Regex只与特定类匹配完整的超链接。

、、、

我只想与regex匹配，所有这些链接都是特定的。我不知道href还是班级排在第一位，可能是不同的。，因此，这个示例中的匹配应该返回-这是我能得到的最接近的- /<a\

浏览 5提问于2011-05-30得票数 1

回答已采纳

1回答

在Python中使用re将CSV像元值用作正则表达式字符串

、

所以我有一个CSV文档，其中每一行都有元数据、一个XPATH和一个Regex字符串。该脚本使用xpath遍历API请求，然后我想使用存储在CSV中的regex和该xpath在API结果中搜索某些内容。我的问题是如何将CSV行中的数据用作文字正则表达式搜索字符串，例如r'^\w{2}.+'与要搜索的字符串。in keydict.iteritems(): rulequery = {'t

浏览 1提问于2015-05-12得票数 1

点击加载更多