腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
xpath
和
regex
获取
单个
链
接上
的
文本
、
、
、
、
有一个包含站点标签
的
div,它可能有几个链接。>Covid-19<a href="/example/usa.html"></a>
浏览 18
提问于2021-04-01
得票数 0
回答已采纳
1
回答
抓取Github提交作者元素
、
、
、
、
任何超
文本
标记语言都能够提取这个链
接上
的
元素
的
文本
:我目前在r中
使用
rvest。我尝试过
xpath
,css等,但就是无法提取用户名。非常乐意
使用
包含名称
的
链接,并在需要时
使用
regex
清理
文本
。 非常感谢您
的
帮助。
浏览 19
提问于2020-05-21
得票数 0
回答已采纳
2
回答
xPath
帮助-在字符串中选择特定
的
单词
、
、
我希望
使用
xPath
提取字符串
的
一部分。此字符串
的
xPath
如下所示问题中
的
网页- 谢谢
浏览 2
提问于2015-09-27
得票数 2
回答已采纳
5
回答
从html页php中刮取数据
、
style="position: relative; left: 5px;" height="10" width="60" border="0"></a></div>我需要刮“美国”
和
157204
浏览 2
提问于2010-07-30
得票数 0
1
回答
如何
使用
import.io在一列中连接两个值
我正在
使用
newegg.com编写import.io提取器。我正面临一个困难,同时从上市页面
获取
价格价值。item-price-now"> $ <sup>.00</sup>价格分为两个节点,强
和
sup当我尝试跟随
Xpath
时,我在两个节点中得到了值。
浏览 5
提问于2016-12-07
得票数 1
回答已采纳
1
回答
如何利用刮擦获得工作描述?
、
、
我对scrapy
和
XPath
很陌生,但用Python编程已经有一段时间了。我希望
使用
scrapy从页面email、name of the person making the offer
和
phone中
获取
https://www.germanystartupjobs.com/job正如您所看到
的
,电子邮件
和
电话是在<p>标签中作为
文本
提供
的
,因此很难提取。我
的
想法是首先在Job
浏览 5
提问于2016-12-16
得票数 1
回答已采纳
4
回答
如何识别硒
的
特定
文本
?
、
、
我创建了一个简短
的
过程,其中im在我
的
网页上自动点击一些链接,我想这样做,如果我有错误500。看起来是这样
的
:以下是在错误500页上检查元素
的
样子:
浏览 8
提问于2015-08-17
得票数 1
回答已采纳
1
回答
使用
regex
应用root.
xpath
()将返回一个lxml.etree._ElementUnicodeResult
、
、
、
我正在生成一个模型,以找出HTML文件中
文本
块
的
位置。from lxml import html with open('somecode.html
浏览 0
提问于2019-04-18
得票数 1
回答已采纳
2
回答
preg_match字符串中
的
所有段落
、
、
我想用一个模式来匹配每个<p>
的
内容,如果匹配,我想向这个特定
的
段落添加一个css类。
使用
下面的代码,我可以匹配所有的字符串,但我无法找到具体
的
段落。
浏览 4
提问于2016-03-15
得票数 1
2
回答
如何通过
xpath
和
内部
文本
获取
元素?
、
我试图
使用
xpath
和
内部
文本
找到一个UI弹出。弹出html如下所示://divcontains(@innerText,‘你好?你今天想玩什么还是死?') 我该怎么做?还是有更好
的
方法找到这个弹出式窗口?这里没有Ids或永久类。此外,DOM结构是可变
的
。
浏览 5
提问于2017-05-23
得票数 0
回答已采纳
1
回答
使用
xpath
或regexp设置import.io crawler
、
、
、
这是这些网站
的
一种趋势,某些信息不在每个页面的相同位置,所以我必须弄清楚如何让它提取包含某些短语
的
文本
元素,而不是基于它们所在
的
位置。以下是此类页面的一些示例: 注意某些信息是如何在不同
的
位置显示
的
,比如MLS #。当我从这些条目中提取出
xpath
时,得到
的
结果是: //*@id="yui_3_15__1_1435013689406_3296",因为我不太熟悉
xpath
,所以我不知道如何修改
浏览 2
提问于2015-06-23
得票数 5
1
回答
将结果输出到csv
的
一行中
、
这实际上是初始
的
后续问题。在dreyescat
的
帮助下,我能够将我
的
CrawlSpider输出到csv。但是,现在它只打印两列(对应于我
的
两个字段)
和
一行(将所有结果转储到相应
的
列中)。我重现了黑客新闻给我
的
例子,它运行得很好,这就是我想要复制
的
。def parse_item(self, response): item['title'] = response.
浏览 6
提问于2014-10-24
得票数 1
回答已采纳
2
回答
使用
xpath
选择属性
和
内容?
、
、
、
Xpath
//a[contains(@class, 'storylink')]/@*将提取锚标记
的
所有属性。我
的
xml中
的
锚标记没有标题属性,该属性通常包含链接
的
内容。是否有一种方法可以在 1.0
的
锚链接中同时选择href和
文本
内容?
浏览 0
提问于2018-04-02
得票数 2
回答已采纳
1
回答
通过google spreadsheet importxml函数选择某个
文本
后
的
字段
、
、
我正在尝试
使用
Google Sheets
的
importxml函数从一个链接中
获取
以下数据:Schätzwert: 100.000,00EUR 因为我想在其他链
接上
使用
XPath
,所以我希望它
的
结构是它选择
文本
Schätzwert:或Kategorie(n):之后
的
文本
。A2中
的
。
浏览 0
提问于2015-11-17
得票数 0
2
回答
如何在Chrome控制台中通过
XPath
选择所有
文本
、
、
、
在Chrome
的
Debugger控制台窗口中,我希望将数组转换为字符串,如下所示: <div class="bar">a</div>for (i in arr) { console.log(arr[i].data); }; 当然,text()返回一个数组,而我只想要
文本
浏览 4
提问于2022-07-21
得票数 1
1
回答
xpath
:消除href标记中
的
文本
、
我有如下所示
的
html,并希望消除href标记中
的
文本
。><td><img alt="iShares Logo" src="/sites/default/files/etfs/logos/ishares-logo-icon.png" /></td> 我想要
的
输出是BetaShares Managed Risk Global Share Fund,WRLD,iSha
浏览 0
提问于2018-01-30
得票数 1
回答已采纳
2
回答
PHP
xpath
发布->item(0)->nodeValue
、
、
、
基于下面的XML,我想检索某个节点(ID)
的
产品名称
和
图像$query = '//client[@id="A"]'; 如果我执行$info->item(0)->nodeValue,我会同时
获取
两个信息,而不是单独<
浏览 3
提问于2014-11-18
得票数 2
1
回答
Xpath
-通过通配符或布尔操作找到以同名开头
的
节点?
、
、
如何找到以相同名称开头
的
Xpath
节点?假设我有以下XML文件, <name>Name 1</name> </Employee>我想找到节点"r
浏览 0
提问于2018-03-15
得票数 3
回答已采纳
2
回答
Selenium:在获得DOM元素列表后查找子标签
、
、
、
、
首先,我是一个负责处理Selenium
的
Javascript开发人员,现在我感觉到了QE所经历
的
痛苦,哈哈,所以我
的
Java知识是基本
的
。我有以下DOM结构,我需要能够找到“链接名称1”并单击它。我也将不得不在不同
的
测试中为其他链接做同样
的
事情。class="common-class-name"> </div> </d
浏览 0
提问于2020-11-25
得票数 0
2
回答
Selenium Python:单击JSON应用程序生成
的
链接
、
、
不确定-- ] 我正在尝试
使用
Selenium (Python)通过超链接导航到web数据库中
的
页面。一个页面返回一个表,其中包含我希望Selenium遵循
的
超链接。与感兴趣
的
表相对应
的
唯一html是指示该站点正在从方面搜索中提取结果
的
标签。在div中有一个<script type="application/json">标记
和
几个搜索选项。没别的了。同样,我可以在Firefox中查看超链接,但不能
使用
&quo
浏览 0
提问于2015-04-29
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券