腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5090)
视频
沙龙
1
回答
赋值
元素
后
,
抓取
xpath
提取
文本
、
、
、
我有这样的html <h1 id="1"><i>2</i>sample contents</h1> 我知道,通过使用下面的工作,可以在没有html的情况下完美地获取
文本
。response.
xpath
('//*[@id="1"]/text()').get() # sample contents response.
xpath
('//*[@id="
浏览 12
提问于2020-09-15
得票数 0
回答已采纳
1
回答
Xpath
在控制台中正确定位html
元素
,但在使用scrapy响应时返回空数组。
、
、
、
、
我已经成功地为一些选择器
抓取
了数据,这些选择器本质上只是html
文本
,但是其他一些选择器正在收集任何东西。当我试图从每个票证中刮取音乐会日期时,响应中会返回一个空数组,尽管我使用的
xpath
在开发人员控制台中运行时返回所有正确的日期。我在类定义中定义项的方式有问题吗?.*', )), callback='parse_item')) tickets_list_
xpath
= '.HtmlXPathSelector(re
浏览 3
提问于2015-06-27
得票数 2
回答已采纳
2
回答
如果selenium中的
文本
元素
被主体标记分割,如何访问它
、
在网页
抓取
数据的过程中,当我试图访问网站上的一些值时,我遇到了问题。问题是,我想要
提取
的
文本
在类中,其中包含由标记分隔的几个
文本
(这些正文标记也有对我来说也很重要的
文本
)。因此,首先,我尝试使用我需要的
文本
(在本例中为“类别”)查找标记,然后从正文标记
赋值
下面的
文本
中
提取
确切的类别。我可以使用精确的
XPath
,但是这里不是这样的,因为我需要在web上
抓取
的其他页面在这个侧边栏中包含了不同数量的行,所
浏览 1
提问于2020-05-17
得票数 0
回答已采纳
1
回答
如何从另一个同级
元素
中
提取
一些
元素
(n)之外的
xpath
同级
元素
?
、
、
、
我一直在解析github文档页面的HTML,并在此过程中了解了一些
xpath
。然后,使用,我从
xpath
语句中得到一个
元素
列表:从这里开始,我对上面
xpath</em
浏览 0
提问于2018-04-13
得票数 0
回答已采纳
2
回答
selenium
抓取
在前几个
元素
后
返回空字符串
、
、
、
我正在使用python中的selenium
抓取
一个网站。
xpath
能够找到包含搜索结果的20个
元素
。但是,该内容仅对前6个
元素
可用,其余
元素
为空字符串。结果的所有页面都是如此results = driver.find_elements_by_
xpath
("//li[contains(@class, 'search-result search-result__occluded-item ember-view
浏览 3
提问于2017-03-03
得票数 3
1
回答
无法使用python路径从选项卡中
提取
数据
、
、
您好,我正在尝试从页面的选项卡中
提取
数据我在试着
提取
位置我使用下面的python代码和path(使用google chrome inspect)。priva-the-invincible-and-reusable-camera-privacy-s/description') testxpath= test_pagetree.
xpath
浏览 2
提问于2016-02-20
得票数 0
2
回答
获取具有特定span类python selenium的页面中的所有
元素
、
、
您好,我正在尝试使用python中的selenium
抓取
多个页面。我感兴趣的是
提取
属于span类
元素
的所有
元素
,基本上我想做的是获取span类
元素
,然后
提取
其中的链接。对于每个页面,都可以通过使用
xpath
来实现这一点,但是每个对象和每个页面的
xpath
都会发生变化。下面是一个web
元素
的示例: 📷 基本上,我想
提取
元素
,这是一致的,在所有的页面,我将
抓取
。所以我的想法是获
浏览 30
提问于2020-10-29
得票数 0
回答已采纳
1
回答
在
xpath
中获取
文本
值,而不包括脚本
、
你好,我刚开始使用web
抓取
和X路径,我在ID main中的scrapy (python框架)中使用了以下x路径,如何修改
xpath
以不收集“脚本”和“样式”中的
文本
?my_list=response.
xpath
('//*[@id="main"]//text()').extract() 在网上搜索
后
,我发现我可以使用|放置多个x路径(在我的例子中,每个标记都是特定的),但是这是不有效的,因为
文本
可以在任何标记
浏览 1
提问于2019-12-02
得票数 1
回答已采纳
1
回答
如何利用Google中的
XPath
从踢起器
抓取
文本
、
、
我正在尝试从踢起器中
提取
位置数据,以添加到我现有的数据集中。IMPORTXML(A1, $A$2) 成功地
抓取
了整个列表
元素
(晋升
浏览 1
提问于2018-04-29
得票数 0
1
回答
如何从selenium中的模型对话框中
提取
文本
?
、
、
、
我试图从"“中
抓取
数据,只需单击”获取原始列表“即可
提取
数据,这将打开网站内的一个模型框,您可以轻松地复制或
提取
该数据。所以我试着用正常的方法
提取
文本
但它让我看到了一个错误我按照这个答案来解决这个问题 WebDriverWait(driver, 10).until(EC.elemen
浏览 0
提问于2020-06-11
得票数 0
回答已采纳
5
回答
提取
文本
xpath
抓取
、
、
大家好,我想用scrapy中的
xpath
从html块中
提取
所有
文本
。<div> <p><a>Bluhbluh</a></p></div> 我想把
文本
摘录为我希望<em
浏览 10
提问于2014-10-10
得票数 8
回答已采纳
1
回答
Scrapy Spider
、
、
、
我正在尝试
抓取
亚马逊,但我获得的file.csv是空白的。: ml_item['articulo'] = response.
xpath
="result_0"]/div/div/div/div[2]/div[1]/div[1]/a/h2').extract() ml_item[
浏览 0
提问于2018-03-25
得票数 1
1
回答
使用
xpath
从html中
提取
文本
、
我想从html中
提取
文本
,就像这样-Written by()] 然后,它必须
提取
一个单独的
文本
“由Apache Indian (as Stephen Kapur)和Ervin Barrington Woolley编写”,但上面的命令
提取
三个
文本
元素
“由”,
浏览 0
提问于2015-05-02
得票数 2
2
回答
如何使用
Xpath
选择第二个<p>
元素
、
(完整评论-点击“阅读更多”按钮
后
)。我使用RSelenium来做这件事。我可以使用下面的代码从第一个<p>
元素
中选择和
提取
文本
这是为了减少
文本
审查但是不能使用代码
提取
全文评论 reviewNodes <- mybrowser$findElemen
浏览 0
提问于2016-04-01
得票数 2
1
回答
Python/selenium网络
抓取
、
data_links中的链接:driver.get(链接)# get the size of company我正在尝试
抓取
一个网站。我正在使用selenium/python从跨度中剔除“501to1000名员工”和"Biotech &制药“,但我无法使用
xpath
.I从网站中
提取
文本
元素
。这是每次迭代的输出:我没有得到
文本
浏览 10
提问于2017-07-30
得票数 1
回答已采纳
1
回答
如何从extract_first()输出中删除
xpath
?
、
、
我正在从一个网站中
抓取
信息,并使用.extract_first()
提取
元素
。相关代码:name = sel.
xpath
('//li[@class="inline如何摆脱
xpath
,以便输出的输出只是
元素
文本
?谢
浏览 1
提问于2020-02-18
得票数 1
回答已采纳
1
回答
如何使用
xpath
定位器访问特定或所有
文本
元素
?
、
、
目前使用Python和Selenium来
抓取
数据,导出到CSV,然后根据需要进行操作。我很难掌握如何构建
xpath
语句来访问动态生成的页面上的特定
文本
元素
。),后面是与产品卡关联的所有
文本
字段。下面的语句允许我
提取
"Flower“类别下的所有标题(某种程度上),但我无法访问该产品中的所有子
文本
元素
,只能访问标题的一个奇怪变体。
xpath
方法似乎很理想,因为它允许我
提取
这些数据,而不必使用key passes
浏览 14
提问于2021-05-05
得票数 0
回答已采纳
1
回答
使用selenium在网页上的两个
文本
值之间选择
元素
、
、
、
我正在尝试从中
抓取
文本
值。我对同义词节感兴趣,但是在整个网站中使用的标记也用于其他部分。有人能帮我
浏览 2
提问于2020-03-31
得票数 1
回答已采纳
1
回答
使用python在selenium中查找具有 和相应值的
元素
、
我有下面的html代码,我正在尝试找到
元素
的标题和相应的
文本
。如何使用find_element_by_
xpath
提取
这些值?
浏览 0
提问于2021-03-20
得票数 0
1
回答
在包含"sometext“的网页中获取链接的
xpath
、
、
是否可以在网页中获取某个
元素
(包含"sometext")的
xpath
,以便
提取
具有类似
xpath
的
元素
?我不希望我的
xpath
被硬编码,因为我将爬行多个网站。
浏览 2
提问于2016-01-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HTML OnSelect 事件属性|用户选取元素文本后触发
babybox-信息抓取
使用XPath进行网页爬取的Python实现
网页源码解析模块介绍及实战
爬虫学习笔记3:我的第一次爬虫实践,原来可以如此轻松
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券