腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何从div中
提取
所有
文本
,包括来自
Scrapy
和
Xpah同级
的
文本
?
xpath
、
scrapy
在
使用
scrapy
2.4从远程URL
提取
文本
时,我发现它只返回此div
中
的
文本
,而不返回它
的
子
节点
中
的
文本
。 例如。<div> <p>text inside child</p> more text </div>
浏览 16
提问于2020-12-26
得票数 0
回答已采纳
2
回答
如何在
XPath
中
包含格式化
文本
?
python
、
xpath
、
scrapy
我正在为我
的
IT工作做
一个
项目,这个项目要求我
使用
Scrapy
/
XPath
编写
一个
刮板,以便从
一个
相当简单
的
HTML页面获得一组相当简单
的
数据。除了一些斜体
文本
(被刮掉
的
网站是用于语言教育项目的,并且在这个特定
的
文本
字段中有很多斜体),我已经按照我想要
的
方式工作了。下面是我在斜体问题出现之前成功
使用
的
浏览 0
提问于2016-06-29
得票数 3
回答已采纳
1
回答
不能让
Scrapy
/
Xpath
注意到双<br>
python
、
xpath
、
scrapy
<br> 我选择它是
xpath
,它带有像这样
的
刮擦:Out',我怎么能做到这样它就不会忽视额外
的
br?
浏览 1
提问于2014-04-01
得票数 1
回答已采纳
3
回答
XPath
中
节点
与功能
的
结合
python
、
xpath
、
scrapy
我正在
使用
Scrapy
爬行一些网页。我想编写
一个
XPath
查询,该查询将在父<div>
中
向任何
子
<a>
节点
追加几个
文本
字符,同时通常
提取
div
的
self
节点
的
文本
。本质上,它就像
一个
普通
的
descendant-or-self或//查询,只是用|编写并调用后代上
的
con
浏览 3
提问于2016-10-04
得票数 0
回答已采纳
3
回答
使用
XPath
和
Scrapy
从下
一个
节点
的
子
节点
中
提取
文本
python
、
xpath
、
scrapy
使用
Python
Scrapy
,我尝试获取
一个
网页
中
的
内容,该网页
的
节点
如下: <div id="title">Title</div> <li> <span>blahblah</</ul> 我是
XPath
的
新手,现在还不能
使用
它。我
的
最后一次尝试是这样
浏览 34
提问于2019-12-26
得票数 0
回答已采纳
2
回答
Scrapy
1.1/Python3 3从字符串
中
删除字符串
python-3.x
、
web-scraping
、
scrapy
我正在尝试从
一个
旧
的
html页面
中
获取数据。www.example.com/t/search-title-Proprietor.html" style="color:#259cd5">Proprietor</a> John Doe</strong></p>Contact: [u'Contact: ', u' John Doe'] 唯一
浏览 3
提问于2016-08-18
得票数 0
回答已采纳
2
回答
如何
使用
xpath
找到包含具有指定
文本
的
节点
的
直接
子
节点
?
xpath
、
nokogiri
我需要
提取
所有有一些
文本
节点
的
子
节点
。"A“
文本
的
子
节点
。它应该返回div
和
p
节点
./*/*[contains(text(), 'A')]但是,第
一个
浏览 0
提问于2018-04-27
得票数 1
回答已采纳
1
回答
困在lxml
和
python 3.x
中
的
xpath
中
python
、
xpath
、
lxml
我正在解析
一个
arxml文件以
提取
python 3.x
中
的
数据,但是我被困住了,无法
从下
面的代码中
提取
数据。我就是不明白我错过了什么。
使用
xpath
,我定位了
子
节点
,从那里开始
提取
其所有
子
元素
的
数据。我在在线测试器
中
测试了
xpath
表达式(dataExpre3)输出,它将输出作为
节点
下
的
完整x
浏览 4
提问于2022-03-04
得票数 0
回答已采纳
2
回答
从具有多个元素
的
类
中
获取
文本
xpath
、
scrapy
、
css-selectors
我正在尝试从以下元素
中
获取
文本
: <h1 class="entry-title single-title typesquare_option" itemprop="headline" rel="bookmark">Target Text Here</h1> 但我不知道如何告诉
scrapy
“从H1获取
文本
,但跳过itemprop
和
rel元素”。'>] 所以我已经很接近了,但是如果我尝试获取
文
浏览 65
提问于2021-11-06
得票数 -1
回答已采纳
1
回答
在封装为<li>标记
的
两个已知关键字之间以<b>形式刮取数据
python-3.x
、
xpath
、
web-scraping
、
scrapy
我想要将<b>Contre-indications</b>
和
之间
的
数据作为<li>在<b>指示</b>
和
下
一个
<b></b>之间进行刮除,每个<b></b>都有不可预测
的
关键字。<br> </article> First approach:
使用<
浏览 0
提问于2018-10-10
得票数 0
回答已采纳
2
回答
刮伤
xpath
不捕获标记
xpath
、
tags
、
scrapy
、
html-lists
在这种情况下,我想让
Scrapy
提取
出“圆形大小”。但事实证明,
Scrapy
无法捕捉dl下
的
任何
子
节点
。response.
xpath
('//[@id="termsheet"]/div/section[1]/div/dl/li[2]/dt/span').extract()
Xpath
表达式是从Chome inspect生成<e
浏览 7
提问于2016-06-06
得票数 0
回答已采纳
2
回答
xpath
标记不确定要放置什么
python
、
xpath
、
scrapy
我有一页纸,我正试着得到它
的
价格。这里有
一个
窥视线。</span>96 </div>'] 如果我得到
的
只是跨度,它就给了我$
和
。但我不知道该属性(或属性、价值或其他什么)在实际金额所在
的
末尾
的
跨度之后被称为“后面”。我想得到第一部分,期间,
和
第二部分,但我会采取任何比我得到
的
更好
的
。最后,我运行了这段测试代码,以查看我放在其中
的
网页块
的
属性。我跑
浏览 1
提问于2016-01-09
得票数 2
回答已采纳
2
回答
xpath
用于
提取
特定
节点
中
的
所有
文本
,并
使用
scrapy
将其作为
一个
元素返回
python
、
xpath
、
scrapy
<br></p> This is the second sentence</html> 我想从p
节点
中
提取
文本
,
一个
节点
中
的
所有
文本
都应该作为
一个
元素返回,我
使用
scrapy
shell,如下所示:
scrapy
shell path/to
浏览 17
提问于2019-01-23
得票数 0
回答已采纳
1
回答
使用
XPath
:在根
节点
下查找每个段落
的
最后
一个
文本
节点
html
、
ruby
、
xpath
、
xhtml
、
rexml
假设我在
一个
有效
的
XHTML文件
中
包含以下内容:<p>Hi there </p>我想用这个来结束:<p>Hi there</p> &
浏览 2
提问于2008-11-03
得票数 3
回答已采纳
1
回答
关于
XPath
教程
的
w3school问题
javascript
、
xml
、
xpath
这是链接 document.write("<br>");} 那里
的
结果应该是最不重要
的
节点
根据W3C标准,第
一个
节点
应该表示为node1。因此,我开始认为原子值是
一个
节点
,然后对代码进
浏览 4
提问于2013-11-27
得票数 0
回答已采纳
2
回答
XPATH
- /a/text(),无法
提取
电子邮件地址(
文本
)
email
、
xpath
、
scrapy
我有
一个
简单
的
HTML文件,其中包含用户名
和
指向其
子
页面的链接:我
使用
xpath
('./
浏览 0
提问于2018-06-04
得票数 0
5
回答
提取
文本
xpath
抓取
html
、
xpath
、
scrapy
大家好,我想用
scrapy
中
的
xpath
从html块中
提取
所有
文本
。假设我们有这样
一个
街区: <p>Blahblah</p> <p><a><span>Bliblih</span></a></
浏览 10
提问于2014-10-10
得票数 8
回答已采纳
2
回答
使用
属性选择器后
Xpath
提取
文本
xpath
、
web-scraping
、
scrapy
、
html-parsing
我想用
Xpath
代码从HTML文件中
提取
一些
文本
。我在Chrome控制台中
提取
的
文本
如下:2) TEXT[0].innerTextTEXT=$x('//*[@id="
浏览 0
提问于2019-01-04
得票数 1
回答已采纳
1
回答
需要hpple帮助
的
iOS解析内容
ios
、
xpath
、
html-parsing
、
hpple
我现在正在教自己如何在iOS
中
筛选废品,我已经学会了如何在Android上这样做。 我正在
使用
hpple库。我目前正在努力复制我在Android上
使用
hpple所拥有的内容,因此,我正在寻找一些关于如何正确
使用
hpple来解析我
的
HTML内容
的
指导。,如果你看到
的
HTML,所以我需要能够得到
的
值:“代码MyTestCode",”编号123",“公司名称”,"11:10 AM“
和
”公司
的
状
浏览 2
提问于2013-12-04
得票数 0
回答已采纳
1
回答
仅在
子
节点
中进行
XPath
搜索
xpath
、
html-agility-pack
我
使用
HTML敏捷性包从
节点
中
提取
文本
。我想从“
节点
”及其
子
节点
中
提取
文本
,但是这个
xpath
查询返回整个html文档
的
结果(我猜它从根
节点
开始搜索)。我知道这很愚蠢,但我如何更新
XPath
,使其只在“
节点
的
子
节点
:”中进行搜索:) 谢谢
浏览 1
提问于2014-02-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scrapy框架的使用之Selector的用法
Python 萌新-10分钟学会爬虫
爬虫框架Scrapy的第一个爬虫示例入门教程
解析库之 XPath(1)
码以致用02-用Scrapy 爬虫抓取简单心理咨询师资料
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券