腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
:
在
使用
scrapy
和
xpath
时
,
如何
同时
获取
文本
和
带有
<
b
>
标记
的
文本
?
python
、
xpath
、
scrapy
我需要从下面的html中
获取
183.7 <span class="price"><
b
>183</
b
>.7</span> 但是,如果在代码下面以
scrapy
shell模式运行,则只有'.7‘可用 response.
xpath
('//span[@class="price"]/text()').get() 我该
如何
写代码来获
浏览 11
提问于2019-10-17
得票数 1
回答已采纳
1
回答
不能让
Scrapy
/
Xpath
注意到双<br>
python
、
xpath
、
scrapy
<br> 我选择它是
xpath
,它
带有
像这样
的
刮擦:Out',我怎么能做到这样它就不会忽视额外
的
br?
浏览 1
提问于2014-04-01
得票数 1
回答已采纳
1
回答
刮擦脚本,
如何
找到特定
的
关键字并返回或打印url
python
、
xpath
、
web-crawler
、
scrapy
好
的
,所以我必须完全编辑这个。我已经让脚本部分工作,我可以启动它没有任何问题,这是脚本。粘贴链接在这里:,您可以看到我
在
cmd行中得到了什么。我确信正在搜索
的
关键字在这些链接中,因为我也尝试过其他单词,但它没有下载它们。import
scrapy
from
scrapy
.http import Request from FinalSpider.itemsitems.py URL = "http:/
浏览 2
提问于2015-11-30
得票数 0
回答已采纳
1
回答
使用
类查找锚
标记
内
的
文本
的
Xpath
python
、
xpath
、
scrapy
我正在
使用
scrapy
并尝试
使用
xpath
提取锚
标记
中
的
文本
。例如,锚
标记
有一个名为test
的
类。示例:这就是我目前所拥有的://a[@class="test"]/ 我
如何
使用
锚标签
和
浏览 0
提问于2018-01-22
得票数 0
2
回答
XPATH
- /a/text(),无法提取电子邮件地址(
文本
)
email
、
xpath
、
scrapy
我有一个简单
的
HTML文件,其中包含用户名
和
指向其子页面的链接:我
使用
xpath
('.//a/text()
浏览 0
提问于2018-06-04
得票数 0
1
回答
使用
带有
Scrapy
的
CSS选择器
获取
子
标记
的
文本
,什么也不返回。
python-3.x
、
scrapy
虽然最初这是一个非常常见
的
问题,但我尝试了许多不同
的
方法来递归地从以下html代码中删除所有
文本
,但由于某种原因,它们都没有工作: <span class="
浏览 3
提问于2022-12-04
得票数 0
回答已采纳
2
回答
如何
找到HTML
标记
的
title属性
的
Xpath
并打印该标题
的
文本
python
、
scrapy
我
使用
的
是pythons
scrapy
库。我希望能够
使用
Xpath
选择器从下面的<h1>代码中抓取包含在title属性中
的
文本
。www.facebook.cpm/" title="Go to Facebook home">
浏览 32
提问于2019-01-13
得票数 0
回答已采纳
1
回答
从第一个元素和文章标题中收集数据
python
、
web-scraping
、
web-crawler
、
scrapy
、
scrapy-spider
<span>odometer: <
b
>164</
b
></span> <span>fuel : <
b
>gas</
b
></span> <span>transmission : <
b
>automatic</
b
></span> <span>title status : <<e
浏览 0
提问于2015-05-25
得票数 1
回答已采纳
1
回答
python
Scrapy
获取
一个部分中
的
所有
文本
标记
python
、
scrapy
我想
使用
Scrapy
来获得任何类型
的
文本
标签,比如h1,p,span,strong
和
其他
在
部分标签旁边
的
标签,而忽略其他像img这样
的
标签:<h1>text</h1> name = 'example '
浏览 13
提问于2021-05-31
得票数 1
回答已采纳
1
回答
如何
利用刮擦获得工作描述?
python
、
xpath
、
scrapy-spider
我对
scrapy
和
XPath
很陌生,但用Python编程已经有一段时间了。我希望
使用
scrapy
从页面email、name of the person making the offer
和
phone中
获取
https://www.germanystartupjobs.com/job正如您所看到
的
,电子邮件
和
电话是
在
<p>标签中作为
文本
提供
的
,因
浏览 5
提问于2016-12-16
得票数 1
回答已采纳
2
回答
从具有多个元素
的
类中
获取
文本
xpath
、
scrapy
、
css-selectors
">Target Text Here</h1> 但我不知道
如何
告诉
scrapy
“从H1
获取
文本
,但跳过itemprop
和
rel元素”。我可以这样
获取
H1元素: response.
xpath
('//*[contains(@class,"entry-title")]') 它会返回 [<Selector
xpath
='//*[
浏览 65
提问于2021-11-06
得票数 -1
回答已采纳
2
回答
Scrapy
/
XPath
:替换段落中
的
内联
标记
xpath
、
scrapy
我试图
使用
Scrapy
从p中提取
和
清除一些包含内联图标
和
其他
标记
的
文本
。特别是,我希望用从图像src属性中提取
的
文本
替换图像
标记
:text = ''' <p id="1"><
b
><br></
b</e
浏览 1
提问于2018-06-28
得票数 0
回答已采纳
1
回答
使用
XPATH
刮取属性值?
python
、
xpath
、
web-scraping
、
scrapy
我刚刚开始
使用
XPath
进行html抓取,所以我对语法有点困惑。_h480_q80.jpg" />html路径如下: <li> <a></a> 我正在
使用
scrapy
解析html页面,到目前为止,这是我
的
代码'] = site.select('div/a/@href').e
浏览 2
提问于2017-06-25
得票数 1
回答已采纳
2
回答
使用
Scrapy
获取
属性名称
python
、
xpath
、
scrapy
我试图
同时
获取
XML文件中某些
标记
的
键值
和
属性值(
使用
scrapy
和
xpath
)。标签是这样
的
:我不知道"attr1“、"attr2”等键,它们可以
在
两个元素之间进行更改。我不知道
如何
使用
xpath
浏览 3
提问于2015-09-25
得票数 4
回答已采纳
1
回答
Scrapy
xpath
aria-select=false
xpath
、
web-scraping
、
scrapy
、
web-crawler
、
khan-academy
我正在尝试
使用
scrapy
从一些可汗学院
的
视频中
获取
转录信息。例如: 当我试图通过
xpath
response.
xpath
('//div[contains(@role, "tablist")]/a').extract()选择Transcript按钮
时
,我只得到了
带有
aria-selected="true"
的
选项卡
的
信息,即abo
浏览 8
提问于2016-08-15
得票数 1
3
回答
如何
使用
Scrapy
获取
完整链接
文本
python
、
html
、
scrapy
我
使用
scrapy
从webpage.And
获取
数据,我遇到了如下问题。<a href="NEW-IMAGE?type=GENE&object=EG10567">manX -Escherichia coli</a></li> 在网页中,该记录
的</em
浏览 3
提问于2016-03-22
得票数 0
回答已采纳
1
回答
Xpath
grep元素
html
、
scrapy
、
scrapy-spider
我正在
使用
Scrapy
Python尝试从站点中grep数据。
如何
使用
Xpath
对此结构进行grep?>"Section": { [45767 : Win_1 : TEST_1] [85567 : Win_T : TEST_T] [435656 : Win_A : TEST_A
浏览 3
提问于2017-06-24
得票数 0
回答已采纳
1
回答
按顺序进行抓取索引
python
、
html
、
xpath
、
scrapy
我目前正在
使用
Scrapy
创建一个切分网络爬虫,并尝试
使用
Elasticsearch对
获取
的
内容进行索引。到目前为止一切正常,但我只能按照爬虫过滤html标签
的
顺序将内容添加到搜索索引中。所以举个例子到目前为止,我可以从
带有
类“文章”
的</
浏览 0
提问于2016-09-01
得票数 0
2
回答
刮擦返回多项
python
、
web-scraping
、
scrapy
、
scrapy-spider
我对
Scrapy
很陌生,我真的不知道
如何
在一个块中返回多个项目。Spider.pyfro
浏览 1
提问于2017-10-04
得票数 6
回答已采纳
1
回答
在
Scrapy
中
使用
XPath
提取HTML结果失败,因为内容是动态加载
的
python
、
html
、
xpath
、
request
、
scrapy
与我之前
的
一个问题有关,但与此不同
的
是,我遇到了一种情况,即
Scrapy
(用于Python)不会在h4
标记
中提取span
标记
。标签中
获取
“骑士格罗夫”
的
文本
。
在
命令行上
使用
scrapy
shell
时
,th
浏览 3
提问于2017-07-01
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scrapy框架的使用之Selector的用法
Scrapy向导
使用 Python 和 Scrapy 半小时爬了10 个在线商店的网页
一直说爬虫,你可知道爬虫的机制内容的嘛?
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券