腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Python
XPath
lxml
包
抓取
<
span
>
标记
中
的
文本
python
、
web-scraping
、
lxml
我正在尝试从网页上
的
标签
中
获取
文本
。
使用
Chrome
的
Inspect element功能,我看到我想要
的
文本
如下所示: <
span
id> " 12" </
span
> 我想要
的
只是上面的
文本
为此,我提供了以下
python
代码: from
浏览 66
提问于2020-07-08
得票数 0
回答已采纳
1
回答
无法按位置或属性匹配时,提取BeautifulSoup
中
的
标签值
python
、
beautifulsoup
我正在
使用
BS来
抓取
网页,但我遇到了一个小问题。下面是页面
中
的
一段HTML代码。<
span
style="font-family: arial;"><
span
style="font-weight: bold;">Artist:</
span
> M.I.A.<br>一旦我得到了汤,我如何找到这个
标记
并
浏览 7
提问于2010-08-06
得票数 2
1
回答
当
lxml
.etree在网页上执行
XPath
解析时,它无法获得所有
文本
。
python
、
xpath
、
lxml
当我
使用
lxml
.etree解析HTML时,如果目标
标记
包含多个
标记
,则不能
使用
XPath
解析所有
文本
。> </
span
>""" html_
浏览 3
提问于2022-08-12
得票数 1
1
回答
XPath
找不到任何结果
python
、
xpath
、
python-requests
、
lxml
使用
Python
3.4、
lxml
和请求来搜索google趋势.提前谢谢你。HTML: <
span
class="hottrends-single-trend-title ellipsis-maker-inner">Joh
浏览 1
提问于2017-06-23
得票数 0
回答已采纳
1
回答
XPath
表达式以捕获特定根目录下
的
所有嵌套
文本
xpath
、
lxml
我有一些HTML,我想从其中提取
使用
Python
+
lxml
的
文本
内容 <body> <div class</
span
> </body>几个条件- div[@class='cont
浏览 2
提问于2020-06-08
得票数 0
回答已采纳
1
回答
Python
-请求、lmxl和
xpath
不起作用
python-3.x
、
xpath
、
python-requests
我正在尝试编写一些
python
来为固件/驱动程序更新而
抓取
网页,但不同
的
网页
的
响应却不同。工作示例
浏览 5
提问于2019-12-25
得票数 4
回答已采纳
2
回答
获取包含
文本
的
标签
的
最快方法
python
、
lxml
我需要
使用
lxml
.html
抓取
所有包含
文本
的
标记
。我一直在
使用
{e.tag for e in doc.
xpath
('.//*[text()= true()]')},但是
lxml
中
的
通配符和text()查询都是出了名
的
慢。有没有更快
的
方法。
浏览 0
提问于2013-02-04
得票数 0
回答已采纳
3
回答
无法
使用
Xpath
获取
文本
,尽管已经
使用
了/text()
python
、
xpath
我正在尝试
使用
从
XPath
中
抓取
数据,虽然我
使用
XPath
复制路径并将/text()添加到末尾,但在最后一个
span
标记
之间返回了一个空列表而不是["Class 5"]。import requests sample_page = requests.get("https://www.racenet.com.au/horse
浏览 6
提问于2016-11-19
得票数 0
回答已采纳
2
回答
如何
使用
lxml
,
XPath
和
Python
从网页中提取链接?
python
、
screen-scraping
、
hyperlink
、
lxml
、
extraction
我得到了这个
xpath
查询:它提取所有带有标题属性
的
链接-并在
中
给出href。但是,我似乎不能在
lxml
中
使用
它。from
lxml
import etree parsedPage = etree.HTML(page) # Create parse tree from valid page.#
Xpath</
浏览 0
提问于2010-01-18
得票数 5
回答已采纳
1
回答
使用
布尔值
使用
Python
执行不同
的
XPath
表达式
python
、
xpath
、
web-scraping
、
lxml
、
boolean-operations
我正在尝试
使用
python
脚本和
lxml
从网站
中
抓取
天气数据。风速数据将被提取并附加到列表
中
,以供以后进行操作。下拉
文本
,否则执行
XPath
表达式只是为了在“阵风”div下拉
文本
。我试着搜索
使用
XPath
布尔函数
的
示例,但是无法使任何东西正常工作(无论是在Safari检查器
中
还是在我
的
脚本
中
)。我的当前代码
使用
浏览 1
提问于2018-09-13
得票数 0
回答已采纳
1
回答
具有多个表
的
时间表Web
抓取
(
Python
)
python
、
google-app-engine
、
google-cloud-datastore
、
web-scraping
、
beautifulsoup
我只是在找一些关于
python
web
抓取
的
信息。我正在尝试从时间表
中
获取所有数据,我想让课程与其开始
的
时间联系起来。查看html,有多个表(表
中
的
表)。我计划将Google App Engine与
Python
(或许也包括BeautifulSoup )一起
使用
。对最好
的
方法有什么建议吗?谢谢我已经设法
使用
以下代码从表中提取了所需
的
数据:fr
浏览 0
提问于2013-03-15
得票数 1
回答已采纳
1
回答
lxml
删除
标记
中
未包装
的
文本
。
python
、
lxml
下面是我用
lxml
编写
的
python
代码from
lxml
import etreefrom copyimport deepcopyfrom
lxml
import html some_xml_data = "<
span
>text1<div>ddd</d
浏览 1
提问于2016-07-29
得票数 1
回答已采纳
1
回答
我可以将
lxml
div对象转换为字符串吗?
python
、
lxml
我正在编写一个从网站上
抓取
文本
的
程序。是否可以将此div
标记
转换为字符串,以便更容易格式化?from
lxml
import etreeelement = etree.HTML(requests.get('a website')).
浏览 1
提问于2018-07-22
得票数 0
1
回答
Python
:
使用
lxml
xpath
从所有HTML子元素
文本
中
获取
文本
python
、
xpath
、
lxml
我正在
使用
python
的
lxml
xpath
。如果给出HTML
标记
的
完整路径,我就能够提取
文本
。但是,我不能从
标记
中提取所有
文本
,并将它
的
子元素提取到列表
中
。例如,考虑到这个html,我想得到“示例”类
的
所有
文本
: "Some text"
浏览 2
提问于2020-09-01
得票数 0
回答已采纳
1
回答
从
xpath
@属性
中
剥离html
标记
python
、
xpath
、
lxml
我正在尝试
使用
lxml
和
xpath
从网页中提取一些
文本
--我需要两个部分page = requests.get(url) body_one = pageopen.
xpath
('/html/body//div/div/div//div/p[@class="body"]/tex
浏览 1
提问于2014-06-09
得票数 0
回答已采纳
3
回答
Python
和
xpath
:标识带有空格属性
的
html
标记
html
、
python-3.x
、
xpath
、
web-scraping
、
lxml
</
span
>这是一个更大
的
html页面的部件,它包含带有其他
标记
的
其他a元素。但是,我只想将推荐给类为tag11 tag12
的
a元素,并创建一个包含所有href值
的
列表。
使用
Python
3.5、
lxml
和
xpath
,这里是第一次尝试:import requests page = reques
浏览 1
提问于2018-06-25
得票数 1
1
回答
如何刮取
使用
JQuery加载
的
特定HTML元素
jquery
、
python
、
html
、
lxml
我正在编写一个
python
应用程序,它可以从我制作
的
web应用程序
中
抓取
传感器数据。我想
使用
lxml
从HTML
中
收集某些
span
元素,这些元素通过JQuery脚本定期更新。似乎
lxml
没有获取
使用
JQuery更新
的
文本
,因为我只检索加载原始HTML
的
空字符串。JQuery
的
值是在查看网页时反映出来
的
,而不是在web
抓取<
浏览 8
提问于2016-07-06
得票数 0
回答已采纳
1
回答
在没有BeautifulSoup
的
Python
语言中将HTML表解析为列表
python
、
html
、
html-parsing
我想知道是否有一种方法可以从HTML表中提取数据,并仅
使用
HTMLParser将其解析到字典
中
。由于某种原因,我不能做这件事..
浏览 1
提问于2012-03-04
得票数 0
1
回答
如何通过Selenium在一个跨度内提取HTML
中
的
文本
209.520?
java
、
selenium
、
xpath
、
css-selectors
、
webdriver
我正在
使用
selenium进行自动化,并尝试获取
span
标签
中
的
值。我该怎么做呢?我已经尝试过
使用
getText(),但输出
的
结果为空<
span
class="visible-xs" data-bind="html: PriceWithoutCurrencySymbol">209.520</
span
> 我要坐99.520路
浏览 44
提问于2018-08-26
得票数 1
5
回答
用
Python
请求提取href URL
python
、
python-3.x
、
xpath
、
python-requests
、
lxml
我想
使用
python
中
的
请求
包
从
xpath
中提取URL。我可以得到
文本
,但我没有尝试给出URL。有人能帮忙吗?ipdb> webpage.
xpath
(
xpath
_url + '/text()')ipdb> webpage.
xpath
(
xpath
_url + '/a()'
浏览 7
提问于2015-11-20
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫入门2 爬取豆瓣电影信息
爬取豆瓣电影信息,入门Python爬虫的精品小案例,请收下
使用XPath进行网页爬取的Python实现
Python爬虫基础学习,从一个小案例来学习xpath匹配方法
网页源码解析模块介绍及实战
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券