腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Xpath
中
,
这个
BeautifulSoup
表达式
的
等价物
是什么
?
、
、
我试图用scrapy和
BeautifulSoup
抓取
这个
link,但是由于某种原因,
BeautifulSoup
不能在爬行器
中
工作,它只能在scrapy shell
中
工作。我知道这听起来可能很愚蠢,但是,如何将其转换为
Xpath
呢?soup.find('li', {'class': 'at-listing__list-icons_location'}) 我试过了 response.
xpath
('
浏览 13
提问于2020-08-12
得票数 0
回答已采纳
1
回答
lxml等价于
BeautifulSoup
的
"OR“语法?
、
、
我正在将一些html解析代码从
BeautifulSoup
转换为lxml。我正在尝试找出以下BeautifullSoup语句
的
lxml等价语法:基本上,我希望
在
文档中找到具有class属性"current zzt“或"zzt”
的
所有"a“标记。
BeautifulSoup
允许传入一个列表、字典,甚至是
浏览 1
提问于2009-09-05
得票数 6
回答已采纳
1
回答
Xpath
或Css
表达式
是否与类或id名称匹配?
、
假设您希望找到带有
xpath
表达式
的
h1元素是否有一种方法可以使其与h1匹配,而在一个
表达式
中
没有确切
的
类名?即使是没有课
的
。 css
的
等价物
是什么
样子
的
?
浏览 5
提问于2014-09-16
得票数 1
回答已采纳
2
回答
使用
BeautifulSoup
与
XPath
进行Python Web抓取
的
优缺点
、
、
、
我最近一直在学习
在
Python语言中使用
BeautifulSoup
进行web抓取,但今天早些时候有人建议我考虑使用
XPath
表达式
。
XPath
和
BeautifulSoup
的
工作方式有何不同?
浏览 5
提问于2015-10-03
得票数 4
4
回答
如何通过div类查找元素(不包括td类
中
的
所有元素)
、
、
、
、
我正在使用
Xpath
,并试图找到所有td
的
div类名为'day‘,不包括那些td类名为’those _day‘
的
td。 <td class="invalid_day"> <div class="da
浏览 0
提问于2020-07-15
得票数 0
回答已采纳
2
回答
从
XPath
-1.0
中
的
元素获得更好
的
xpath
、
有没有其他/更好
的
方法来做到这一点?它必须是
这个
结构,我不能改变。Snake</home> <outside>Horse</outside></xml>这是可行
的
,但是我想知道是否有使用
xpath
<e
浏览 0
提问于2018-07-11
得票数 0
3
回答
Regex
表达式
错误
、
、
、
我试图从以下短语中提取
这个
国家(这里是印度尼西亚): <span class="hidden-xsxh-highlight">Kick off: </span>11 Sep 2019, 11:30 </small>.
xpath
//s
浏览 1
提问于2019-09-20
得票数 0
回答已采纳
1
回答
试图使用
Xpath
从我
的
代码中使用
BeautifulSoup
进行web抓取
、
、
、
、
这是一个关于网络抓取
的
问题。我能够使用
BeautifulSoup
刮站点,但我想使用XPaths,因为Chrome
的
“复制
Xpath
”功能使它变得非常容易。我
的
理解是
Xpath
更容易,因为要使用
BeautifulSoup
,我们需要手工生成
的
HTML。 例如,下面是我得到
的
标题,但必须手动生成“查找”部分。如果是
Xpath
的话,我
的
理解是我可以从Chrome 'Inspect‘窗口中“复制<e
浏览 2
提问于2016-01-04
得票数 1
1
回答
将元素从
BeautifulSoup
发送到Selenium
、
、
为了分析元素和数据,我使用了
BeautifulSoup
,因为它们提供了很好
的
选项,包括使用正则
表达式
进行搜索。有没有从
BeautifulSoup
元素到硒元素
的
直接方法?
浏览 4
提问于2015-09-28
得票数 3
21
回答
Kotlin三元条件运算符
、
在
Kotlin
中
,
这个
表达式
的
等价物
是什么
?这不是Kotlin
中
的
有效代码。
浏览 2060
提问于2013-05-02
得票数 658
回答已采纳
4
回答
从标签之间提取文本
的
有效方法
、
、
假设我有这样
的
东西: <ul> <li>
浏览 0
提问于2013-06-19
得票数 7
回答已采纳
10
回答
我们可以
在
BeautifulSoup
中使用
XPath
吗?
、
、
、
、
我正在使用
BeautifulSoup
抓取一个网址,我使用了以下代码来查找其类为'empformbody'
的
td标记import urllib2req =urllib2.Request
浏览 2
提问于2012-07-13
得票数 135
回答已采纳
2
回答
有没有一种方法可以
在
JavaScript
中
从链接
的
xpath
中
获取链接
的
目的地?
、
、
、
、
我希望能够告诉我
的
Python程序调用Selenium
在
特定链接
的
目标上执行字符串操作,但是我不能确定目标( href='‘字段)
在
“编译时”(或者,好吧,不管Python
的
等价物
是什么
)将
是什么
。现在,我确定了该链接
的
xpath
将
是什么
;"//table@id='search-results'/tbody/tr2
浏览 0
提问于2011-05-13
得票数 0
回答已采纳
1
回答
抓取抽搐目录
中
剪辑
的
所有链接
、
、
、
我想从像这样
的
to目录
中
获得所有视频剪辑
的
链接。 但是失败了,尽管
xpath
表达式
是正确
的
浏览 1
提问于2019-02-05
得票数 0
回答已采纳
2
回答
使用带有Selenium
的
母版页测试ASP.NET站点
、
、
在
处理使用母版页呈现在ASP.NET页上
的
控件
的
更改“名称”和"Id“属性时,避免Selenium测试中断
的
好方法
是什么
?当ASP.NET使用不同
的
DOM标识符来呈现网页
的
控件时,我希望避免更改测试。
浏览 2
提问于2009-09-24
得票数 3
回答已采纳
3
回答
如何使用
xpath
只选择特定
的
标记和文本?
、
例如,html块:我需要选择所有标记"a“,其余
的
必须是纯文本,就像我们
在
浏览器中看到
的
那样//a|text()')
浏览 4
提问于2011-04-12
得票数 0
回答已采纳
3
回答
Python:解析web内容
中
包含特定字符
的
行,并将其存储到文件
中
、
、
我是python
的
新手。我有一个包含以下内容
的
网页:<Value type="ABC">107544</Value><Value type="ABC">77544</Value> 我想解析包含ABC
的
行,并只将数字存储
在
一个临时文本文件
中
。
浏览 2
提问于2013-03-22
得票数 0
回答已采纳
3
回答
从字符串中提取变量,正则
表达式
?
、
、
、
、
我
的
困惑是:作为一个PHP,我试图使用正则
表达式
从字符串中提取一些数据,但是我找不到正确
的
语法。字符串
的
内容被抓取为一个网站
的
几个图像
的
html,我希望最后
的
输出是3个独立
的
变量:"$Number1“、"$Number2”和"$Status“。height="35" src="/images/numbers/point0.jpg" style="
浏览 3
提问于2011-11-20
得票数 1
2
回答
如何提取url
的
正文,丢弃所有不相关
的
数据。
、
、
、
import urllib import urlparse urlvisited.append(newurl) soup =
BeautifulSoup
f.close() print "error" urls
浏览 0
提问于2015-02-19
得票数 0
3
回答
正在处理HTML文件Python
、
、
如何从页面
中
只删除文本?例如,如果html页面显示为:我只想提取
这个
。 return p.sub(' ',data) 但它还是没有做我想做
的
事?
浏览 0
提问于2012-01-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫真的很简单,爬取一个网页可以用四种方法实现
BeatifulSoup,Xpath,CSS 选择器的性能比较
记一次爬虫的心路历程
网页源码解析模块介绍及实战
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券