腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
python
中
使用
xpath
在
h1
标签
中
获取
结尾
有
空格
的
文本
时
,
如何
消除
"\
t
“?
python
、
html
、
xpath
、
web-scraping
我正在尝试从网页上
获取
此
文本
"Aggreko (AGGK)“(检查图像)。当
使用
xpath
获取
它
时
,我得到了下面提到
的
输出。代码: companyName = root.
xpath
('//*[@id="leftColumn"]/div[1]/
h1
/text()') 输出: ['3I Group PLC (III)\
t<
浏览 68
提问于2020-11-21
得票数 0
1
回答
如何
消除
空格
?
scrapy
我想收集用谷歌搜索
的
日语文章。我尝试提取日语句子,然后运行以下代码以获得包含最多日语单词
的
标签
。texts = mostTag.
xpath
('<<path>>/text()').extract()for s in texts:但当我运行这段代码
时
,提取
的
句子
在
它们
的
头上有
空格
。A我试图通过'te
浏览 6
提问于2018-08-14
得票数 0
2
回答
:查找
h1
元素但返回空
文本
字符串
python
、
selenium
、
xpath
、
hidden
我正在尝试在这个
的
标题中
获取
文本
<
h1
class="product-title" title="iShares FTSE MIB UCITS ETF EUR (Dist)"> iShares FTSE MIB UCITS ETF EUR (Dist) </
h1
> 我正在
使用
这个<em
浏览 4
提问于2017-04-15
得票数 19
回答已采纳
1
回答
Firebug控制台中
的
XPath
,内容中有
空格
javascript
、
html
、
xpath
我正在尝试
使用
Firebug控制台中
的
XPath
来
获取
<span>元素
的
文本
内容。实际
的
<span>
标签
内容是'first name‘,中间
有
一个
空格
,如下所示: <span class="vl-cell e-listview-container-mail-Col5" iscell="1">first name</s
浏览 0
提问于2015-02-25
得票数 0
1
回答
如何
使用
XPath
提取两个对象之间
的
文本
?
python
、
xpath
、
web-scraping
、
console
我正在
使用
XPath
在网页上提取不同
的
网页元素,但是
在
一个位于两个对象之间
的
特定对象上有一个障碍,但它后面有一段时间没有关闭对象。<body> <tbody> <td id="left_c
浏览 0
提问于2017-06-10
得票数 0
2
回答
selenium webdriver找到元素
python
、
selenium-webdriver
我尝试
使用
selenium webdriver来定位一个元素:
python
:Traceback (most recent call last): File "<pyshell#22>", line 1,
浏览 15
提问于2017-02-24
得票数 1
回答已采纳
5
回答
在
使用
lxml.html解析HTML
时
等效于InnerHTML
python
、
parsing
、
lxml
我正在编写一个
使用
lxml.html解析网页
的
脚本。
在
我
的
时间里,我已经做了相当多
的
BeautifulSoup,但由于它
的
速度,我现在正在尝试
使用
lxml。我想知道在库中最明智
的
方式是做与Javascript
的
InnerHtml相当
的
事情--即检索或设置
标签
的
完整内容。<body> <
h1
>A title</
h1</
浏览 3
提问于2011-05-25
得票数 30
回答已采纳
2
回答
当按
文本
选择
时
,为什么normalize space( text ())忽略内部节点?
html
、
xpath
为什么在下面的示例
中
,我可以
使用
//label[text()[normalize-space() = 'some label']]或//label[normalize-space(text()) = 'some label']来选择按
文本
标注而忽略span
的
内容?
在
中
,没有关于此功能
的
信息。这正是我想要
的
,但我也非常想知道这个解决方案为什么有效:) 顺便说一句,哪种语法更好
浏览 4
提问于2014-11-09
得票数 5
回答已采纳
2
回答
java Selenium Chrome关键字搜索器
java
、
selenium
、
keyword
我几乎完成了创造最高机器人
的
任务。现在我需要一个关键词搜索器。他们应该在页面上搜索关键字,然后点击它。 我试过
的
代码: driver.findElement(By.
xpath
("//
h1
[text()='Illegal Business Hooded Sweatshirt
浏览 0
提问于2018-02-26
得票数 0
4
回答
Javascript替换将几个<br />添加到字符串
的
开头和
结尾
javascript
、
regex
我正在
使用
Javascript
在
标签
中
的
每个
文本
字母之间添加<br />。代码如下:它在字符串
的
开头和
结尾
添加了几个额外
的
<br />标记,因此不是将Asia编辑:没有前导
空格
或尾随
浏览 0
提问于2011-04-28
得票数 0
回答已采纳
3
回答
Python
元素树-从元素中提取
文本
,剥离
标签
python
、
xml-parsing
、
elementtree
使用
Python
语言中
的
ElementTree,
如何
从节点中提取所有
文本
,剥离该元素
中
的
所有标记并只保留
文本
?例如,假设我
有
以下内容: Some <a>example</a> text我想退还Some example text。我该怎么做呢?到目前为止,我所采取
的
方法已经产生了相当灾难性
的
结果。
浏览 0
提问于2013-10-15
得票数 9
回答已采纳
1
回答
如何
利用刮擦获得工作描述?
python
、
xpath
、
scrapy-spider
我对scrapy和
XPath
很陌生,但用
Python
编程已经
有
一段时间了。正如您所看到
的
,电子邮件和电话是
在
<p>
标签
中
作为
文本
提供
的
,因此很难提取。我
的
想法是首先在Job Overview
中
获取
文本
,或者至少在所有讨论各自任务
的
文本
中
使用
ReGex来
获取
email、phone n
浏览 5
提问于2016-12-16
得票数 1
回答已采纳
3
回答
如何
在<br>或<br />之间
获取
文本
的
xpath
?
ruby
、
xpath
</div><br><br/><br>假设有上述情况,那么
如何
使用
Xpath
获取
每个结果呢?必须
使用
某种类型
的
xpath
。我应该
使用
substring-after(following-sibling...)吗? 编辑:我正在
使用
Nokogiri解析器。
浏览 7
提问于2009-09-28
得票数 2
3
回答
在
XPath
中
获取
(
文本
)
html
、
dom
、
xpath
、
html-parsing
我
有
以下DOM结构/ HTML,我想得到(只是练习.)标记
的
数据。
在
h2元素下
的
。那个div@class="coordsAgence“元素,下面有一些div子元素,还有一些h2元素。这样做:将得到这个值,但是附加
的
不需要
的
文本
。UPDATE:我基本上想要
的
值是:"GALLIER“
文本
。
浏览 2
提问于2011-03-28
得票数 21
回答已采纳
2
回答
如何
在
python
中
通过
文本
获取
xpath
python
通过
xpath
获取
文本
对我们来说很容易,但是
有
什么方法可以通过text获得
xpath
呢?例如:
如何
利用
xpath
实现Hello World
浏览 2
提问于2017-04-27
得票数 0
回答已采纳
1
回答
Javascript反引号字符串插值法创建一个带有
空格
的
URL
javascript
、
django
、
ajax
当
使用
带反标记
的
字符串插值来创建发布到django端点
的
URL
时
,所创建
的
url会添加不必要
的
空格
和新行。
有
问题
的
js: (function (window, document, undefined){ const upvoteroute)) add(upvote, "upvote"
浏览 37
提问于2019-09-02
得票数 0
回答已采纳
3
回答
删除
Python
中
不必要
的
换行符
的
最有效方法
python
我想了解
如何
使用
Python
消除
不必要
的
文本
换行符,比如你从Project那里得到
的
东西,在那里,他们
的
纯
文本
文件每70个字符左右用换行符格式化。
在
Tcl
中
,我可以做一个简单
的
string map,如: set newtext [string map "{\r} {} {\n\n} {\n\n} {\n\
t
} {\n\
t
} {\n} {
浏览 0
提问于2016-03-26
得票数 10
回答已采纳
3
回答
从语料库
中
删除除html标记以外
的
所有内容
regex
、
r
、
text-mining
、
tm
我
使用
的
是tm包。我
有
一个充满html文档
的
语料库,我想删除除html标记之外
的
所有内容。我已经尝试了几天了,但是我似乎找不到任何好
的
解决方案。例如,假设我有这样一个文档:<body> </html><html> <body> <<e
浏览 7
提问于2012-03-26
得票数 1
回答已采纳
3
回答
去除scrapy响应
中
不需要
的
字符
python
、
xpath
、
scrapy
我正在用Scrapy 1.0.3编写一个爬行器,它将抓取Unicode页面的存档,生成页面的p标记
中
的
文本
,并将其转储到JSON文件
中
。我
的
代码如下所示: sel = Selector(response) list
浏览 1
提问于2015-08-24
得票数 1
2
回答
python
selenium -打印
XPath
值
python
、
selenium
下面是我
的
代码:它打印<selenium.webdriver.remote.webelement.WebElementobject at 0x02915310>,但我希望它打印实际值,即0.00
有
什么想法吗?
浏览 0
提问于2014-03-14
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
初识Web和元素定位方法
在Selenium中进行网页元素定位的诸种方法
就用Python批量下载!
关于爬虫,HTML知识需要了解一下!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券