腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
VBA
Web
抓取
-
抓取
"
hrefs
“
列表
vba
、
web-scraping
、
getelementsbyclassname
我想
抓取
一个可点击的链接中包含的名字
列表
。然而,我没有得到一个结果。在第二步中,我想为每个标题创建一个新的标签。 如果有人能给我一个提示,我的代码中有什么错误,以及我如何优化它,那就太好了。
浏览 27
提问于2021-08-12
得票数 0
1
回答
保存在变量中的擦除文本只返回最后一个文本。
python
、
selenium
、
web-scraping
、
xpath
、
environment-variables
我使用selenium从新闻网站的第一页
抓取
有关给定关键字的所有文章。守则如下:driver.get(homepage) for art in element: pr
浏览 5
提问于2022-01-17
得票数 0
回答已采纳
1
回答
php dom xpath从站点中的所有文件夹中提取所有链接
php
、
dom
、
curl
也许它叫别的什么..我有下面的代码,它将
抓取
第一个文件夹中的所有内容,但不会从其他文件夹中
抓取
其他项目。例如,它会
抓取
第一个/前面的所有内容,但如果你有一个站点mysite.com/ folder2 /,它就不会
抓取
folder2。一切都是联系在一起的。它也会向后移动。DOMDocument(); $xpath = new DOMXPath($dom
浏览 0
提问于2013-02-19
得票数 0
1
回答
简单的
Web
抓取
PHP Xpath DOM
php
、
dom
、
xpath
、
web-scraping
我正在尝试学习
web
抓取
,并使用此示例从页面中获取链接。有没有更好的方法来做到这一点,或者例如,获得h1的最简单方法是什么?DOMDocument();$xpath = new DOMXPath($dom); for ($i = 0; $i <
浏览 3
提问于2012-11-21
得票数 2
回答已采纳
1
回答
我需要将
抓取
的urls保存为URI格式的csv文件。文件不会写入csv
python
、
csv
、
web-scraping
、
beautifulsoup
我要创建一个程序来: 1.)从网站上
抓取
web
链接,2。)删除重复项,请按3。)确保所有
web
链接均为URI格式,并按4。)写入csv。问题似乎要么是我无法将我的集合转换回
列表
,并且集合是不可变的,要么是...I认为我在Jupyter中所做的事情导致它失去了与程序的连接,并且它无法识别我引用我
抓取
的链接的方式。请告诉我哪里搞砸了。(['#']): elif
hrefs
.
浏览 14
提问于2020-10-23
得票数 0
2
回答
BeautifulSoup是否支持自定义html标记?
python
、
beautifulsoup
、
download
、
youtube
、
html-parser
我正在尝试建立一个youtube- playlist -downloader,其中包括使用BeautifulSoup
抓取
播放
列表
的网页以获取视频的
hrefs
。在查看一个youtube播放
列表
网页后,我发现视频信息是ytd-playlist-video-renderer标签的孩子。脚本 html = urllib.request.urlopen(url).read()
hrefs
浏览 33
提问于2019-12-04
得票数 0
2
回答
Web
抓取
-
VBA
excel
、
vba
、
web-scraping
我试图刮从一个网站的数据,没有任何运气。我设法在Elements中导航,但还没有从上一个Elements中获得信息。下面是我的代码,任何帮助都将不胜感激。 Dim All_Matches, Match Set IE =
浏览 1
提问于2019-08-09
得票数 0
回答已采纳
1
回答
MS
web
刮刀返回"&“代替"&”
vba
、
ms-access
我正在使用Access
VBA
做一些网络
抓取
。Mon&day,它实际上返回Mon&day。我正在使用IE对象进行
web
抓取
。Set ie = CreateObject("InternetExplorer.Application")tdRow(subCounter).innerHTML 我知道是否有一种方法可以返回HTML,而不是让
VB
浏览 2
提问于2019-12-29
得票数 1
回答已采纳
1
回答
如何
抓取
用unicode伪装的href(例如\u003ca href=\)
python-3.x
、
web-scraping
、
beautifulsoup
我正在尝试
抓取
hrefs
中包含的相对路径,但它们除了主要的汤拉之外并没有出现在任何地方。如果我尝试拉取特定的href或链接,我希望
抓取
的内容不会显示出来,但我知道它们就在那里。u003ca href=\"/model/ford-1300\" \u003ca href=\"/model/ford-1400\" 有没有办法在页面上创建一个包含大约20个"u003ca href“的
列表
我正在查找引用中的部分(例如/model
浏览 33
提问于2021-04-20
得票数 0
4
回答
如何使用DOM和XPath从页面中
抓取
链接?
php
、
dom
、
xpath
、
curl
、
hyperlink
我有一个卷曲页面
抓取
与卷曲,并希望抓住所有的链接与一定的id。据我所知,最好的方法是使用dom和xpath。下面的代码
抓取
了大量的url,但删除了其中的许多,并
抓取
了不是url的文本。$curl_scraped_page是用卷曲
抓取
的页面。$dom = new DOMDocument();$xpath = new DOMXPath($dom); $
hrefs
=
浏览 0
提问于2011-03-25
得票数 2
2
回答
如何使用get_attribute将属性值作为字符串,而不是单个字母?
python
、
selenium
、
beautifulsoup
、
getattribute
我正在使用selenium (可能还包括BS4)为过去4/5年的比赛
抓取
比赛结果页面()的不同部分,这是我已经
抓取
了链接的部分。for link in links:
hrefs
.append(link.get_at
浏览 2
提问于2020-03-31
得票数 0
回答已采纳
3
回答
PHP
抓取
页面
php
、
dom
、
xpath
、
screen-scraping
我正在尝试
抓取
一个页面,其中包含我要查找的信息: <td align="right">label</td> <在我做类似这样的事情之前:这就是我
抓取
网址的方法,有没有办法<
浏览 3
提问于2009-09-03
得票数 1
回答已采纳
1
回答
如何获得不同页面的cURL响应?
python
、
curl
、
scrapy
我正在进行一个小的数据
抓取
项目,并希望从https://www.germanystartupjobs.com/网站获得所有的工作。这些作业作为POST请求加载。href上迭代, selector = scrapy.Selector(text=data['html'], type="html")
hrefs
= selector.xpath('//a/@href'
浏览 4
提问于2016-12-18
得票数 0
回答已采纳
2
回答
我正在尝试使用Python进行
web
抓取
,并提出了如下请求,并得到了响应。但不知道怎么处理
python
、
web-scraping
、
python-requests
我想从答复中提取链接。import requests 'authority': 'www.xxxxxx.net', 'accept': 'text/javascript, applica
浏览 1
提问于2021-10-27
得票数 0
1
回答
如何在提取特定亚马逊销售商的所有产品链接时处理分页符
python
、
html
、
amazon-web-services
、
xpath
我正在编写一个Python程序来提取锚标与
hrefs
匹配某个正则表达式模式从卖家页面。例如,我的第一个以字母'A‘开头的卖家URL如下: 但是来自第一个URL的产品
列表
分布在多个页面上。
浏览 1
提问于2017-09-13
得票数 1
2
回答
Excel
VBA
Web
抓取
vba
、
excel
、
web-scraping
我是Excel编程新手,我需要一些帮助来调试我的代码,以便从Amazon上
抓取
一些数据。
浏览 2
提问于2017-11-16
得票数 0
1
回答
对象的JavaScript迭代
列表
javascript
、
web-scraping
、
puppeteer
、
skyscanner
我要做的是遍历所有清单的
列表
,并为每个清单提取URL。 ? EcoTicketWrapper_itineraryContainer'] > div[class^='FlightsTicket_container'] > a[class^='FlightsTicket_link']").href 现在,我正在尝试弄清楚如何遍历
列表
,并为循环中的每个
列表
应用选择器。
浏览 19
提问于2021-02-02
得票数 0
回答已采纳
1
回答
VBA
web
抓取
更新
html
、
vba
、
web
、
web-scraping
、
screen-scraping
我有以下代码:您能帮我更新代码以包含一个循环吗:HTML元素的价格是"649“Dim IE As SHDocVw.InternetExplorerDim doc_ele As MSHTML.IHTMLElement Dim doc_ele
浏览 2
提问于2019-11-24
得票数 1
回答已采纳
2
回答
为什么array_unique不给我返回一个唯一项的
列表
?
php
、
web-scraping
、
array-unique
我正在尝试
抓取
我客户网站主页上的所有urls,以便我可以将其迁移到wordpress。问题是我似乎不能得到一个去重复的urls
列表
。new DOMDocument();$xpath = new DOMXPath($dom); for ($i = 0; $i
浏览 0
提问于2012-06-23
得票数 0
回答已采纳
3
回答
将所有href更改为工作目录
php
、
html
、
regex
、
hyperlink
我必须
抓取
一个网站,并保存为HTML的所有页面,并把它完全放在DVD上。我已经这样做了,但是现在所有的链接都以一个/开头,它
抓取
了我的根目录。我想将所有文件(1500页)的所有
hrefs
更改为href="./",以便它始终
抓取
工作目录。
浏览 0
提问于2012-07-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
NET Core 实现简单爬虫—抓取博文列表
不用编程,几步做简单的数据抓取,web
手把手教你用Python进行Web抓取
为什么要选住宅ip代理抓取Web数据?
net core 实现简单爬虫—抓取博客园的博文列表
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券