腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
跳过
抓取
时
无法
打开
的
链接
?
python
、
html
、
web-scraping
、
beautifulsoup
、
iteration
我正在尝试为this page上“资本主义”部分
的
每一篇文章写一个.txt文件。但它会在第7篇文章之后停止,因为到第8篇文章
的
链接
不会加载。那我怎么
跳过
它呢?
浏览 12
提问于2020-06-30
得票数 0
1
回答
禁用文件下载Selenium Firefox
selenium
、
selenium-firefoxdriver
我正在构建一个网页
抓取
应用程序,并使用Selenium和Firefox驱动程序
打开
我
的
页面。每当它
打开
一个指向下载
的
链接
时
,我
的
应用程序就会停止并永远挂在这个
链接
上。是否有可能检测到
链接
是下载
链接
并
跳过
它,或者可能在
链接
打开
时
跳过
它?
浏览 11
提问于2018-03-06
得票数 0
1
回答
如何
让scrapy使用url遍历归档文件?
python
、
python-3.x
、
scrapy
我正在尝试让一个
抓取
蜘蛛
抓取
归档中
的
几个页面,目的是
打开
每个单独
的
链接
并
抓取
链接
页面的内容。我遇到了一些随机
的
HTTP500错误,我试图通过简单
的
尝试
跳过
这些错误-除了
跳过
那些返回500个错误
的
页面。 解析函数
的
第一部分使用parse_art函数遍历归档页面中
的
href,以获取要
抓取
的
页面。我
浏览 18
提问于2019-07-08
得票数 1
回答已采纳
4
回答
在VS设计器中加载包
时
禁用SSIS包验证
sql-server
、
visual-studio
、
sql-server-2005
、
ssis
、
bids
我有几个部署到SQL 2005 Server
的
SSIS包,随后在Visual Studio2003中进行设计和维护。当我
打开
任何BIDS项目,然后
打开
其中一个包
时
,设计器总是验证每个数据流和任务对象。 通常,这不是问题。但是,在某些情况下,我们用于从AS400连接和导出数据
的
系统帐户将
无法
正确验证。因为我要导出大量
的
表,所以每个数据流对象都试图通过一个ODBC连接连接到AS400,它得到一个"Invalid Account“错误,然后继续尝试验证下一个任务。这
浏览 4
提问于2011-08-04
得票数 21
回答已采纳
2
回答
如何
使用下载
链接
在Python中下载文件
html
、
python-2.7
、
selenium-webdriver
、
download
基本上,我正在尝试写一个脚本,将
抓取
网页上
的
某些文件,并下载到特定
的
文件夹。以下是问题所在。我可以
抓取
文件
的
下载
链接
,并且可以
打开
浏览器并弹出
打开
/保存小部件。但是,我不能再点击或实际向下删
浏览 0
提问于2015-08-12
得票数 0
3
回答
如何
跳过
一些文件类型,同时
抓取
scrapy?
mime
、
scrapy
我想
跳过
一些文件类型
链接
.exe .zip .pdf,而
抓取
抓取
,但不想使用规则与特定
的
网址规则。多么?因此,当正文还没有下载
时
,很难决定是否只通过Content-Type来响应这个
链接
。
浏览 3
提问于2012-08-27
得票数 6
1
回答
Chrome扩展webscraper.io -
如何
在选择“下一步”
时
进行分页
google-chrome
、
pagination
、
web-scraping
我正在尝试使用google chrome扩展来
抓取
一个网站
的
表格。在该扩展
的
教程中,记录了
如何
抓取
具有不同页面的网站,例如,“页面1”、“页面2”和“页面3”,其中每个页面都直接
链接
到主页上。然而,在
的
示例中,只有一个" next“按钮来访问下一个站点。如果我按照教程中
的
步骤为"next“页面创建一个
链接
,它将只考虑页面1和2。为每个页面创建"next”
链接
是不可行
的
,
浏览 1
提问于2017-01-12
得票数 5
回答已采纳
1
回答
链表ADT
的
编译与
链接
visual-studio
、
visual-c++
、
linker
我在Microsoft Visual C++中
链接
我
的
实现文件
时
遇到问题,并收到以下错误:有人能帮帮忙吗?
浏览 0
提问于2009-01-22
得票数 1
2
回答
我需要
跳过
vba按钮中
的
空单元格,并在不为空
时
打开
excel
、
vba
我有一个按钮,每当我点击它
时
都会
打开
一个
链接
查询,但是有时查询中
的
某个字段是空
的
,我需要我
的
代码来继续操作并
跳过
空单元格,我该
如何
解决这个问题 我已经尝试了IsEmpty,但
无法
达到预期
的
结果。VBA
的
世界对我来说是相当新
的
,所以如果你发现任何愚蠢
的
错误或没有优化
的
方法,请通知我。下面的代码来自我尝试
跳过
空单元格之前
的<
浏览 12
提问于2019-02-07
得票数 0
回答已采纳
2
回答
simple-html-dom循环未结束
php
、
loops
、
hyperlink
、
simple-html-dom
我正在尝试所有的
链接
,然后转到下一页,直到页面的结尾。我只是不断地得到一个循环。我想我只是有点不知所措,希望今天能再一次得到一些帮助。
浏览 1
提问于2013-03-04
得票数 0
1
回答
R Web
抓取
:当网页不包含表
时
的
错误处理
r
、
web-scraping
、
try-catch
、
rvest
我在刮网
时
遇到了一些困难。具体来说,我正在
抓取
通常嵌入表
的
网页。但是,对于没有嵌入式表
的
实例,我似乎
无法
以不中断循环
的
方式处理错误。(testLinks$eventLink[i]) %>% html_table(fill=T)),} 第二个
链接
没有嵌入表我想用我
的
tryCatch
跳过
它,但是这个
链接
没有
跳过</e
浏览 1
提问于2018-07-28
得票数 1
回答已采纳
1
回答
NEXT/Image组件URL问题
reactjs
、
url
、
url-rewriting
、
next.js
、
nextjs-image
我正在使用NEXT/Image组件并面对这个问题:INVALID_IMAGE_OPTIMIZE_REQUEST:400: BAD_REQUEST代码 谷歌
无法</
浏览 8
提问于2022-03-08
得票数 2
1
回答
htaccess -
跳过
根级别的URL
.htaccess
、
directory
、
root
、
forward
我尝试了各种各样
的
方法,似乎想不出
如何
得到下面的结果。我希望我
的
url能够
抓取
到特定位置
的
所有内容,通过该文件进行
链接
,并
跳过
url
的
其余部分。然而,URL
的
其余部分对于我
的
包含文件是必要
的
,所以我希望它保留在url中。,这将
打开
"index.php“,而不做任何其他事情。,这将
打开
"stuff.php“
浏览 0
提问于2015-11-23
得票数 0
1
回答
Selenium python:
如何
避免访问被拒绝
python
、
selenium
、
scrapy
我试图在
抓取
一个网站时点击一个
链接
来阅读那里
的
数据。当我单击该
链接
时
,将
打开
“拒绝访问”页面。有没有可能
跳过
这个?
浏览 0
提问于2021-04-02
得票数 0
1
回答
php会话变量回显在标题中,而不是在og元中。时间问题?
php
、
session-variables
更新:在页面加载之后,我在源代码中看到了我在下面试图写出
的
所有数据。当我说它不起作用时,我指的是Facebook
的
分享者没有正确地拿起og标签。当我响应它们
时
,会话都会填充到我需要它们
的
位置。示例:问题是当我开始将它们写入og元数据
时
。我看到了它
的
来源,但Facebook认为它没有什么,当分享者被激活。现在,如果我定义了一
浏览 6
提问于2013-08-29
得票数 0
回答已采纳
1
回答
制作WebTorrent手柄磁铁链
bittorrent
、
transmission
我似乎忘记了
如何
使WebTorrent,或任何洪流应用程序自动
抓取
磁铁洪流
链接
,从网站,如thepiratebay.org?没有可下载
的
文件,所以我
无法
选择首选
的
应用程序,它正在
打开
我
的
Ubuntu
的
默认传输。 帮助?
浏览 0
提问于2016-12-14
得票数 7
回答已采纳
1
回答
如何
通过使用playwright导出blob文档来捕获下载事件
node.js
、
download
、
path
、
export
、
playwright
我
的
网站有一个编辑页面和导出按钮。当我点击导出按钮
时
,页面将收集所有信息,然后自动生成一个pdf文件,并通过Chrome Viewver在新选项卡中
打开
。生成
链接
是: blob:https://somecode 我试图关闭Chrome Viewer并强制它下载pdf文件。但是,我
无法
捕获下载事件。请指导我
如何
使用Nodejs
抓取
Playwright
的
下载文件路径。谢谢。
浏览 63
提问于2020-12-11
得票数 1
1
回答
如何
使用python
打开
web浏览器并返回重定向页面的url
python
、
facebook
、
python-2.7
、
oauth
我想使用facebook api,我将需要oauth令牌,所以当程序启动
时
,python程序将通过webbrowser.open()方法
打开
身份验证url,之后用户将给予权限,然后facebook将生成访问令牌并重定向到不同
的
链接
我需要
抓取
这个重定向
的
链接
并检索访问令牌。
如何
抓取
这个重定向
的
url。
浏览 7
提问于2013-10-31
得票数 2
1
回答
BeautifulSoup
抓取
多个
链接
python
、
web-scraping
、
beautifulsoup
我想使用BeautifulSoup
抓取
这个website,首先提取每个
链接
,然后一个接一个地
打开
它们。一旦他们被
打开
,我想刮公司
的
名称,它
的
股票代码,股票交易和提取多个PDF
链接
时
,他们是可用
的
。j in soup.find_all('a', href=True): except: pass 据我所知,这个网站并不禁止
抓取
但
浏览 18
提问于2021-04-11
得票数 0
回答已采纳
1
回答
阻止在python中从网站
抓取
数据
python
、
web-scraping
、
python-requests
、
web-crawler
、
data-science
我对网络
抓取
和构建爬虫是个新手,我开始在一个杂货网站上练习。我已经尝试从一个网站
抓取
数据很长一段时间了,不能超过三个页面,对于前三个页面,网站让我访问数据,但在那之后我没有得到任何响应,甚至在几秒钟内我也
无法
在浏览器上获得响应。我使用python
的
请求库来获取数据,并使用json进行解析。该网站需要post方法来访问所有的产品,所以我发送cookie,标题和参数,以及下一页使用相同
的
cookies等。我正在寻找一些一般
的
反应,如果任何人经历了同样
的
情况,并得到了一个变通
浏览 1
提问于2020-04-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
excel点击超链接时提示由于本机限制无法打开链接
蓝奏云的链接无法打开解决方法【手机端和电脑端】
手机连接fiddler后,浏览器无法打开网页或者fiddler抓取不到手机应用相关数据的情况
资源库里面的链接全被封了无法打开,明天重新弄,弄好之前大家想要保存文件的,可以把链接复制到浏览器里面打开,非常抱歉
如何让Edge浏览器启动时打开指定的网页
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券