腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
代码
中有
防
刮
保护
的
页面
吗
?
、
、
helper (chrome扩展)时,它完美地显示了内容,但当它进行抓取时,它返回"None“或"empty":Web:https://cutt.ly/bjj3ohW the number --NN是它测试
的
表单/*[@id="da_price"]/text()),.get(''),.extract(),.get('').strip(),Css #da_price,#da_price::text,我也用过漂亮
的
汤和scr
浏览 14
提问于2021-01-08
得票数 1
回答已采纳
1
回答
服务器回答:禁止使用幻影对图像
的
响应错误
、
、
我正在使用幻影(2.0)尝试拍摄以下网站
的
截图:,但每一张图片都有以下错误:知道为什么和/或如何补救
吗
?
浏览 3
提问于2015-05-18
得票数 0
1
回答
如何隐藏我
的
IP在python中进行网络抓取?
、
、
、
我正在用python在一些
页面
上做web抓取,我已经被其中
的
一些阻止了。当我试图通过TOR浏览器检查它时,我已经看到我无法访问
页面
,所以我认为这些
页面
已经能够跟踪我所有的IP或我没有很好地配置TOR (我认为不是因为我用Chrome和TOR检查了我
的
IP地址和TOR是不同
的
),所以,有人知道为什么
吗
?此外,我正在尝试在我
的
python
代码
中执行一个函数或方法来自动更改mi IP。我所看到
的
是,最好
的
浏览 19
提问于2020-05-21
得票数 2
回答已采纳
1
回答
Selenium网页未正确加载
、
、
(我想我成功地点击了它,但是在webdriver打开
的
Chrome窗口中,当我向下滚动到按钮时,会说‘我们很抱歉,加载下一页搜索结果时出现了问题’。我刚开始使用网络
刮
擦器,我对此做了大量
的
研究,有几个类似的问题,但这些答案都没有帮助。我真的需要一些帮助。这是我
的
代码
:driver = webdriver.Chrome(executable_path=driver_path# print(5)
浏览 2
提问于2022-11-24
得票数 0
1
回答
如何使用C#从特定链接(动态)下载文件
通过使用以下
代码
web.DownloadFile("url", "filename");注意:给我你最好
的
建议来实现这一点。
浏览 1
提问于2021-09-25
得票数 2
1
回答
在未启用javascript
的
网页上使用机械化和美汤
、
、
、
、
我是网络抓取
的
新手,所以请容忍我
的
代码
:import urllib2import mechanize browser
浏览 0
提问于2015-08-18
得票数 0
2
回答
Python没有结果
、
、
、
我正在用Python制作一个基本
的
/Spider。我试图通过一个YouTube频道,并打印所有标题
的
视频,但它
的
从来没有返回任何东西。到目前为止,我
的
代码
如下:from bs4 import BeautifulSoup url = 'https://www.youtube.com/c/DanTDM/一个空
的
列表(这意味着它没有找到任何东西)。我要知道我做错了什么。
浏览 6
提问于2022-07-17
得票数 0
1
回答
只在登录
页面
上提供点击
保护
可以
吗
?
、
我有个关于点击
的
问题。访问应用程序登录
页面
(如https://example.com/login.html )。在此
页面
上没有点击
保护
(即X-Frame-Options头)。登录后,您将被重定向回站点https:/
浏览 0
提问于2019-09-11
得票数 2
1
回答
Nodejs无法使用request-promise请求url
、
、
、
我无法使用以下
代码
从OpenTable网站获取https。然而,当我尝试使用相同
的
代码
从其他网站获取数据时,例如Instagram,它可以工作。因为我刚开始学习使用node js
的
web scraping,你能告诉我可能是什么问题
吗
?
浏览 53
提问于2021-05-23
得票数 0
回答已采纳
1
回答
关于injectFile
的
基本问题
我有一些关于injectFile
的
基本问题: 什么时候重新注释使用injectFile(
代码
)而不是page.evaluate(
代码
,.)要让
代码
进入要刮掉
的
页面
?使用injectFile(
代码
)有哪些不同/优缺点,例如在性能、抗
刮
擦检测等方面?如何通过替换gotoFunction和实现page.on(“domcontentloaded”,.)来实现injectFile(
代码
)?活动,像我一样?或者有没有更好
的</e
浏览 4
提问于2019-11-07
得票数 0
2
回答
Javascript防止点击劫持
、
、
、
、
我
的
应用程序
中有
这个Javascript片段来防止点击: var style = document.createElement} else { }基本上,在默认情况下,它创建一个样式元素(CSS动态)来隐藏当前
页面
的主体因此,这样做,
浏览 5
提问于2011-11-17
得票数 0
回答已采纳
1
回答
Amazon
的
和服分页错误
、
、
我正在尝试使用和服
刮
亚马逊
的
结果页。例如,我在Amazon.co.uk搜索引擎上输入"Sony“,想要抓取结果以获得产品名称。我能够做到这一点为一个
页面
,但我想
刮
多页使用分页功能。我选择“下一页”作为分页
的
链接,但是我得到了一个E20错误。谢谢!浮点
浏览 1
提问于2015-11-30
得票数 0
1
回答
Python请求[Errno 111]在服务器上运行时拒绝连接,但在本地PC上拒绝
、
、
我有一个web刮刀脚本,它在我
的
(Windows) PC上运行良好,但我试图让它从一个(Linux) web服务器上运行。我有许多其他脚本在服务器上运行良好(连接到与此不同
的
网站),但是当我运行这个脚本时,我会得到一个[Errno 111] Connection refused错误。下面是这个脚本
的
一个最低版本来演示这个问题:import requestsfrom bs4 import BeautifulSoup,这里
的
问题可以归结为here服务器上<
浏览 3
提问于2019-03-31
得票数 8
1
回答
使用请求模块
的
WebScraping抛出一个错误-403-禁止
、
、
我试图使用python中
的
请求模块从获取数据r = requests.get(url , headers= header)在html
的
回复中-我看到那个网站要求完成captcha。 有什么可以跳
浏览 2
提问于2020-06-24
得票数 0
1
回答
在抓取中使用随机用户代理与代理?
、
、
我发现我们可以使用代理或随机
的
用户代理来远离
防
刮
检测。因为当我理解这两者都用于隐藏原始客户端请求标识时,我感到很困惑。 如果我理解错了,请告诉我
浏览 5
提问于2016-08-11
得票数 4
1
回答
使用python进行Web抓取时出错
、
、
我试图
刮
数据从espncricinfo网站,我是要求网页
的
每一场比赛,但有时会出现错误后,10场比赛,或20甚至2有时,但它没有得到完整
的
下面是我
的
代码
和我
的
错误帮助我解决。我使用request.get()方法从给定
的
链接中获取网页from bs4 import BeautifulSoupimport
浏览 9
提问于2020-07-09
得票数 3
1
回答
用Jsoup和Android截断网站
、
、
、
、
我正在使用Jsoup库从这个站点提取数据: protected Void doInBackground(Object[] params) { doc =相反,这个网页不显示为1MB,所以我首先使用我自己
的
值,但不总是工作。对于一个我不明白
的
问题,当我处于调试模式,并将变量doc视为Document时,该网页有时会下载所有内容,而其他
的
则不会。然后,我尝试将maxBodySize
的
值更改为,然后改为,,还有超时值,读取其他帖子和搜索互联网,但这并没有解决问题。
浏览 1
提问于2015-11-20
得票数 1
2
回答
有没有办法让牙买加黄页在我
的
网站上显示搜索结果?
、
、
我已经搜索了很长一段时间了,关于如何查看基于PHP表单
的
搜索结果
的
客户端网站,从牙买加黄页
的
数据。<form action="http://jamaicayp.com/Jamaica-Kingston/<?
浏览 5
提问于2015-06-28
得票数 0
回答已采纳
3
回答
利用BeautifulSoup进行网络抓取
、
我试着从黄页上抓取数据,网站是我试过这个但是,我没有得到任何结果。
浏览 2
提问于2017-05-14
得票数 0
回答已采纳
1
回答
Python没有为某些
页面
获取任何内容
、
、
、
、
我正试图从offerup.com和
刮
壳中获取一些信息,什么都没有。我将键入:它会出现在那里,但如果我只想得到整个网页
的
文本,就可以:回来
的
还有: ['Request unsuccessful.Incapsula incident ID: 623000250007296502-10946686267359632'
浏览 4
提问于2017-07-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
华为荣耀V10天生敢为,强势宣告“人工智能”崛起再创巅峰时刻
手机屏幕材质有哪些,各有什么优缺点?与防护技术
数据防泄漏手段大盘点
眼镜片镀膜工艺技术讲解
地推共享WiFi贴如何切换掉其他品牌的贴码?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券