腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
保存
网站
,在浏览器中打开保存的.htm文件,编辑其css/html,查看实时更改
、
、
、
我正在学习网页设计,我想在chrome和firefox开发工具中做你能做的事情,但是让它保存在我的系统中,并保持更改,并在我选择的编辑器中编辑。有什么能让我做到的吗?
浏览 0
提问于2014-07-31
得票数 2
2
回答
HTTP错误999:请求被拒绝
、
、
、
、
我正在尝试使用BeautifulSoup从LinkedIn中
抓取
一些网页,但一直收到错误“HTTPerror999:请求被拒绝”。有没有办法避免这个错误。
浏览 6
提问于2015-05-17
得票数 9
回答已采纳
2
回答
使用
Linux
wget标签
抓取
网站
、
有一个
网站
- www.elections.am/votersreg,我想知道如何使用
linux
wget标签获取这个
网站
的全部信息?谢谢
浏览 1
提问于2012-10-04
得票数 0
1
回答
在Python中连接到Google Firestore时出现SSL错误
、
、
当连接到Firestore数据库时,有不同的功能导致错误。 这是一个示例: def experiments():try: uid = decoded_token['uid'] us
浏览 45
提问于2021-03-31
得票数 0
2
回答
CURL不返回整个html源代码
、
我想
抓取
远程站点的html代码,为此我使用CURL,这是我的代码 curl_close($ch); 这几乎对每个
网站
都有很好的效果但是有1个
网站
,
抓取</
浏览 5
提问于2013-03-28
得票数 0
回答已采纳
1
回答
从node.js派生多个phantomjs worker是理想的吗?
、
、
我们使用phantomjs来截取各种网页的屏幕截图,url是由node.js服务器中的客户端发送的,这反过来又会产生phantomjs来截取屏幕截图并发送base64图像。理想的做法是创建多个phantomjs worker来完成这项工作吗?如果有5个客户端请求,则会有5个衍生进程。我已经将数量限制为5,而不考虑客户端请求的数量。但是,5个衍生进程是否也会将其推送到服务器上?
浏览 1
提问于2015-11-30
得票数 1
1
回答
我可以在没有监视器的情况下使用Watir从
linux
服务器上的
网站
抓取
数据吗?
、
、
我可以使用Watir从没有监视器的
linux
服务器上的
网站
(使用AJAX)
抓取
数据吗?(linode.com)?
浏览 3
提问于2010-10-05
得票数 5
回答已采纳
3
回答
获取完整站点克隆
、
、
、
、
有没有办法
抓取
一个
网站
,让它下载每个单独的文件,并使其成为相对的?我有一个有很多绝对url的
网站
,当我使用wget时,它只下载index.html页面,不会得到绝对url的文件,也不会把它们变成相对链接。这个是可能的吗? 谢谢。
浏览 1
提问于2011-04-09
得票数 0
4
回答
使用Scrapy进行Python数据
抓取
、
、
、
我想从一个
网站
上有TextFields,按钮等
抓取
数据。我的要求是填写文本字段并提交表单以获得结果,然后从结果页面中
抓取
数据点。(编辑) 我的要求是从ComboBoxes中选择值并单击search按钮,然后从结果页面中
抓取
数据点。附注:我正在使用selenium Firefox驱动程序从其他
网站
抓取
数据,但这个解决方案并不好,因为selenium Firefox驱动程序依赖于Firefox的EXE,即在运行刮板之前必须安
浏览 1
提问于2013-05-28
得票数 8
回答已采纳
1
回答
在
抓取
中使用随机用户代理与代理?
、
、
我最近在做网络
抓取
。我发现我们可以使用代理或随机的用户代理来远离防刮检测。因为当我理解这两者都用于隐藏原始客户端请求标识时,我感到很困惑。
浏览 5
提问于2016-08-11
得票数 4
1
回答
处理javascript生成的动态HTML的Ruby on Rails库的最佳web
抓取
、
、
、
、
我正在使用Ruby on Rails和机械化库来
抓取
商店
网站
。问题是很多时候我不能
抓取
某些元素。然而,当我在
网站
上“查看源代码”时,我可以看到这一点。我也在亚马逊EC2上使用
linux
机器。安装用于UI
抓取
的浏览器将会很困难。有没有什么Rails gem/plugin可以帮助我? 谢谢大家!!
浏览 0
提问于2011-12-13
得票数 2
回答已采纳
1
回答
Requests模块405客户端错误,as urllib3工作正常
、
、
无法使用requests模块获取数据。 import requestsresp.status_code 下面的代码运行良好。 import urllib3r = http.request('GET', 'https://www.embassy-worldwide.com/') r.status 要使requests.get命令正常工作,是否需要在该命令中设置一些参数?
浏览 7
提问于2020-07-17
得票数 0
回答已采纳
1
回答
用卷曲命令在
网站
上数单词
、
、
我在
网站
上数单词很有趣,我需要数一数一个单词在https
网站
的主页上出现了多少次,并且我使用了几个curl和grep命令,但是结果并不准确: curl -静默的 \ grep -c -c hello curl
浏览 5
提问于2022-04-23
得票数 -2
1
回答
网络
抓取
是安全的吗?
我正在为Alexa世界排名第一的
网站
进行网络
抓取
和数据挖掘。我不认为使用一个像样的
抓取
/ web请求库来进行网络
抓取
是安全上的问题,这也是第一次对这么大的URL列表进行web
抓取
,我很惊讶我通过这个程序受到了攻击。对这样一个随机的大
浏览 0
提问于2020-12-26
得票数 0
3
回答
从
网站
抓取
文件到自动同步数据
、
、
、
、
我想
抓取
一个文件(excel文件)每周,因为在excel文件中的数据不断变化,例如,excel文件出租车计程车信息。它会在
网站
上不断的变化,从我
抓取
的地方。我正在用C#构建一个应用程序,并将其发布到商店,该商店可以
抓取
该文件并保存它。从该excel文件中,我计划创建一个api,例如getCabNames()、getCabNum()等。因为它将是一个应用程序已经在商店,我的代码必须足够有效的
抓取
文件从
网站
,并使它自动同步。在我的本地计算机上的
linux
系统上,我可以有一个
浏览 0
提问于2014-05-03
得票数 1
回答已采纳
1
回答
无法在MacOSXLion10.7.5上执行二进制文件
、
、
、
、
命令: PhyloCon-v3.
linux
谁能告诉我怎么解决这个问题吗?
浏览 0
提问于2013-02-21
得票数 0
1
回答
如何使用AJAX测试我在Google上的爬虫能力?
、
我创建了我的
网站
,所以映射到使用PHP,所以我的
网站
将显然是谷歌爬虫。我已经用Google Fetch测试过了,它似乎可以工作。然而,我尝试过测试我的
网站
的所有其他非谷歌蜘蛛都不能使用使用_escaped_fragment_的谷歌技术。我想要确保当谷歌蜘蛛访问site.com时,它会看到x,
浏览 0
提问于2011-07-30
得票数 1
回答已采纳
3
回答
抓取
-
抓取
和
抓取
网站
、
、
作为学习使用Scrapy的一部分,我曾尝试爬取亚马逊,但在
抓取
数据时出现了一个问题。
浏览 4
提问于2013-02-25
得票数 2
回答已采纳
2
回答
Selenium:从Python中的<script type>标记获取可变数据
、
、
所以我试着用selenium从一个
网站
上
抓取
数据,因为selenium和web
抓取
仍然是新的,我被卡住了。我想刮一下<script type>标签下的一些数据,标签如下所示:...import webdriver driver = webdriver.Chrome('/home/slothfulwave612/chromedriver_
linux
64www.example.com') ## not the ac
浏览 0
提问于2020-08-19
得票数 4
回答已采纳
2
回答
Python requests.get仅在我未指定页码时响应
、
、
我正在用python
抓取
web数据,使用的是请求和漂亮的汤。我发现我
抓取
的
网站
中有2个只有在我没有指定页码的情况下才会响应。编辑:我在隐姓埋名中手动打开了这个
网站
。似乎当打开页码时,我得到一个“访问被拒绝”的响应,但是如果我刷新页面,它允许我进入吗?
浏览 3
提问于2021-06-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券