腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3334)
视频
沙龙
1
回答
在某个网站中搜索的java程序
、
我能从你在这个领域的经验中受益
吗
?
浏览 0
提问于2011-07-26
得票数 2
回答已采纳
2
回答
如何处理
python
爬虫
的urlopen错误?
、
、
当我编写
python
爬虫
时,我
经常
使用urlopen。有时它无法打开url (所以我得到一个错误),但当我重新尝试打开这个url时,它成功了。因此,我通过这样编写
爬虫
来处理这种情况:'''open the url and return its content'''contents = response.read().decode('utf8
浏览 3
提问于2016-05-03
得票数 0
3
回答
如何让HTMLParser在出现解析错误后继续解析?
、
、
、
我正在创建一个网络
爬虫
,我使用HTMLParser模块来解析超文本标记语言文档中的链接。如果解析器遇到错误的标记,它会引发解析错误并终止应用程序。由于
爬虫
遍历了整个web,所以这个错误
经常
会被抛出。在
python
.org错误部分,已经有人提出了这个问题。你可以看看这个。这样做的问题是,我真的不知道如何使用提供的“补丁”,我也不理解评论。
浏览 0
提问于2011-04-20
得票数 1
回答已采纳
2
回答
网络
爬虫
是如何影响网站统计的?
网络
爬虫
(包括搜索引擎和非搜索引擎)会以什么方式影响网站统计(例如,在进行AB测试不同页面的变化时)?解决这些问题的方法是什么?例如: 为了澄清,基于以下评论:我也感兴趣的情况下,我的网站是具体的目标(可能是非法
爬虫</e
浏览 3
提问于2010-04-12
得票数 1
回答已采纳
1
回答
什么是链接图数据库?
、
、
、
在查看一些开源web
爬虫
的文档时,比如Apache、Apache;我
经常
遇到“链接图数据库”这个术语。有人能总结一下
吗
?
浏览 2
提问于2013-05-10
得票数 2
2
回答
总是留在工作中--这是糟糕的项目管理的迹象
吗
?
、
我能做些什么来避免这种情况
吗
?我已经确保我不会在当天结束(或第二天结束)时开始一项任务,因为我不能在那段时间内完成。 这是一个糟糕的项目管理的迹象
吗
?另外,项目经理如何处理时区(它们确实很不方便)?
浏览 2
提问于2010-08-28
得票数 2
1
回答
Python
还是Jython用于基于Django的应用程序?
、
、
、
、
目前我们考虑使用应用程序应该扩展
加班
费、
Python
或Jython。有什么建议
吗
?
浏览 5
提问于2011-07-29
得票数 4
1
回答
在ubuntu的后台运行时,
爬虫
停止。
、
我使用具有无限循环的
python
制作了一个简单的
爬虫
,所以它不能停止。随机延迟17 ~ 30,这个
爬虫
爬行相同的一个页面,并找到'href‘链接,定期更新,并存储到Mysql。因为我使用了Linux命令这个
爬虫
是在Ubuntu服务器背景下运行的。我想它已经运行了大约4个小时。但
爬虫
突然停止了。第二天我再试一次。有什么问题
吗
?这是关于网页的块
吗
?或者nohup命令有限制时间?非常
浏览 1
提问于2014-05-20
得票数 0
回答已采纳
2
回答
angular2服务器端呈现:动态内容
、
、
、
我
经常
读到服务器端渲染作为Angular2的一个伟大的新特性,它将使webapp可以被Google、Bing等爬行。 但是,对于应用程序启动时动态加载的内容,这是如何工作的呢?
爬虫
会在索引页面之前等待那些挂起的请求
吗
?还是我必须指定我的Angular2应用程序的特定状态,它告诉服务器我的应用程序已经准备好发送到客户机(在本例中是
爬虫
)?
浏览 5
提问于2017-02-07
得票数 1
回答已采纳
1
回答
如果我为我的
python
脚本做了一个简单的gui,它会影响它的效率
吗
?
、
、
嗨,我想做一个网页
爬虫
,检查URL的数据,如果我做一个简单的Gui,使脚本更容易查找变量的数据,添加代码的gui会使我的网络
爬虫
效率降低
吗
? 我需要
爬虫
尽可能高效,能够尽可能快地处理数据。为这个
Python
脚本制作一个gui,会不会妨碍web
爬虫
的性能?
浏览 3
提问于2015-01-27
得票数 0
回答已采纳
1
回答
Web Crawler的常用输出格式
爬虫
的常见输出格式是什么?它会是XML,JSON
吗
?或者它会根据
爬虫
的不同而不同,例如:
Python
,Java?
浏览 0
提问于2012-08-20
得票数 0
回答已采纳
1
回答
我的网络被列入黑名单了吗
、
最近,我写了一个网络
爬虫
访问该网站,并为我做了一些事情。我
经常
使用
爬虫
,现在我在网站上得到了许可。我以为流量太大了,这个网站以后会恢复正常的行为,但事实并非如此。有什么原因我能解决
吗
?
浏览 0
提问于2023-01-16
得票数 0
5
回答
Python
中的多线程
爬虫
真的可以提高速度
吗
?
、
、
我想用
python
写一个小的网络
爬虫
。我开始研究将其编写为多线程脚本,一个线程下载池和一个池处理结果。由于有了GIL,它真的可以同时下载
吗
?GIL对网络
爬虫
有什么影响?基本上我想问的是,用
python
做一个多线程
爬虫
真的比单线程能给我带来更多的性能
吗
? 谢谢!
浏览 4
提问于2010-05-14
得票数 10
回答已采纳
1
回答
使用AWS胶水
爬虫
的智能采样
、
、
、
现在我想启用AWS Glue data Catalog和AWS Glue Crawlers,但是
爬虫
遍历所有数据的代价让我感到害怕。 模式不会
经常
更改,因此没有必要遍历S3上的所有文件。
爬虫
会默认浏览所有的文件
吗
?有没有可能配置一种更智能的采样策略,只查看部分文件而不是所有文件?
浏览 14
提问于2019-10-21
得票数 0
3
回答
将数据从PHP脚本传递到
Python
Web Crawler
、
、
、
、
我有一个
python
爬虫
,每隔几分钟就抓取几个网页。我现在正在尝试实现一个可以通过web访问的用户界面,并显示
爬虫
获得的数据。我将使用php/html作为接口。无论如何,用户界面需要某种类型的按钮来触发
爬虫
程序立即抓取特定的网站(而不是等待下一次抓取迭代)。 现在,有没有一种方法可以将数据从php脚本发送到正在运行的
python
脚本?然后我在考虑使用一个共享文件,php在其中写入数据,
python
从中读取数据。但是,我需要一些方法来让
python
脚本知道,新数
浏览 1
提问于2011-03-31
得票数 1
3
回答
网络
爬虫
与Django前端的接口
、
、
第二:对此数据运行通宵批处理
python
脚本(文本分类)。about 建议我可以只用Django本身编写
爬虫
,但我不确定该怎么做。基本上--对于用Django或现有的
python
爬虫
编写我可以适应的
爬虫
有什么建议
吗
?或者我是否应该在第二步中加入“变成Django友好的东
浏览 0
提问于2009-06-09
得票数 2
1
回答
使用多个EC2实例爬行
、
我用
python
编写了一个爬行过程,它运行在亚马逊上的一个ec2实例上。我已经编写了这个
爬虫
,这样它就可以用它的结果向一个单独的"hub“实例报告。集线器处理
爬虫
的结果,
爬虫
可以自由地继续爬行。我在这个爬行实例中想到的是,克隆
爬虫
的几个实例很容易,每个实例都要向中心报告以便处理。 有冗余,所以如果一个
爬虫
被挂断,其余的
爬虫
可以继续工
浏览 2
提问于2015-01-08
得票数 0
回答已采纳
1
回答
如何用基于
Python
的Crawler机器连接Django?
、
、
好日子,朋友们如果有人知道我可以参考的资源,你们能分享一下
吗
? 谢谢
浏览 2
提问于2019-10-11
得票数 0
回答已采纳
2
回答
Scrapy在启动后立即完成
如果我这样做几次,它将在一些尝试中起作用我有相同的
爬虫
为另一个网站,这没有问题。或者这是亚马逊的问题
吗
?
浏览 2
提问于2019-11-08
得票数 2
1
回答
如何从playstore中的应用程序获取权限信息?
、
、
我正在开发一个
python
爬虫
,从Play Store中的应用程序中检索一些信息。我的
爬虫
检索应用程序评级、开发人员等等,但不检索权限。这是因为谷歌使用的是假链接,而且没有html可以捕捉到。有人知道如何获取这些信息
吗
?欢迎任何帮助! 提前谢谢。
浏览 4
提问于2015-02-27
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网优为什么需要经常加班
爬虫是什么?为什么Python使用的更多?爬虫是python独占的吗?
Python爬虫入门3 爬虫必备Python知识
Python爬虫
python爬虫
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券