腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(74)
视频
沙龙
1
回答
从
亚马逊
或
FlipKart
网站
获得
产品类别
,
链接
,
价格
,
产品描述
,
特定
的
卖家
。
就像
网络
爬虫
\
蜘蛛
机器人
、
、
、
、
想要
获得
所有类别的列表,产品,
价格
,描述只有一个
特定
的
卖家
从
亚马逊
。任何编码语言。提前谢谢。
浏览 22
提问于2019-09-23
得票数 0
6
回答
爬虫
vs刮板
、
、
有人能在范围和功能方面区分
爬虫
和刮板吗?
浏览 0
提问于2010-07-09
得票数 71
回答已采纳
5
回答
最好
的
方式来存储数据
的
Greasemonkey
的
爬虫
?
、
、
、
、
我想用Greasemonkey抓取一个站点,想知道是否有比GM_setValue更好
的
临时存储值
的
方法。 我想做
的
是在社交
网络
中抓取我
的
联系人,并从他们
的
个人资料页面中提取Twitter URL。我目前
的
计划是在自己
的
标签页中打开每个配置文件,这样它看起来更像一个普通
的
浏览者(即css、scrits和图像将由浏览器加载)。然后用GM_setValue存储Twitter URL。抓取所有配置文件页面后,使用存储
的
值创建
浏览 0
提问于2009-01-28
得票数 8
回答已采纳
1
回答
抓取我在解析时抓取
的
URL
、
、
在我
的
爬虫
中,我从一个excel文件中
获得
了startURL。 从这个页面上,我得到了每个变体与每个产品代码与变体相关联,但在这个网址我不能刮
价格
和图片,因为这些数据只出现在我选择一个
特定
的
鞋码和颜色。在我尝试抓取
价格
时,我所做
的
是格式化一个
亚马逊</
浏览 2
提问于2019-01-29
得票数 0
6
回答
网络
抓取和
网络
抓取有什么不同?
、
、
爬行和
网络
抓取有区别吗? 如果有不同之处,为了收集一些
网络
数据来提供一个数据库,以便在定制
的
搜索引擎中使用,最好
的
方法是什么?
浏览 2
提问于2010-12-02
得票数 96
回答已采纳
9
回答
BeautifulSoup和Scrapy crawler有什么区别?
、
、
、
我想做一个
网站
,显示
亚马逊
和易趣产品
价格
的
比较。其中哪一个会工作得更好?为什么?我对BeautifulSoup比较熟悉,但对Scrapy crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
4
回答
有没有常见
的
电子邮件客户端预取
链接
而不是图像?
、
虽然我知道很多电子邮件客户端会预取
或
缓存图像。我不知道有任何像<a href="somelinkhere">some link</a>这样
的
预取常规
链接
这是一些电子邮件做
的
一种做法吗?如果是,有没有一种可以添加到
链接
中
的
rel属性
的
无跟随类型来帮助防止这种情况?
浏览 2
提问于2015-12-18
得票数 11
3
回答
刮擦-如何停止元刷新重定向?
、
、
、
、
是我正在爬行
的
网站
。一开始我没有问题,但后来我遇到了这个错误。httpReferrer=%2Fproperty-for-rent%2F1> from <GET https://www.propertyguru.com.my/property-for-rent/1>
网站
知道我是一个
机器人
,并将我重定向到一个带有captcha代码
的
页面。我认为handle_httpstatus_list
或
dont_redirect不能工作,因为重定
浏览 0
提问于2019-07-03
得票数 3
7
回答
收集、维护和确保大型数据集
的
准确性
的
最佳做法是什么?
、
、
我提出这个问题,就如何设计一个系统寻求实际
的
建议。忽略来自第三方
卖家
的
数据和用户生成
的
内容,所有的“东西”必须来自某处,并由某人维护。它也是难以置信
的
详细和准确。多么?他们是怎么做到<e
浏览 2
提问于2010-12-22
得票数 8
回答已采纳
1
回答
防止我搜索
的
产品在其他设备上以Facebook广告
的
形式出现
、
我最近注意到,我在谷歌上搜索
的
一些东西,在我
的
移动设备上开始作为广告出现在我
的
合作伙伴
的
Facebook上。我没有Facebook帐户,我使用禁用跟踪功能
的
火狐,我们总是使用不同
的
设备,但我们在同一个WiFi
网络
上。我假设类似的IP地址是问题所在,但这是我第一次注意到它发生在使用
浏览 0
提问于2020-03-27
得票数 1
回答已采纳
4
回答
如何阻止不良
的
不明
机器人
爬行我
的
网站
?
、
我怎样才能抵抗那些坏
的
不明
机器人
来爬行我
的
网站
呢?一些不好
的
机器人
,他们
的
名字没有出现在阿帕奇
的
cPanel中,正在严重访问我
的
网站
带宽。我不知道这些
机器人
的
IP地址,所以无法通过IP地址阻止它们。这些
机器人
消耗了太多
的
带宽
的
网站
,因此,我需要增加它从服务器。
浏览 1
提问于2012-03-30
得票数 6
4
回答
当一个用户代理中有另一个用户代理时,这意味着什么?
、
、
、
、
下面是我看到
的
一些示例:前几个示例中
的
某个地方包含了“User:”标记,并且我已经更改了它
的
字体,以便更容易地看到它。我理解“user:”标记通常是一个标头,下面是一个典型
的
“user:”字符串序列是发送到服务器等
的
实际用户代理,但通常“user:”字符串不应该是实际用户代理
的
一部分,这更像是预置
或
标记,表明接下来
的
是实际
的
用户代理因此,第一个用户代理关闭括号)“在第二个用户代理开始之前从未发生过,它总是在结束时出现,因此,第二个用户
浏览 0
提问于2012-09-27
得票数 5
2
回答
做今天
的
网页使用web语义
今天
的
网页使用web语义吗?web语义都是关于SEO
的
吗?
浏览 0
提问于2011-02-04
得票数 2
回答已采纳
14
回答
避免
从
网站
数据库中“抓取数据”
的
顶级技术
、
、
我正在设置一个使用PHP和MySQL
的
网站
,它本质上只是一个现有数据库
的
web前端。可以理解
的
是,我
的
客户非常希望阻止任何人复制数据库中
的
数据,但同时又希望所有内容都公开可用,甚至想要一个"view all“
链接
来显示数据库中
的
每条记录。即使我删除了"view all“
链接
,理论上,仍然有人可以使用自动化过程逐条查看每条记录,并将这些记录编译到一个新
的
数据库中,实质上是截取所有信息。有没有人有任何
浏览 2
提问于2010-01-15
得票数 25
回答已采纳
10
回答
使用Python进行Web抓取
、
、
我想从
网站
上获取每天
的
日出/日落时间。有没有可能用Python抓取web内容?使用了哪些模块?有没有可用
的
教程?
浏览 2
提问于2010-01-18
得票数 186
回答已采纳
5
回答
(
机器人
友好)
、
、
、
、
我想知道是否可以更改url显示,并据此更改页面的内容,并使url和页面的内容变得友好(这意味着
机器人
实际上可以索引它们)。我已经尝试过使用AJAX动态加载数据,并使用angularjs路由,但是
机器人
无法对它们进行索引。另外,漂亮
的
urls和查询字符串不是我要找
的
,我正在寻找一种理论,可以在登陆时呈现数据,并在不刷新页面的情况下改变
链接
的
路径和内容,而且我不想写两次代码(一次在服务器端,一次在前端)。这些都是我已经尝试过
的
事情,任何帮助
或
指导解决方案都
浏览 12
提问于2016-05-29
得票数 5
回答已采纳
3
回答
如何从一个随机
的
网站
上刮掉所有的产品?
、
、
、
我试图
从
获得
所有的产品,但不知何故,我不认为我选择了最好
的
方法,因为其中一些是失踪
的
,我不知道为什么。这不是我第一次遇到这样
的
麻烦。我现在
的
做法是这样
的
:
浏览 4
提问于2017-12-28
得票数 12
回答已采纳
7
回答
是什么使浏览器扩展很难赚钱?
、
、
随着移动应用程序
的
货币化变得如此流行,我感到惊讶
的
是,扩展开发人员仍然主要依靠捐赠作为他们软件
的
主要补偿形式。当然,这不是一个问题,但我想知道为什么浏览器扩展和插件通常不受货币化
的
限制,而为Visual和Photoshop等软件设计
的
插件通常只能通过购买才能
获得
。
浏览 0
提问于2011-05-26
得票数 14
回答已采纳
14
回答
完全用Flash构建
的
网站
还能在搜索引擎中对SEO友好且可见吗?
、
、
我
的
网站
将基本上是销售服务;我
的
搜索引擎优化排名仍然会受到影响,如果我在一个空白
的
html页面嵌入Flash
网站
?我在那个关键点,在那里我准备上传
网站
,但我只是重新考虑与Flash做生意
的
便利性。
浏览 0
提问于2009-11-02
得票数 1
回答已采纳
10
回答
阻止
机器人
表单提交
、
、
、
、
我正在尝试找出一种好方法来防止
机器人
提交我
的
表单,同时保持过程简单。我读过一些很棒
的
想法,但我考虑过在提交表单时添加一个确认选项。这会阻止
机器人
吗?或者
机器人
会不会太容易弄明白这一点?下面是演示我
的
想法
的
代码和JSFIddle: if(Confirm()) { alert('Form submitted')
浏览 7
提问于2013-03-10
得票数 31
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫的分类
30+最好的比价网站和APP助你做好产品定价和对手分析
亚马逊新推增值税计算服务,加入可提升占有黄金购物车机会!
3分钟读懂亚马逊VAT计算服务
网站地图对SEO优化有什么好处?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券