腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
抓取
链接
的
类别
链接
,
直到
不
再有
类别
、
、
、
、
在这个网站https://mavin.io/category上有多个
类别
。然后,每个
类别
进一步具有更多
的
类别
,依此类推。当一个
类别
到达最后一个
类别
时,它会显示产品列表,如页面https://mavin.io/search?q=&cat=33695所示 我想遍历所有
类别
并获得产品列表
链接
(而不是产品
链接
),就像下面这样
的
https:/
浏览 24
提问于2021-09-21
得票数 0
回答已采纳
1
回答
Wordpress显示子
类别
标题及其
链接
、
显示
不
包含父
类别
的子
类别
我能够
抓取
循环中
的
帖子,其中包括缩略图、帖子标题、摘录等。但我很难做到我需要
浏览 0
提问于2016-10-18
得票数 0
3
回答
如何
抓取
动态表数据
、
、
、
、
我想从中
抓取
表数据请看一下,给我一个方法去做。我能够为每个
类别
建立
链接
,如、等,但我不知道如何使其进一步导航到每个
类别
的分页表。在建立了所有的
链接
之后,我需要使用这些
链接
来提取表数据。 编辑:我在使用请求,BeautifulSoup4,
浏览 3
提问于2020-05-11
得票数 0
回答已采纳
1
回答
在Permalink中持久化Wordpress自定义分类标签
、
、
在wordpress中,我需要在固定
链接
前加上一个自定义
的
分类标签,比如%writer%,然后维护标准
的
类别
结构。例如,用于其中小说/惊险小说是标准
的
层次结构。所以我不需要为每个编写者重新创建
类别
结构。我可以将这个标签持久化,在会话变量中
抓取
写入器(‘get_query_var’)是没有问题
的
;并修改url以适合使用它来持久化写入器标签。在
类别
之
浏览 1
提问于2012-11-07
得票数 2
1
回答
如何
抓取
只从特定
类别
抓取
链接
,并忽略产品页面上
的
链接
?
、
、
我想从一个
类别
中
抓取
产品,但我
不
希望蜘蛛沿着产品页面上找到
的
链接
(相关产品来自同一品牌,但类型不同-例如。我想要
的
产品是香水,作为相关产品,它有一支口红)。
类别
的url是site.com/category_name/,产品
的
url是site.com/brand_name/product-name-here/。我应该如何定义爬网规则?
浏览 1
提问于2015-01-16
得票数 1
2
回答
在Python中设计多进程爬行器
、
、
它应该开始
抓取
一个页面的
链接
,并从那里开始工作。具体地说,顶级页面包含
类别
列表、这些
类别
中
的
第二级页面事件以及事件中
的
最终第三级页面参与者。我不能预测会有多少
类别
,事件或参与者。我有点困惑于如何最好地设计这样一个爬虫,尤其是如何知道它何时完成爬行(它应该继续爬行,
直到
它发现并检索到所有相关
的
页面)。理想情况下,第一次
抓取
应该是同步
的
,其他一切都是异步
的
,以最大限度地并行解析并添加到
浏览 1
提问于2009-11-24
得票数 3
回答已采纳
2
回答
Prestashop -如何使用父
类别
id获取特定
的
子
类别
、
、
、
我是PrestaShop
的
新手。我试图使用父
类别
id获得一个子
类别
数组,这样我可以在不同
的
情况下引用不同
的
子
类别
。实际上,我想在foreach循环中放置一个if语句,并检查它是否是循环
的
第一次迭代,然后
抓取
第一个子
类别
的
链接
,如果是第二个迭代,则获取第二个子
类别
的
链接
等等。有人能帮我吗? 提前感谢!为我糟糕
的
英语感到抱歉。
浏览 4
提问于2016-01-11
得票数 1
回答已采纳
1
回答
Google搜索控制台: 404个没有
链接
到
的
错误
、
我管理一个电子商务网站,稍微刷新其产品/
类别
收集每晚。有时产品/
类别
会被禁用,
链接
会从网站上消失,但尽管如此,它们还是会被Google爬行,显示为404。谷歌是否有可能逐级
抓取
网站,当其深入到
链接
的
深度时,更新更高级别的页面,删除一些
链接
,然后为这些
链接
返回404(这些
链接
以前已经在更高
的
级别上
链接
)? 有可能消除这些错误吗?
浏览 0
提问于2016-09-14
得票数 0
回答已采纳
2
回答
爬虫开始爬行后改变规则
、
我
的
问题是关于CrawlSpider
的
我可以在运行时更改rules吗,比如def set_rules(cls,rules):cls.rules = rulesself.set_rules(rules)我
的
用例: 我正在使用scrapy
抓取
特定网站
的
某些
类别
A,B,C…Z。每个
浏览 0
提问于2015-08-13
得票数 0
1
回答
使用搜索引擎打开网页
、
、
我试图打开同一领域
的
多个网页。我需要这些
链接
,以刮一些数据(我有许可从网站)。我不能使用我实际上想要刮
的
域名,但举个例子:如果一个网站是,我只想刮掉以特定字符串结尾
的
网站上
的
所有页面:示例* 我希望有人能帮我
浏览 3
提问于2016-08-12
得票数 0
回答已采纳
1
回答
Netsuite如何将主页上
的
子选项卡
链接
到页面/
类别
?
、
、
、
我正在用Netsuite编辑以前设置
的
公司网站。如能提供有关如何将演示子选项卡
链接
到适当
类别
/页面的帮助,我将不胜感激。问题是:
类别
设置得很好,
直到
之前
的
设计师删除了一个
类别
。我已经重新创建了这个
类别
(名称与之前相同),但是presentation子选项卡(主页上
的
侧导航)没有
链接
到它。子选项卡当前显示该
类别
不再可用。我已经确保了
类别
的设置与所有其他功能
类别</e
浏览 0
提问于2013-03-22
得票数 0
1
回答
Blogroll导入/导出包含
类别
和描述
、
、
、
有没有一种简单
的
方法(也许是插件?)要导出并导入到不同
的
WordPress安装中,博客中
的
所有
链接
包括描述和
类别
?我知道你可以通过/wp-
链接
-opml.php导出
链接
,但是我相信这样做会使
链接
描述变得松散。导入时,我希望
链接
放在它们
的
类别
中--如果
类别
不存在,应该创建
链接
。如果可能的话,我更喜欢一种
不
侵入任何核心WordPress文件
浏览 0
提问于2011-07-07
得票数 0
回答已采纳
1
回答
如何从Upwork网站上刮取工作
类别
及其子
类别
?
、
朋友但我不可能把它刮得一干二净。我尝试了以下方法:我试着刮掉所有的
类别
,但是它还是给了我空白
的
输出。soup.find_All('h3',{"class":"
浏览 0
提问于2018-07-17
得票数 0
回答已采纳
1
回答
我
的
wordpress帖子重定向到我
的
主页
在我
的
本地机器上,我运行
的
是一个Wordpress网站。当我试图转到我
的
帖子时,它会重定向到我
的
主页。 我想让它显示相应
的
页面(帖子
的
页面)。在所有论坛上搜索过。一切都是徒劳
的
。
浏览 2
提问于2012-08-03
得票数 0
回答已采纳
1
回答
如何修复错误: Spider错误处理获取url
、
、
、
、
我正在
抓取
电子商务网站,并
抓取
了多个
类别
,但其中一些产生
的
结果,但一些
链接
得到错误:蜘蛛错误处理…请告诉我如何排序。
浏览 0
提问于2019-04-19
得票数 0
3
回答
$_GET和固定
链接
问题
、
、
我有一个像这样
的
永久
链接
/products-page/custom/test-product///do something但是上面的代码不是用work...is来
抓取<
浏览 2
提问于2013-01-18
得票数 0
2
回答
关于XML站点地图中基于分页
的
URL和
类别
URL
的
问题
、
、
、
、
我有一个具有以下URL结构
的
博客站点:http://website.com/category/page1/http://website.com/category/article_title访问网站>进入
类别</em
浏览 0
提问于2012-07-24
得票数 0
回答已采纳
1
回答
在if语句下索引
链接
?
、
、
、
索引Google会有任何
链接
在if语句下吗? <a"; if($user_category=="register2"){ $link="href='".$databaselink; echo $link;}"> BOOK</a>
抓取
可以看到并将被索引
的
链接
的
WIll? 请注意,此内容无需beein登录即可显示。是公开
浏览 0
提问于2013-01-06
得票数 0
1
回答
搜索在scrapy中具有指定属性
的
元素外部返回结果
的
Xpath
、
、
、
我正在使用scrapy shell
抓取
这个站点
的
子
类别
部分中
的
所有
链接
:。="subcategories-div"]属性
的
div元素,所以我从那里缩小范围,
直到
找到
链接
的
href。当我在Chrome中搜索这个Xpath时,这是有效
的
。它返回了我正在查找
的
链接
,但是出于某种原因,它还返回了来自//*[@id="doc"]
浏览 1
提问于2016-08-01
得票数 0
1
回答
Chrome扩展webscraper.io -如何在选择“下一步”时进行分页
、
、
我正在尝试使用google chrome扩展来
抓取
一个网站
的
表格。在该扩展
的
教程中,记录了如何
抓取
具有不同页面的网站,例如,“页面1”、“页面2”和“页面3”,其中每个页面都直接
链接
到主页上。然而,在
的
示例中,只有一个" next“按钮来访问下一个站点。如果我按照教程中
的
步骤为"next“页面创建一个
链接
,它将只考虑页面1和2。为每个页面创建"next”
链接
是不可行
的
,因为它们太多了。我
浏览 1
提问于2017-01-12
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
智慧城市建设的三大误区:不下雨的云,不流动的数据,不链接的网!
5 个方法实现 Python 编写另类应用
谷歌SEO优化:设计电子商务网站的网址结构
5个用Python编写非阻塞web爬虫的方法
SEO内链系统需怎样搭建?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券