腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
小怪聊职场
专栏作者
举报
115
文章
284786
阅读量
62
订阅数
订阅专栏
申请加入专栏
全部文章
爬虫
python
其他
java
数据库
云数据库 SQL Server
api
scrapy
分布式
sql
编程算法
hadoop
大数据
云数据库 Redis
tomcat
spring
微信
ios
json
ajax
android
git
nginx
存储
网络安全
数据结构
https
创业
管理
ruby
servlet
node.js
xml
memcached
mvc
maven
linux
apache
腾讯云测试服务
人工智能
网站
电商
企业
http
容器
开源
缓存
运维
shell
jvm
mybatis
spring boot
hashmap
zookeeper
seo
二叉树
jenkins
kernel
安全
数据处理
架构设计
sas
腾讯云开发者社区
bat
google
ip
mysql
ps
web开发
搜索文章
搜索
搜索
关闭
爬虫课程(四)|深度优先和广度优先算法
爬虫
编程算法
二叉树
深度优先和广度优先算法在爬取一个整站上经常用到,本课程主要讲解这两个算法的原理以及使用过程。 一、网站的树结构 1.1、一个网站的url结构图 以知乎为例,知乎目前有发现、话题、Live、书店、圆桌、专栏主要的6个tab页。每个网站的url都是有一定的层次,如下图:发现explore、话题topic、Live lives、书店pub、圆桌roundtable、专栏zhuanlan都是在主域名zhihu的下一级,而具体的Live在zhuhu.com/lives/770340328338104320,内容又在话
黄小怪
2018-05-21
2.1K
0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
点击查看
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
立即参加
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档