腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
java闲聊
专栏作者
举报
75
文章
84455
阅读量
25
订阅数
订阅专栏
申请加入专栏
全部文章
其他
spring
java
jdk
xml
api
tomcat
容器镜像服务
.net
html
云数据库 SQL Server
http
编程算法
windows
bash
jsp
vue.js
json
数据库
云数据库 Redis
sql
mvc
maven
mongodb
容器
分布式
网络安全
mybatis
uml
https
activiti
ps
官方文档
ios
javascript
go
servlet
bootstrap
react
oracle
access
eclipse
git
github
ubuntu
windows server
apache
bash 指令
云推荐引擎
人工智能
开源
缓存
爬虫
shell
jvm
ssh
面向对象编程
dns
spring boot
npm
udp
gradle
安全
小程序
微服务
bpmn
cat
diff
entity
excel
file
jpa
lombok
mkdir
png
touch
部署
入门
搜索文章
搜索
搜索
关闭
WebMagic初探,了解爬虫
爬虫
xml
在使用webMagic之前,先了解一下几个基本的知识 爬虫,可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。 Xpath Xpath的全称是 XML Path Language,XPath是一种称为路径表达式的语法,定位到XML或HTML中的任意一个或多个节点元素,获取元素的各项信息,在解析结构比较规整的XML或HTML文档的时候,用XPath路径表达式非常快速、方便。 对于概念看不懂也没关系,可以先看下面的代码然后再回过
tanoak
2018-06-06
688
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档