腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据云团
专栏成员
举报
320
文章
249265
阅读量
44
订阅数
订阅专栏
申请加入专栏
全部文章(320)
django(157)
python(102)
编程算法(72)
http(49)
数据库(40)
sql(40)
php(38)
网站(22)
html(19)
api(18)
文件存储(18)
面向对象编程(16)
json(13)
小程序(12)
网络安全(11)
微信(10)
缓存(9)
访问管理(8)
xml(7)
存储(7)
云数据库 SQL Server(6)
爬虫(6)
云数据库 Redis(5)
linux(5)
正则表达式(5)
tcp/ip(5)
java(4)
ajax(3)
android(3)
搜索引擎(3)
短信(3)
腾讯云测试服务(3)
企业(3)
queue(3)
bash(2)
css(2)
listview(2)
打包(2)
ide(2)
日志服务(2)
渲染(2)
xslt & xpath(2)
gui(2)
npm(2)
socket编程(2)
https(2)
form(2)
io(2)
join(2)
lock(2)
model(2)
models(2)
pool(2)
send(2)
socket(2)
threadpool(2)
title(2)
url(2)
view(2)
遍历(2)
服务端(2)
继承(2)
客户端(2)
排序(2)
协程(2)
其他(1)
c++(1)
javascript(1)
bootstrap(1)
node.js(1)
单片机(1)
memcached(1)
web.py(1)
ubuntu(1)
bash 指令(1)
apt-get(1)
命令行工具(1)
对等连接(1)
数据加密服务(1)
容器(1)
开源(1)
数据迁移(1)
shell(1)
单元测试(1)
markdown(1)
uml(1)
安全(1)
数据分析(1)
windows(1)
数据结构(1)
processing(1)
项目管理(1)
aggregate(1)
break(1)
client(1)
connect(1)
count(1)
cpu(1)
exists(1)
exit(1)
field(1)
filter(1)
func(1)
gevent(1)
global(1)
goto(1)
height(1)
href(1)
iterable(1)
list(1)
lxml(1)
range(1)
release(1)
return(1)
roles(1)
self(1)
server(1)
set(1)
task(1)
width(1)
编程语言(1)
博客(1)
登录(1)
对象(1)
分页(1)
服务器(1)
工作(1)
连接(1)
面试(1)
事务(1)
数据(1)
线程池(1)
原理(1)
搜索文章
搜索
搜索
关闭
Python进阶-文本处理-XML数据
xml
编程算法
首先创建顶层对象,即 articles,接着将所有其它内容添加到该节点下。对于每一篇文章,都添加一个 article 子节点,如果上面的原字典没有提供封面图和标签,则使用提供的默认值。接着遍历所有键值对,将这些内容作为其它子节点添加到每个 article 中。
小团子
2019-07-18
517
0
Python-并发下载-协程实现-下
xml
在上一节中,当要爬取某个网页时,会输入“正在爬取”的提示信息,等网页的内容爬取下来后会休眠1s,这样做的目的是降低了请求的频率,以免 IP 被禁。
小团子
2019-07-18
468
0
Python-数据解析-职位信息-中
html
xml
在 Spider 类中,定义一个用于解析网页的方法 parse_page(),分别使用 re 模块、lxml 和 bs4 库进行实现。
小团子
2019-07-18
954
0
Python-数据解析-Beautiful Soup-上
html
xml
编程算法
bs4 是一个 HTML/XML 的解析器,其主要功能是解析和提取 HTML/XML 数据。
小团子
2019-07-18
711
0
Python-数据解析-lxml库-下
xml
xslt & xpath
ElementTree 类中附带了一个类似于 XPath 路径语言的 ElementPath 类。
小团子
2019-07-18
647
0
Python-数据解析-lxml库-上
编程算法
html
xml
lxml 使用 Python 语言编写的库,主要用于解析和提取 HTML 或者 XML 格式的数据。
小团子
2019-07-18
975
0
Python-数据解析-正则表达式
正则表达式
html
xml
json
xslt & xpath
在上几篇中,可以将整个网页的内容全部爬取下来。不过,这些数据的信息量非常庞大,而且大部分数据并不是所需要的。这就需要对爬取的数据进行过滤筛选,去掉没用的数据,留下有价值的数据。
小团子
2019-07-18
995
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档