keinYe

45 篇文章
14 人订阅

全部文章

keinYe

Python 编程必不可少的测试框架「unittest 篇」

unittest 是一个单元测试框架,单元测试完成对一个模块、一个类或一个函数的运行结果进行检验的测试工作。单元测试是对一个程序最基础的组成部分进行正确性验证,...

7510
keinYe

使用 uWSGI + Nginx 部署 Flask 应用

在这篇文章之前,所有的应用都是在命令行使用 Python 直接运行的,但是这种方式只适合在开发过程中使用,并不适合在生产环境中使用,在生产环境中可以使用 uWS...

6920
keinYe

使用RESTful 创建文件接收 API

文件「文本、文档、图片等等」是一个服务器不可缺少的部分,在 使用 Flask 创建 RESTful 服务 介绍了如何使用 Flask 创建一个支持 RESTfu...

5810
keinYe

Python 数据库迁移工具 Alembic

Alembic 是一款轻量型的数据库迁移工具,它与 SQLAlchemy 一起共同为 Python 提供数据库管理与迁移支持。

11710
keinYe

Python 命令行神器 Click

实际上 Python 标准库提供了一个默认的命令行工具 Argparse,但是对于 Click 来说 Argparse 使用起来非常的繁琐和麻烦,大多数人都很少...

10940
keinYe

使用 Flask 创建 RESTful 服务

依赖完成以后在 server 目录下再新建一个 server 目录作为项目的主目录,第一级 server 目录作为共用配置文件存储目录。

11040
keinYe

为 Flask 应用添加用户登录

Flask 是什么?我想打开这篇文章的你应该不陌生,但是我还引用维基百科上的内容做个简短的介绍。

22020
keinYe

外行学 Python 第十一篇 数据可视化

在 外行学 Python 爬虫 第九篇 读取数据库中的数据 中完成了使用 API 从数据库中读取所需要的数据,但是返回的是 JSON 格式,看到的是一串的字符串...

21130
keinYe

外行学 Python 爬虫 第十篇 爬虫框架Scrapy

前面几个章节利用 python 的基础库实现网络数据的获取、解构以及存储,同时也完成了简单的数据读取操作。在这个过程中使用了其他人完成的功能库来加快我们的爬虫实...

10030
keinYe

SQLAlchemy 数据表自关联

对于使用 SQLAlchemy 建立数据表之间的关系前面的文章 SQLAlchemy 定义关系 已经进行了介绍,今天主要看单个数据表之内的关联。

21840
keinYe

外行学 Python 爬虫 第九篇 读取数据库中的数据

前面的一至八篇我们一直在研究如何从网站上快速、方便的获取数据,并将获取到的数据存储在数据库中。但是将数据存储在数据中并不是我们的目的,获取和存储数据的目的是为了...

11120
keinYe

外行学 Python 爬虫 第六篇 动态翻页

前面几篇文章,初步完成了从网络请求、数据解析、数据存储的整个过程,完成了一个爬虫所需的全部功能。但是通过对数据库中数据的分析会发现数据库中的元件数量比网站上的元...

12040
keinYe

外行学 Python 爬虫 第五篇 数据存储

前面一至四篇我们学习了如何使用 python 来获取网页并将网页中的有效数据解析出来,当获取到有效数据以后,不可能将数据放在内存中,一旦系统出现问题辛辛苦苦获取...

8410
keinYe

外行学 Python 爬虫 第四篇 URL 去重

当你可以从网站上获取网页,也可以将网页中有效的信息提取出来以后,接下来你会做什么?我想它一定是一个肯定的答案『获取整个网站的内容』,毕竟只获取网站上一个网页的内...

11310
keinYe

外行学 Python 爬虫 第三篇 内容解析

从网络上获取网页内容以后,需要从这些网页中取出有用的信息,毕竟爬虫的职责就是获取有用的信息,而不仅仅是为了下来一个网页。获取网页中的信息,首先需要指导网页内容的...

9150
keinYe

外行学 Python 爬虫 第二篇 获取内容

一个无法获取内容的爬虫不是一个真正的爬虫,爬虫的首要目标是从网络上获取内容。目前我们所看到的网页都是通过超文本传输协议「英语:HyperText Transfe...

6430
keinYe

外行学 Python 爬虫 第一篇 介绍

为什么标题叫做“外行学 Python 爬虫”?是因为本人非 IT 互联网从业人员,唯一能说得上关系的是本人是一个 C 的开发人员,从事的是与嵌入式相关的工作,即...

8130
keinYe

Python 爬虫第三篇(循环爬取多个网页)

本篇是 python 爬虫的第三篇,在前面两篇 Python 爬虫第一篇(urllib+regex) 和 Python 爬虫第二篇(urllib+Beautif...

17020
keinYe

外行学 Python 爬虫 第七篇 开启多线程加快爬取速度

经过上一篇文章外行学 Python 爬虫 第六篇 动态翻页我们实现了网页的动态的分页,此时我们可以爬取立创商城所有的原件信息了,经过几十个小时的不懈努力,一共获...

15950
keinYe

Python 爬虫第二篇(urllib+BeautifulSoup)

在前面一篇「Python 爬虫第一篇(urllib+regex)」 我们使用正则表达式来实现了网页输入的提取,但是网页内容的提取使用正则是比较麻烦的,今天介绍一...

7220

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励