闲聊Python学习

不知不觉坚持更新了22期Python读书笔记,先聊聊为什么要坚持对Python的学习~

作为一个勤勤恳恳做Excel知识分享的人,为什么突然分享起了Python?

一、聊聊Excel的劣势

1、大数据处理能力不足

Excel可以处理几千行、几万行乃至几十万行,但是处理上百万行的数据总是那么力不从心,海量数据能打开已经很不错了,更不用谈如何进行处理分析了~

2、网页内容抓取能力不足

Excel另外一个弊端是网页抓取的力不从心,之前也用VBA实现过一些朋友的网页内容抓取需求,也许自己能力有限,没有充分发挥VBA的强大,对于反爬、密码验证等问题处理的一直不太好,很想利用Python来寻求更多的解决方案。

二、聊聊个人的学习方向

上面的劣势已经表明了小编的学习方向,数据处理与网页抓取。

上周四帮助一个朋友用pandas实现了按照某一列拆分为不同文件的需求。如果你对《阿凯的Excel》插件了解的话,知道我编写的插件是可以实现这个功能的。但是当这个插件面对的是上百万行数据的时候,我只能Say No了~

最初和那个朋友说要不用Python实现吧,对方是拒绝的,然后我用QQ远程桌面的形式给他展示了用Python处理的速度。怎么描述速度呢?就是当我执行代码的时候,没有等待时间文件直接生成了,然后对方就按照我分享的笔记去安装Python安装包了!

至于网页爬虫,无外乎自己的个人爱好,加上某人的需求咯~我也想将个人的方向向网站内容抓取-数据自动分析-支撑决策方向转变。所以第一个数据源必须自己解决,只能硬着头皮学咯~

三、聊聊公众号分享方向

1、先分享不想分享又不得不分享的基础知识,基础知识目前还差类、读写文件、测试代码三部分。测试代码会视情况看是否分享,但是类和读写文件不得不分享,大概要10期左右的文章吧。

2、当我分享完基础知识,就可以畅游在实战应用的分享上了,最先分享的肯定是距离实战最近的pandas的使用啦!一句话吧:“让你爽到够!!!”先分享数据分析,再分享网页爬虫,我猜我需要用500期!!哈哈!!!

四、个人思考

最后由于本人做授课的,最后想的问题肯定是如何将Python与Excel结合咯~

先放一个利好消息!

这个消息在Excel圈应该都知道了,我很乐见这个消息,一是可以告别无法系统学习的VBA,二是Excel的代码效率真的需要提高哇!但是我想等到微软真正内嵌怎么也要五六年吧!

在这之前我要苦苦思考,探索如何将Excel与Python结合教学了,希望可以自己先研究出一种方式,前路漫漫~

新的一年,自比蜗牛,认定的事情,无论走的多慢都不会停下脚步的!!

最后说一件事情,小编要闭关学习Python一周,感谢公司好福利!!!出关后注定更为强大!

停更一周,下周再见!

原文发布于微信公众号 - 阿凯的Excel(akexcel)

原文发表时间:2018-01-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏微信公众号:Java团长

JavaEE学习路线图

这是学习Java的基础,掌握程度的深浅甚至直接影响后面的整个学习进程。Java的核心主要包括几个部分:

721
来自专栏PingCAP的专栏

【详解】TiDB 2.0 GA is here !

去年十月份的时候,我们发布了 TiDB 1.0 版本,为此我们日夜兼程奋斗了两年半时间,我们认为 1.0 版本达到了可在生产环境中使用的程度。在接下来的六个月中...

4243
来自专栏Java编程

Java架构师学习路线

java架构师,首先要是一个高级java攻城狮,熟练使用各种框架,并知道它们实现的原理。jvm虚拟机原理、调优,懂得jvm能让你写出性能更好的代码;池技术,什么...

1.5K0
来自专栏开源优测

[性能测试]性能测试基础

概述 在软件测试行业中,性能测试是确保软件质量的一项关键措施。随着IT技术的发展,性能测试显得越发的重要,各企业的需要也越来越大,同样的对其技术...

2634
来自专栏架构师之路

一分钟了解两阶段提交协议/算法(分布式理论基础)

两阶段提交协议/算法(2PC) 概念 二阶段提交2PC(Two phase Commit)是指,在分布式系统里,为了保证所有节点在进行事务提交时保持一致性的一种...

3705
来自专栏企鹅号快讯

《design data-intensive application》阅读笔记之一

于2017年末得知了一本神书《design data-intensive application》,读完即可惜,如果早拿到这本书,就不会纠结于很多分布式系统和数...

1875
来自专栏java思维导图

为什么一定要前后端分离?

由于近期前端抽不出资源,博主最近接手一个前端项目的代码维护工作。拿到手一看,一脸懵逼,和博主当年所学的jsp开发方式、利用ajax来请求数据的单页面开发方式完全...

1254
来自专栏张善友的专栏

基于 Jenkins 快速搭建持续集成环境

什么是持续集成 随着软件开发复杂度的不断提高,团队开发成员间如何更好地协同工作以确保软件开发的质量已经慢慢成为开发过程中不可回避的问题。尤其是近些年来,敏捷(...

1865
来自专栏java学习

为什么一定要前后端分离?

原文: http://www.cnblogs.com/rjzheng/p/9185502.html

791
来自专栏緣來來來

从零开始写Python爬虫

具体的步骤: 一:Beautiful Soup 爬虫 requests库的安装与使用

992

扫码关注云+社区