Python那么火,到底能用来做什么?

如果您正在考虑学习Python,或者您最近刚开始学习,

您可能会问自己:“我到底可以用Python做什么?”

这是个棘手的问题,因为Python有很多用途。

image.png

但是随着时间的推移,

我发现Python主要可用于一下三个方面:

  • Web开发
  • 数据科学——包括机器学习、数据分析和数据可视化
  • 脚本编写

我们就依次来看看吧。

一、Web开发

像Django和Flask这样基于Python的Web框架最近在web开发中变得非常流行。

这些web框架帮助您用Python创建服务器端代码(后端代码)。

这些代码在您的服务器上而不是在用户设备以及浏览器上(前端代码)运行。

如果您不熟悉后端代码和前端代码之间的区别,请参阅下面脚注。

但是,等等,我为什么需要web框架呢?

那是因为web框架让构建通用后端逻辑变得更简单了。

这包括把不同的URL映射到Python代码块、处理数据库和生成用户在浏览器中看到的HTML文件。

我应该用哪个Python web框架?

Django和Flask是两种最流行的Python web框架。

如果您刚刚开始学习,那么可以用它们中的任何一个。

Django和Flask有什么区别?

主要的对比:

  • Flask提供简洁、灵活和细粒度控制。它很是客观(让您决定如何实现想要的东西)。
  • Django提供一种包罗万象的体验:您可以获得管理面板、数据库接口、ORM(object-relational mappling,对象关系映射),还有开箱即用的应用程序和项目的目录结构。

您应该选择:

  • Flask,如果您专注于体验和学习机会,或者您想对选用哪个组件有更大的控制权(例如您想使用哪个数据库和如何与它们交互)。
  • Django,如果你专注于最终的产品。特别是如果您正在做一个简单的应用程序(如一个新闻网站、电子商店,或者博客)并且希望有一个直接明了的做法。

换句话说,如果您是位初学者,Flask可能是个更好的选择,因为用到的组件比较少。

如果您想要更多的定制,那么Flask也是个更好的选择。


而且,根据我的数据工程师朋友的看法,

Flask更适合创建那些所谓的REST API的东西,因为它比Django更灵活。

另一方面,

如果您想构建一些简单的东西,

Django会让您更快地达到目标。

好,我们接着谈谈下一个!

二、数据科学 —— 包括机器学习、数据分析和数据可视化

首先,我们来回顾一下什么是机器学习。

我认为,解释什么是机器学习的最好方法莫过于举个例子。

假设您想开发一个程序用于自动检测图片中的内容。

因此,对于下面的这张图片(图片1),您希望您的程序能识别出这是条狗。

而对于下面的这张图片(图片2),您希望您的程序能识别出它是张桌子。

您也许会说,我可以用几行代码搞定。例如,如果在图片上有很多淡棕色的像素,那么我们可以说那是狗。

或者,您可以找到在照片中检测边缘的方法。然后,您也许会说,如果有很多直边,那么那就是一张桌子。

但是,这种方法很快就遇到麻烦了。如果图片上是条没有棕色毛发的白狗怎么办?如果图片上显示的只是桌子的圆形部分呢?

轮到机器学习大显身手了。

比如,您给机器学习的算法提供1000张狗的照片和1000张桌子的照片。那么,它将会学习区别狗和桌子。当您给出一张狗或桌子的新图片时,它将能够识别出是狗还是桌子。

我认为,这和婴儿学习新事物有点类似。婴儿是如何知道一样东西看起来像狗,而另一样东西看起来像桌子呢?可能就是从大量的例子中学到的。

您也许不会明确地告诉一个婴儿:“如果一样东西是毛茸茸的,并且有着淡棕色的毛发,那么它可能是条狗。”

您可能只是说:“那是条狗。这也是条狗。这是桌子。那也是桌子。”

机器学习算法的工作方式大致相同。

您可以把同样的想法应用于:

  • 推荐系统(像YouTube、Amazon和Netflix在用的)
  • 面部识别
  • 声音识别

您可能听说过的流行的机器学习算法包括:

  • 神经网络
  • 深度学习
  • 支持向量机
  • 随机森林

您可以使用任何一个上述算法来解决我刚才解释过的图片标注问题。

三、将Python用于机器学习

有一些流行的Python机器学习库和框架,其中最流行的两个是scikit-learn和TensorFlow。

  • scikit-learn附带了一些更流行的内置机器学习算法。我刚才提到了其中的几个。
  • TensorFlow更像是个低级库,它允许您构建自定义机器学习算法。

如果您刚开始一个机器学习项目,那么我建议您先用scikit-learn。如果您开始遇到效率问题,那么我建议用TensorFlow。

请注意,您需要微积分和线性代数的基本知识以理解这些课程中的某些内容。

四、那么数据分析和数据可视化呢?

为了帮助您理解,我在这里给您举个简单的例子。假设,您为一家在线销售产品的公司工作。

那么,作为数据分析师,您也许会画一个类似的条形图。

Python那么火,到底能用来做什么?我们来说说Python3的主要应用

条形图1-由Python生成

从这张图上,我们可以看到,在某个特定的周日,对于某件产品来说,男性购买了400多件,而女性购买了大约350件。

作为一个数据分析师,您也许会对其中的差异做出几个可能的解释。

一个很显然的可能解释是,该产品在男性中比在女性中更流行。另一个可能的解释是,样本量太小,这个差异是偶尔产生的。还有一个可能的解释是,在周日,由于某种原因,男性比女性更倾向于购买该产品。

为了搞明白哪个解释是正确的,您可能绘制另一张图,如下图所示:

折线图1-由Python生成

我们不再只显示周日的数据,而是整整一周的数据。正如您所见,从这张图中,我们可以看到,这种差异在不同的日子里很一致。

从这个简单的分析中,您可能得出了结论,对这种差异,一个最有说服力的解释就是,这个产品更受男性而不是女性欢迎。

另一方面,如果您看到是如下所示的图呢?

折线图2-同样由Python生成

那么,如何解释出现在周日的差异呢?

您也许会说,也许出于某种原因,男性在周日更倾向于购买该产品。或者,也许只是巧合,男性在周日购买了更多的该产品。

好了,这是个简化的例子,展示了数据分析在真实世界中看起来的样子。

我在谷歌和微软工作的时候做过数据分析,跟这个例子非常相似,只是更复杂一些罢了。事实上,我在谷歌工作时,是用Python来做这种分析,而我在微软的时候,用的是JavaScript。

在这两家公司工作的时候,我用SQL从数据库中提取数据。然后,我会用Python和Matplotlib(在谷歌工作时)或JavaScrip和D3.js(在微软工作时)进行数据可视化和分析。

五、用Python进行数据分析/可视化

最流行的数据可视化库之一是Matplotlib。

刚开始学习的话,它是个不错的库,因为:

  • 它容易上手
  • 其他一些库,如seaborn是以它为基础的。因此,学习Matplotlib可以帮助您随后学习其他库。

六、选Python 3还是Python 2?

我会推荐Python 3,因为它更现代化,并且目前它更受欢迎。

脚注:对于后端代码和前端代码的的说明(万一您对这些术语不熟悉)。

假设,您想做个类似于Instagram的东西。

那么,您需要为每种想支持的设备创建前端代码:

  • Swift用于iOS设备
  • Java用于安卓设备
  • JavaScript用于web浏览器

每组代码都将在对应类型的设备/浏览器上运行。这组代码将决定应用的布局看上去的样子,单击时按钮的外观等等。

但是,您仍然需要存储用户信息和照片的能力。除了在用户的设备商储存这些信息,您还会希望将这些信息储存在服务器上,这样,每个用户的关注者就能看到用户的照片。

这里就是后端代码/服务器端代码的用武之地了。您需要编写后端代码以执行以下操作:

  • 持续跟踪谁在关注谁
  • 压缩照片,以免占据太多存储空间
  • 在发现功能中给每个用户推荐照片和新账号

好了,这就是后端代码和前段代码之间的区别。

顺便说一下,Python不是编写后端/服务器端代码的唯一好选择。还有很多其他流行的选择,包括Node.js,它是基于JavaScript的。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

经验 | Pytorch还是Tensorflow?英伟达工程师帮你总结了

翻译 | AI科技大本营(rgznai100) 参与 | reason_W 本文作者Dominic Monn,是NVIDIA机器学习工程师。在本文中,作者讲述了...

43850
来自专栏CSDN技术头条

机器学习工具综述

工具是机器学习的重要组成部分,选择合适的工具与使用最好的算法同等重要。 在这篇文章中,你将会见识到各种机器学习工具。了解它们为什么重要,以及可供选择的工具类型。...

208100
来自专栏互联网技术栈

数据仓库模型说明

数据仓库的建设是一个过程,而不是一个项目。在这个过程中我们需要形成自己的规范,以方便管理和维护。在数据仓库的建设过程中,不仅会面临着公司业务迅速发展,业务系统迭...

38630
来自专栏Petrichor的专栏

如何画 软件工程 流程图

个人推荐一款常用的免费在线绘图工具:ProcessOn 。之前也看过比较过其他的 流程图绘图工具 ,要么是功能不够强大,要么就是伸手向咱学生党要钱,或者只给个短...

26630
来自专栏PPV课数据科学社区

用户行为数据可视化——行为序列图

引子: 作为一名网站的用户研究工作人员,我曾经碰到过以下问题: 深知服务器日志是一座金矿,但不知道该从哪里开始分析? 辛辛苦苦盯着电脑一天,看了1000+条...

64580
来自专栏专知

【EMNLP2018干货】254 页《为NLP研究写出好代码》教程

【导读】现代的NLP研究工作都是需要编写代码。 良好的代码可以实现快速的原型设计,简单的代码调试,实验的可控性和可视化,帮助研究人员快速准确地了解

13140
来自专栏机器之心

教程 | BerryNet:如何在树莓派上实现深度学习智能网关

选自Github 机器之心编译 参与:蒋思源 该项目在树莓派 3 上使用深度学习使其成为一个智能网关。该设备并不需要联网,所有的训练和调试等都在树莓派 3 本...

439110
来自专栏专知

【书籍】深度学习框架:PyTorch入门与实践(附代码)

【导读】2016年是属于TensorFlow的一年,凭借谷歌的大力推广,TensorFlow占据了各大媒体的头条。2017年年初,PyTorch的横空出世吸引了...

1.3K60
来自专栏吉浦迅科技

推荐5种让数据库快的飞起的GPU加速产品

GPU承诺会彻底改变大数据分析领域,从当前来看,这并不是虚言,当我们数据量达到一定级别的时候,我们一定会转向使用GPU。大多数的数学密集型应用都包含机器学习框架...

51290
来自专栏CDA数据分析师

这4件事带你走出深陷的数据分析迷宫

通过真实世界中的实例,我们将共同通过种种错误的数据分析方式总结出正确的技巧与诀窍。 相信每位朋友都遇到过这样的情况:将来自各类渠道的数据收集起来,通过A/B测试...

21760

扫码关注云+社区

领取腾讯云代金券