python与数据科学应用

数据科学简介与应用 数据科学主要以统计学、机器学习、数据可视化以及(某一)领域知识为理论基础,其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理(来自百度百科)。 01资料科学所要具备的能力 1、资料科学所要具备的能力 统计(Statistic)单变量分析、多变量分析、变异数分析数据处理(Data Munging)抓取数据、清理数据、转换数据数据可视化(Data Visualization)图表、商业智能系统 2、数据科学主要分为以下几个步骤 按职能来拆分可分为数据科学家和数据工程师,其中数据科学家主要负责前三步、而数据工程师则负责后两步。 02Python与数据科学1、python语言 Python是什么,请直接阅读链接(http://www.jianshu.com/p/9af39a293cdf) 第一部分。通过对比,可以突出python的简单易用 #使用JAVA输出Hello World class test{ public static void main(String args[]){ System.out.println("Hello World"); }}#使用python语言输出Hello World 仅需一行代码 print("Hello World") 2、python具备完整的数据分析套件 如果需要做统计科学计算,python中具备Numpy、Scipy、statsmodels.如果需要进行深度学习,又可以使用TensorFlow、MXNET,它们都有python的接口做结构化数据处理与分析,又可以用Pandas对大数据进行处理,可以使用PySpark机器学习, python上又有Scikit-learn 03安装Anaconda 看过我之前文章的同学都知道,我一直用的是python2.7 最早也使用过3.5,现在却要带大家安装Anaconda,原谅我当初学习python的时候太年轻,Python易学,但用好却不容易,其中比较头疼的就是包的管理和Python不同版本的问题,特别是当你使用Windows的时候。然后就出现了发行版的Python(比如Anaconda),发行版最直接的好处就是将 python和许多常用的package打包,方便我们使用。 接下来我带大家安装Anaconda(https://www.anaconda.com/download/). 也可以百度搜索Anaconda 根据自己的电脑系统选择 建议安装使用Python3,理由如下 python3和python2有很多语法的差异,具体参考解释 Python 2 和 Python 3 的版本之间差别(http://python.jobbole.com/87372/)Python语言作者Guido van Rossum邮件通知 (https://hg.python.org/peps/rev/76d43e52d978)Python 2.7支持时间延长 到2020年,到时候将不再进行维护 然后根据自己电脑进行32/64位的下载。 下载完毕安装就好,记得环境变量那一项要勾选 安装完毕后再窗口会看到带有Jupyter notebook 04使用Jupyter notebook JupyterNotebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。这也是我们为什么要使用它的原因。 安装好Anaconda,打开cmd,输入Jupyter notebook 点击New,新建一个文件 可以通过按钮或者快捷键运行代码 05Python 3语法 1、变量类型 和其他语言一样,python3有六个标准的数据类型:Number(数字)String(字符串)List(列表)Tuple(元组)Sets(集合)Dictionary(字典) 其中数字包括int、float、bool、complex(复数)。内置的 type() 函数可以用来查询变量所指的对象类型。 此外还可以用Python的自省 isinstance 来判断 >>>a = 0609 >>> isinstance(a, int) True >>> 2、列表 Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0, 第二个索引是1,依此类推。列表可以存放各种类型的数据 #设置一个listli = [304,12,999,46,405] #查看list的相关功能使用dir() dir(li) #查看list的长度>>>len(li) 5 #查看list内容 >>>print(li) [304,12,999,46,405] #通过下标取值 >>>li[0] 304 >>>li[-1] 405 >>>li[0:3] [304,12,999] #列表增加 >>>li.append(609) >>>print(li) [304,12,999,46,405,609] #列表扩展extend 接受一个参数,这个参数总是一个 list, 并且把这个 list 中的每个元素添加到原 list 中 >>>li.extend(['xlm','love']) >>>print(li) [304,12,999,46,405,'xlm','love'] #list排序 >>>li.sort >>>print(li) [12, 46, 304, 405, 999, 'xlm', 'love'] #将一个列表降序排列 >>>li = [304,12,999,46,405] >>>li.sort(reverse=True) >>>print(li) [999, 405, 304, 46, 12]

原文发布于微信公众号 - 人工智能LeadAI(atleadai)

原文发表时间:2017-10-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吴柯的运维笔记

当前最火的编程语言-Python简介

7月20日,IEEE发布2017年编程语言排行榜:Python高居首位。 ? Python , 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido ...

3367
来自专栏AI科技大本营的专栏

一文总结学习Python的14张思维导图

本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库,后续会发布相应专题的文章)。 首先,按顺序依次展示了以下内容的一系列思维导图:基础知识,...

31910
来自专栏Pythonista

Python之路,Day1 - Python基础1

python的创始人为吉多·范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解...

912
来自专栏木子昭的博客

Python3好用的原生api

对列表进行反序是一个很常见的操作, 但python反向切片的玩法实在是非常简洁, 让人无法拒绝, 其实对某一数据结构进行"反向"是一个很有意...

601
来自专栏Crossin的编程教室

【Python 第30课】 字符串的索引和切片

前两天承蒙MacTalk池建强老师的推荐,让我们的学习队伍进一步壮大了。很多同学用的是Mac系统,而我是Linux党,很多Mac上的问题我没法帮忙解决。建议关注...

3307
来自专栏听雨堂

LegacyText的复制的Bug

        如果要动态复制一个LegacyText的文字,保持原来的中心位置,角度等,但修改其大小,发现有个别文字会偏离真正的中心位置,结果一番跟踪,发现问...

1767
来自专栏信安之路

用150行python代码来做代码审计笔记

通过审计源代码,也就是查看源代码,来发现其中存在的隐患,代码审计需要对被审计的语言有充分的了解,不仅是能读懂源代码,还要了解语言本身的缺陷。很多时候代码审计的突...

780
来自专栏深度学习那些事儿

浅谈Pytorch与Torch的关系

Pytorch发布已经有一段时间了,我们在使用中也发现了其独特的动态图设计,让我们可以高效地进行神经网络的构造、实现我们的想法。那么Pytorch是怎么来的,追...

1.9K7
来自专栏王大锤

iOS中的预编译指令的初步探究

3678
来自专栏星汉技术

Scala简介和安装

2676

扫码关注云+社区