如何搭建一个用于AI预测的Python环境

0

瞎扯

2017年人工智能的火把Python烧的热血沸腾,听说很多公司因为Python开发人员需求暴涨导致的薪资上升而不得不切换到其他语言上去。PS:好像需求爆涨和薪资上升都跟我没沾上半点关系,还是苦逼一个,:)

既然如此,我们这些与AI不相干的Pythoner也来蹭一蹭Python人工智能这团火,看看能不能从中取一点暖。所以就有了这套《Python 极简入门》的文章。

没敢称之为“教程”,是因为本来就是个半吊子,然后又讲一个半吊子的东西,纯属自娱自乐,入不了专业AI人士的法眼(专业人士可以绕过了)。

又因为是半吊子讲半吊子的东西,所以整套文章不会有公式和算法的详细讲解(专业人士可以再次绕过了),我们从不生产算法,我们只是机器学习库的搬运工。

不要介意做一个调库侠,工具的发明本来就是为了降低某些操作的难度,还不是专业人士,暂且不用自己创造改造算法,轮子太多,拣着合适的用就行。废话不多说,开始~

1

创建一个Virtual虚拟环境

为了不与本地的Python 环境有冲突,我们使用virtualenv模块创建一个新的Python虚拟环境:

virtualenv python_ai

如下图所示,安装完成:

接着启动python_ai这个虚拟环境:

Scripts\activate

2

安装所需的模块

进入python_ai这个虚拟环境之后,我们来安装所需要的模块,其中主要有:

  • numpy:用于科学计算的基本模块
  • scipy:科学计算工具箱
  • pandas:数据分析和处理模块
  • scikit-learn:机器学习经典算法的集成包
  • nltk:自然语言处理模块
  • jieba:中文分词模块
  • jupyter:一个交互式的笔记本,我们的代码的主战场

其他没有列出的模块,在后面的文章中有使用时会提及大家安装。大部分模块都可以使用pip命令直接安装完成,少部分使用pip命令直接安装不了的,可以通过https://www.lfd.uci.edu/~gohlke/pythonlibs/ 网站下载模块的whl文件,再通过pip命令安装这些whl文件。

pip install pandas

安装pandas模块会附带安装上pandas的依赖库,其中包括Numpy等:

pip install scikit-learn

使用pip命令也可直接安装scikit-learn:

pip install scipy

scipy模块也能通过pip直接安装完成:

pip install jupyter

jupyter的依赖库很多,但也能顺利通过pip命令安装完成:

接下来是jiaba和nltk模块,都能够顺利安装:

3

测试模块

模块安装好之后,我们来测试一下这些模块的安装是否正确。在命令行输入命令:

jupyter notebook

以启动jupyter笔记本:

在Home页面新建一个Python3的notebook:

在新的notebook中导入刚刚安装好的模块,并打印其版本号:

import numpy as np
import pandas as pd
import scipy
import sklearn
import nltk
import jiaba

print(np.__version__)
print(pd.__version__)
print(scipy.__version__)
print(sklearn.__version__)
print(nltk.__version__)
print(jieba.__version__)

结果成功显示,没有报错:

这样,我们用于Python AI预测的环境就搭建好了

下一节,我们将介绍机器学习的工作流程。

原文发布于微信公众号 - 州的先生(zmister2016)

原文发表时间:2018-03-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

3 条评论
登录 后参与评论

相关文章

来自专栏黑白安全

如何让你的服务屏蔽Shodan扫描

在互联网中,充斥着各种各样的网络设备,shodan等搜索引擎提供给了我们一个接口,让我们可以在输入一些过滤条件就可以检索出网络中相关的设备。

712
来自专栏IT大咖说

饿了么:Redis Cluster运维方案

内容来源:2017 年 8 月 12 日,饿了么高级Python工程师黄光星在“CRUG 2017北京活动”进行《Redis Cluster运维方案》演讲分享。...

1472
来自专栏北幕网站建设

emlog 5.3.1

emlog 是 "Every Memory Log" 的简称,意即:点滴记忆。它是一款基于PHP语言和MySQL数据库的开源、免费、功能强大的个人或多人联合撰写...

980
来自专栏大魏分享(微信公众号:david-share)

实战派 | 不讲理论讲实战,现场耍一耍openshift | 容器在企业中的应用

“如果将现在主流IT技术比作武林的各项武功,那么将Oenshift比喻成天龙八部的中六脉神剑,一点也不为过。” 前言 在2017年1月11日,红帽举办了Op...

2724
来自专栏JackeyGao的博客

Conoha主机测评

最近由于心知肚明原因, 原来的linode主机已不能使用。所以最近又开始了疯狂找主机的历程, 说起这个简直不能提起。 我本人也连续找了好多家, linode更换...

711
来自专栏前端小吉米

WebP2P 让你的直播免流

1375
来自专栏三丰SanFeng

负载均衡 - 综述

1 什么是负载均衡 网络的各个核心部件随着业务量的提高、访问量和数据流量的快速增长,其处理能力和计算强度也相应增大,使得单一设备根本无法承担。在此情况下,如果扔...

2198
来自专栏互联网研发闲思录

互联网研发中负载均衡算法一点探索

    负载均衡在线上服务中有着很重要作用,因为一台web服务比如tomcat,能够处理qps(每秒处理请求数) 是有限的。那么就需要有有前端负载均衡服务...

1916
来自专栏小白课代表

Autodesk Navisworks 2018 安装教程。

Autodesk Navisworks软件能够将AutoCAD和Revit®系列等应用创建的设计数据,与来自其它设计工具的几何图形和信息相结合,将其作为整体的三...

1021
来自专栏机器人网

牛人教你DIY!用树莓派 Zero做飞控图传

虽然可以买到商品成品,且会比我们做出来的东西更美观,性能指标更强,但是在折腾中学习,按照自己的需求进行优化改动,享受创造的喜悦,不正是创客精神嘛。 本项目使用手...

3908

扫码关注云+社区