Python 数据挖掘入门与实践:第一章

打开音乐,边听边看

书中案列使用的是python 3.4版本, 笔者使用的是python 3.6版本;

随书资源:

https://pan.baidu.com/s/1JQXmARCZWxGBrBiWOjyjdg;密码:ir69;

笔者使用的python开发工具为: sublime text 3, 下载地址:https://www.sublimetext.com/3;

安装sublime text 3完毕后,首先要安装package control 组件,安装方式如下:

首先在菜单栏(图1)找出packagecontrol选项,然后点击,软件会自动安装package control 组件,然后在菜单选项preference下拉栏中选取package control选项,(或者按下Ctrl+Shift+P调出下图) 得到图2;

图 1

图 2

点击Installpackage, 等待数秒后, 得到图3;

图 3

在输入栏中输入需要添加的插件名称即可, 并可在软件界面左下端(status bar, 图4)观察插件安装状态;

图 4

1.1数据挖掘旨在让计算机根据已有数据做出决策; 数据挖掘主要设计算法、统计学、工程学、最优化理论和计算机相关的知识;数据挖掘的第一步一般是创建数据集,数据集是指能够描述真实世界的某一方面的数据集合; 数据集主要包括以下两个部分: 1, 表示真实世界中的物体的样本, 在这里,样本是在真实世界中真实存在的, 如一本书、一个动物等; 2, 描述数据集中样本的特征,特征可以是书的宽度、动物的重量等;

1.2打开命令提示符之后输入python3命令后如果出现如下所示,可试着输入python命令:

使用命令提示符安装python第三方库时,如果使用pip3无法安装,可尝试使用pip命令。

1.3亲和性分析是根据样本个体之间的相似度, 来确定它们关系的亲疏;

代码:(下列代码的缩进是正确的)

1.4 代码:

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180306G1EZQB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券