5分钟

课程背景

实验预计耗时:30分钟

1. 课程背景

1.1 课程目的

本课程的主要目的是帮助学员掌握熟悉云服务器CVM和Jupyter Notebook,能够借助云服务器CVM完成Jupyter服务的搭建,并能使用Jupyter Notebook制作简单统计图表。

完成此实验后,学员能够独立完成云服务器实例的创建,同时可以独立制作折线图、柱状图、饼状图、散点图这些常见的统计图表:

1-1 实验效果展示

1.2 课前知识准备

1.相关概念

【统计图表相关概念】

  • 折线图:折线图是一种以折线的上升或下降来表示统计数量的增减变化的统计图。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势。
  • 柱状图:柱形图,又称长条图、柱状统计图,通过使用水平或垂直方向柱子的高度来显示不同类别的数值(其中,水平方向的柱状图又被称为条形图),常用来比较两个或以上对象的价值。适合中小规模,单一变量的数据比较。
  • 饼状图:饼状图常用于统计学模型,用来显示一个数据系列中各项的大小与各项总和的比例。饼状图中各分块的数值不能有负值,所有分块数据总和为100%。为了保证绘图效果,饼状图中各分块的数值都不应该接近零,同时分块的数目不应过多(如果包含多种数据类别,可以把数据量较小或不重要的数据合并成一个“其他”模块)。
  • 散点图:散点图是指在回归分析中,数据点在直角坐标系平面上的分布图。散点图在直角坐标系显示数据的两个变量(X和Y轴)之间的关系,数据显示为点的集合,适合用于在不考虑时间的情况下比较大量的数据点。散点图通常用来识别两个变量之间的相关性或用来观察他们的关系,从而发现某种趋势。

【Linux相关概念】

  • 云服务器:云服务器CVM(Cloud Virtual Machine)是腾讯云提供的可扩展的计算服务。使用CVM避免了使用传统服务器时需要预估资源用量及前期投入的问题,帮助用户在短时间内快速启动任意数量的云服务器并即时部署应用程序。 腾讯云CVM支持用户自定义一切资源:CPU、内存、硬盘、网络、安全等等,并可以在需求发生变化时轻松地调整它们。
  • Ubuntu:Ubuntu是一个以桌面应用为主的Linux操作系统,基于Debian发行版和Gnome桌面环境。Ubuntu Linux是开放源代码的自由软件,用户可以登录Ubuntu Linux的官方网址免费下载该软件的安装包。

【数据分析相关概念】

  • 数据分析:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
  • Jupyter Notebook:Jupyter Notebook(此前被称为 IPython Notebook)是一个交互式笔记本,支持运行40多种编程语言。 Jupyter Notebook的本质是一个Web应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和Markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等。
  • Anaconda:Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。Anaconda具有开源、安装过程简单、免费社区支持等优点。
  • NumPy:NumPy(Numerical Python)是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
  • Matplotlib:Matplotlib是一个Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。它可以与NumPy一起使用,提供了一种有效的MATLAB开源替代方案。 通过Matplotlib,开发者可以仅需要几行代码,便可以生成折线图、条形图、饼状图、散点图等常用统计图表。

2.相关原理

  • 远程启动Jupyter Notebook原理
1-2 远程启动Jupyter Notebook原理

本实验使用Ubuntu远程启动Jupyter服务,并通过本地浏览器访问,具体原理如下:

1.首先用户需要通过浏览器或SSH操作软件远程登录Ubuntu云服务器终端,完成实验环境的配置,包括Anaconda的安装、环境变量配置等操作。完成实验的准备工作后,就可以在Ubuntu上启动Jupyter服务;

2.接下来用户访问本地浏览器,通过Ubuntu实例的公网IP与指定端口请求Ubuntu服务器;

3.Ubuntu服务器接收到浏览器的请求,返回数据给浏览器进行页面渲染(如果是首次访问,需要先将正确的口令传递给Jupyter服务端);

4.此时浏览器与Jupyter服务已经建立了通信,接下来用户只需要访问和操作浏览器,即可完成对Jupyter Notebook的控制。

3.相关命令介绍

【Ubuntu相关命令】

  • 以超级管理员身份运行命令:sudo <命令>
  • 下载指定文件:wget <下载链接>
  • 运行脚本文件:bash <文件名>

【Vim相关命令】

  • 进入编辑模式,在当前字符前插入光标:i
  • 进入命令行模式:ESC
  • 保存并退出文件(命令行模式下)::wq
  • 查找文档内容:/<需要查找的内容>

【其他命令】

  • 启动Jupyter服务:
jupyter notebook <可选参数>