无论你是想快速入手Python,还是想成为数据分析大神或者机器学习大佬,亦或者对Python代码进行优化,本文的python库都能为你提供一些帮助。
Python生态系统的一些核心基础数据分析库:
NumPy:支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,包含:
SciPy:这也是一个功能强大的科学计算库,用于执行科学,数学和工程运算。包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
Pandas:
Scikit-learn:代表“机器学习的科学工具包”。它是一个机器学习库,提供了各种有监督和无监督的算法,例如回归,分类,降维,聚类分析和异常检测。
Matplotlib:这是一个核心的数据可视化库,并且是Python中所有其他可视化库的基础库。它提供2D和3D绘图,图形,图表以及用于数据浏览的图形。它在NumPy和SciPy之上运行。
Seaborn:这是基于Matplotlib的,提供了易于绘制,高层次,互动性和更有条理的平面图。
Plotly:Plotly是一个数据可视化库。它提供了高质量的交互式图表,例如散点图,折线图,条形图,直方图,箱形图,热图和子图。
Packages/Software | Description |
---|---|
NumPy | NumPy 官网 http://www.numpy.org/ NumPy 源代码:https://github.com/numpy/numpy |
SciPy | SciPy 官网:https://www.scipy.org/ SciPy 源代码:https://github.com/scipy/scipy |
Pandas | 官网:https://pandas.pydata.org/ |
Matplotlib | Matplotlib 官网:https://matplotlib.org/ Matplotlib 源代码:https://github.com/matplotlib/matplotlib |
Seaborn | 官网:https://seaborn.pydata.org/ |
Scikit-learn | 官网:https://scikit-learn.org/stable/ |
Anaconda | 官网:https://www.anaconda.com/distribution/ |
各组件的安装方法类似,以NumPy为参考。
Python 官网上的发行版是不包含 NumPy 模块的,我们可以使用以下几种方法来安装。
对于许多用户,尤其是在 Windows 上,最简单的方法是下载以下的 Python 发行版,它们包含了所有的关键包(包括 NumPy,SciPy,matplotlib,IPython,SymPy 以及 Python 核心自带的其它包):
安装 NumPy 最简单的方法就是使用 pip 工具:
pip3 install --user numpy scipy matplotlib
--user 选项可以设置只安装在当前的用户下,而不是写入到系统目录。
默认情况使用国外线路,国外太慢,我们使用清华的镜像就可以:
pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple
测试是否安装成功:
>>> from numpy import *
>>> eye(4)
array([[1., 0., 0., 0.],
[0., 1., 0., 0.],
[0., 0., 1., 0.],
[0., 0., 0., 1.]])
以NumPy为例,更多玩法请查看官方文档。
函数 | 描述 |
---|---|
dot | 两个数组的点积,即元素对应相乘。 |
vdot | 两个向量的点积 |
inner | 两个数组的内积 |
matmul | 两个数组的矩阵积 |
determinant | 数组的行列式 |
solve | 求解线性矩阵方程 |
inv | 计算矩阵的乘法逆矩阵 |
numpy.vdot() 函数是两个向量的点积。 如果第一个参数是复数,那么它的共轭复数会用于计算。 如果参数是多维数组,它会被展开。
import numpy as np
a = np.array([[1,2],[3,4]])
b = np.array([[11,12],[13,14]])
# vdot 将数组展开计算内积
print(np.vdot(a,b))
输出结果为:
130