前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Python干货教程】七大常用Python库(小白必备快速上手机器学习、简化算法编程)

【Python干货教程】七大常用Python库(小白必备快速上手机器学习、简化算法编程)

作者头像
程序员洲洲
发布2024-06-07 13:07:11
2550
发布2024-06-07 13:07:11
举报
文章被收录于专栏:项目文章

前言

Hello大家好,我是洲洲,今天给大家介绍一篇干货教程。

主题是十大常用Python库(快速上手机器学习、简化算法编程)。

1、TensorFlow

TensorFlow 是一款非常流行的开源库,它是由Google与Brain Team合作开发而成,主要用于机器学习类应用的开发。

TensorFlow 的工作方式类似于编写大量涉及张量(tensor)操作的新的算法库。由于神经网络可以很容易地被表示为计算图形,因此它们可以使用TensorFlow来作为张量上的一系列操作予以实现。

TensorFlow 针对速度进行了优化,它利用XLA等技术,实现了快速线性代数的运算。

其特点如下:

  • 响应式构建:使用TensorFlow,我们可以轻松地可视化图形的每一个部分。而下面将要提到的NumPy或SciKit则无此选项;
  • 灵活:由于具有模块化的特点,因此Tensorflow在功能上具有灵活的可操作性,用户可以只选用其需要的独立部分;
  • 易于训练:它可以通过CPU和GPU的训练方式,轻松地实现分布式计算;
  • 并行神经网络训练:由于TensorFlow提供了流水线式的操作,因此从某种意义上说,您可以训练多个神经网络和多个GPU。这对于大规模系统上的模型来说是非常高效的;
  • 社区活跃:由于是Google开发的,因此一大批软件工程师会持续致力于其稳定性的改进;
  • 开源:由于是开源的,因此只要有互联网的连接,任何人都可以使用到它。

Google语音搜索、以及Google相册等应用都是由TensorFlow库所开发的。虽然由TensorFlow所创建的库集合都是用C和C++编写的,但是它拥有一个复杂的Python前端。因此,Python代码将会被它所编译,然后再由C和C ++构建的TensorFlow分布式引擎所执行。

2、Numpy

NumPy 被认为是Python中受欢迎的机器学习库之一。TensorFlow 和其他库在内部都会使用NumPy来执行多种操作。其中,数组接口是NumPy好用、也是重要的功能之一。

NumPy 库接口可以被用于将图像、声波、以及其他二进制原始流,表达为N维实数数组。为了更好地将其用于机器学习,全栈工程师有必要对其深入了解

其主要特点如下:

  • 交互式:NumPy具有强交互性、且易于被使用;
  • 数学性:通过复杂的数学,将实现变得非常简单;
  • 直观性:能够将编码、及概念变得简单易懂;
  • 开源:由于得到了广泛的使用,因此它获得了更多的开源贡献。

3、SciPy

SciPy 是一个面向应用程序开发人员和工程师的机器学习库。与SciPy堆栈不同,SciPy库包含了用于优化、线性代数、积分和统计的模块。

由于SciPy是一个使用NumPy来解决数学函数的库,因此SciPy采用NumPy数组作为基本的数据结构,并附带了用于科学编程的各种常用任务模块。因此SciPy可以轻松地处理包括:线性代数、积分(微积分)、常微分方程求解、以及信号处理在内的各项任务。

SciPy库的主要特点是使用到了NumPy来进行开发,因此它的数组充分利用了NumPy的特点。此外,SciPy提供了诸如优化、数值积分和其他特定的子模块。这些所有子模块里的所有功能都有着详细配套的文档。

4、Scikit-Learn

Scikit-Learn 是一个与 NumPy 和 SciPy 相关联的Python库,被认为是处理复杂数据的Python库之一。它有很多改进版本,其中的一种是通过交叉验证的功能,以及提供多个参数指标,来改进诸如逻辑回归、以及最近邻居等多种训练的方法。

Scikit-Learn 包含了大量可用于实现标准机器学习、以及数据挖掘任务的算法。例如:降低维度、分类、回归、聚类和模型选择等。

其特点如下:

  • 交叉验证:它提供许多方法来检查、监督模型对于不可见数据的准确性;
  • 无监督学习算法:同样,它也提供包括聚类、因子分析、主成分分析、以及无监督神经网络等的大量算法;
  • 特征提取:能够被用于从图像和文本中提取特征(例如,Bag of words);

5、Keras

Keras 被认为是酷炫的机器学习类Python库之一。它提供了一种更容易表达神经网络的机制。同时,Keras还提供了一些可用于编译模型、处理数据集、图形可视化等方面的工具。

Keras 在后端内部使用的是 Theano 或 TensorFlow。它可以被用在诸如CNTK之类的各种流行的神经网络上。与其他机器学习类型的库相比,由于Keras通过使用后端的基础架构来创建计算图形,因此其后续的执行操作相对较慢。另外,Keras的所有模型都是可被移植的。

如今,诸如Netflix、Uber、Yelp、Instacart、Zocdoc、以及Square等众多网站都使用到了Keras构建的交互性功能。许多初创型公司都愿意在其产品核心中用到Keras所提供的深度学习技术。

Keras包含了许多神经网络常用的构建模块,例如:各个层、对象、激活函数、优化器、以及一系列可供处理图像与文本数据工具。此外,它还提供了许多预处理数据的集合、以及预训练的模型,其中包括:MNIST、VGG、Inception、SqueezeNet、以及ResNet等。

在接受程度上,Keras是排名第二的,被深度学习研究人员所喜爱的Python库。一些大型科学组织,特别是CERN和NASA的研究人员,都会用到Keras。

其特点如下:

  • Keras在CPU和GPU上都能够顺利地运行;
  • 支持神经网络中的所有模型,包括:完全连接、卷积、汇集、循环、嵌入等。此外,这些模型也可以被组合起来构建更为复杂的模型;
  • 模块化特征,具有非凡的表现力、灵活性,且适合于创新类研究;
  • 是完全基于Python的框架,开发人员可以轻松进行各种调试。

6、PyTorch

PyTorch 是一个大型的机器学习库,它允许开发人员通过GPU加速,来执行张量计算、创建动态计算图、并自动计算出梯度。此外,PyTorch还提供了丰富的API,可用于解决与神经网络相关的应用问题。基于Torch的 PyTorch 是一个用C语言实现的开源机器学习库。当然,它也带有Lua的包装器。

PyTorch由Facebook的人工智能研究小组所开发,主要被用于自然语言处理等应用,例如,Uber的Pyro软件就将它用到了概率编程上。如今,PyTorch在许多方面都超越了TensorFlow,并且持续引起了更多的关注。

其特点如下:

  • 混合前端:新的混合前端在eager模式下,保证了易用性和灵活性。在被无缝地转换到graph模式后,它能够在C++的运行环境中保证速度、优化和相应的功能;
  • 分布式训练:得益于Python和C++能够访问到对等式通信的优点,它能够对集合式操作和异步执行提供原生的支持,并且能够优化研究、以及生产环境中的性能;
  • Python优先:PyTorch并非是一种Python绑定的单体式(monolithic)C++框架。它是为深入地集成到Python中而构建的。因此它可以与各种流行的库、以及Cython和Numba等软件包一同使用;
  • 社区活跃:由活跃的研究人员与开发人员所构成的社区,实现了一个丰富的工具与库的生态系统。该系统可以被用于扩展PyTorch、并支持从计算机视觉到强化学习等领域的开发。

7、Pandas

Pandas 也是一种Python类机器学习库,它提供了高级的数据结构和各种分析类工具。Pandas库重要的一个特性是:能够使用一个或两个命令,将复杂的操作与数据进行转换。Pandas有许多内置的分组方法,其中包括:数据、过滤以及时间序列功能。

Pandas能够让我们操作数据的整个过程更加容易。Pandas的功能主要包括:支持重新索引、迭代、排序、聚合、连接、以及可视化等操作

目前,Pandas库的各种发布版主要集中在错误修复、增强功能和API修改等方面。Pandas的最近一次改进,能够让它实现对于数据的分组与排序。它能够为应用选择适合的输出方法,并为执行各种自定义类型的操作提供支持。用户在使用Pandas与其他库工具一同进行数据分析时,能够获取较高的性能与灵活性。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 1、TensorFlow
  • 2、Numpy
  • 3、SciPy
  • 4、Scikit-Learn
  • 5、Keras
  • 6、PyTorch
  • 7、Pandas
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档