将转换器模型应用于pandas列中的每一行_将函数应用于df列的每一行_Pandas -将逻辑应用于DataFrame中的每一列 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

Python数据分析实战之数据获取三大招

在数据框架中创建计算列

在Excel中，我们可以通过先在单元格中编写公式，然后向下拖动列来创建计算列。在PowerQuery中，还可以添加“自定义列”并输入公式。在Python中，我们创建计算列的方式与PQ中非常相似，创建一列，计算将应用于这整个列，而不是像Excel中的“下拉”方法那样逐行进行。要创建计算列，步骤一般是：先创建列，然后为其指定计算。

数据分析利器--Pandas

pandas是python数据分析中一个很重要的包；在学习过程中我们需要预备的知识点有：DataFrame、Series、NumPy、NaN/None；

GPT 大型语言模型可视化教程

欢迎来到 GPT 大型语言模型演练！在这里，我们将探索只有 85,000 个参数的 nano-gpt 模型。

又一个Jupyter神器，操作Excel自动生成Python代码！

不得不说，Jupyter对于表的处理真的是越来越方便了，很多库可以直接实现可视化操作，无需写代码。但是这还不够，最近看到一个神器叫Mito，它真的是做到了无需写一行代码，而且手动的操作可以自动转换为代码，供后续批量化操作，这简直不要太爽。

手把手带你开启机器学习之路——房价预测(二)

在前一篇文章手把手带你开启机器学习之路——房价预测(一)中我们以加州住房价格数据集为基础，学习了数据抽样，数据探索性分析和可视化，数据预处理(缺失值填充，增加新特征，特征缩放，分类变量编码)等步骤，接下来继续深入，最终建立预测模型。可以在公众号后台回复“房价”获取两篇文章的数据，代码，PDF文件和思维导图。

ML.NET介绍：最常使用的数据结构IDataView

ML.NET一种跨平台的开源机器学习框架。ML.NET将让广大.NET开发人员可以开发自己的模型，并且将自定义的机器学习融入到其应用程序中，无需之前拥有开发或调整机器学习模型方面的专业知识。能够支持诸多机器学习任务，比如说分类（比如文本分类和情绪分析）以及回归（比如趋势预测和价格预测）,使用模型用于预测，还包括该框架的核心组件，比如学习算法、转换和核心的机器学习数据结构。

还在抱怨pandas运行速度慢？这几个方法会颠覆你的看法

当大家谈到数据分析时，提及最多的语言就是Python和SQL。Python之所以适合数据分析，是因为它有很多第三方强大的库来协助，pandas就是其中之一。pandas的文档中是这样描述的：

这几个方法颠覆你对Pandas缓慢的观念！

作者：xiaoyu 知乎：https://zhuanlan.zhihu.com/pypcfx 介绍：一个半路转行的数据挖掘工程师

Pandas 2.2 中文官方教程和指南（十·一）

pandas I/O API 是一组顶级reader函数，如pandas.read_csv()通常返回一个 pandas 对象。相应的writer函数是对象方法，如DataFrame.to_csv()。下面是包含可用reader和writer的表格。

Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版（一）

2006 年，Geoffrey Hinton 等人发表了一篇论文，展示了如何训练一个能够以最先进的精度（>98%）识别手写数字的深度神经网络。他们将这种技术称为“深度学习”。深度神经网络是我们大脑皮层的（非常）简化模型，由一系列人工神经元层组成。在当时，训练深度神经网络被普遍认为是不可能的，大多数研究人员在 1990 年代末放弃了这个想法。这篇论文重新激起了科学界的兴趣，不久之后，许多新论文证明了深度学习不仅是可能的，而且能够实现令人惊叹的成就，其他任何机器学习（ML）技术都无法匹敌（在巨大的计算能力和大量数据的帮助下）。这种热情很快扩展到许多其他机器学习领域。

Pandas数据处理——渐进式学习1、Pandas入门基础

Pandas 的主要数据结构是 Series（一维数据）与 DataFrame（二维数据），这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。对于 R 用户，DataFrame 提供了比 R 语言 data.frame 更丰富的功能。Pandas 基于 NumPy 开发，可以与其它第三方科学计算支持库完美集成。

带你建立一个完整的机器学习项目

首先，我们需要预览这个项目。项目的目的是什么，以房价预测为例，数据为StatLib的加州房产数据，那么目的就是预测街区的房产价格中位数。

8个Python高效数据分析的技巧。

今天给大家分享一篇内容，介绍了8个使用Python进行数据分析的方法，不仅能够提升运行效率，还能够使代码更加“优美”。

在Python中实现Excel的VLOOKUP、HLOOKUP、XLOOKUP函数功能

Excel的LOOKUP公式可能是最常用的公式之一，因此这里将在Python中实现Excel中查找系列公式的功能。事实上，我们可以使用相同的技术在Python中实现VLOOKUP、HLOOKUP、XLOOKUP或INDEX/MATCH等函数的功能。

9个value_counts()的小技巧，提高Pandas 数据分析效率

数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时，Pandas value_counts() 是最受欢迎的函数之一。该函数返回一个包含唯一值计数的系列。生成的Series可以按降序或升序排序，通过参数控制包括或排除NA。

预处理数据

数据预处理（data preprocessing）是指在主要的处理以前对数据进行的一些处理。

手把手 | 如何用Python做自动化特征工程

机器学习的模型训练越来越自动化，但特征工程还是一个漫长的手动过程，依赖于专业的领域知识，直觉和数据处理。而特征选取恰恰是机器学习重要的先期步骤，虽然不如模型训练那样能产生直接可用的结果。本文作者将使用Python的featuretools库进行自动化特征工程的示例。

Spark的Ml pipeline

ML pipeline提供了一组统一的高级API，它们构建在 DataFrame之上，可帮助用户创建和调整实用的机器学习pipeline。一重要概念 1.1 管道中的主要概念 MLlib对机器学习算法的API进行了标准化，使得将多种算法合并成一个pipeline或工作流变得更加容易。Pipeline的概念主要是受scikit-learn启发。 DataFrame：这个ML API使用Spark SQL 的DataFrame作为一个ML数据集，它可以容纳各种数据类型。例如，a DataFrame具有可以存

开启机器学习的第一课：用Pandas进行数据分析

翻译 | AI科技大本营参与 | 林椿眄本课程的目的并不是要开发一门全新的机器学习或数据分析的综合入门课程，也不是想借此来取代基础教育、在线/离线课程或一些专业和书籍。我们推出本系列文章是为了让初学者快速地回顾一些基础知识，并帮助你找到进一步学习的方向。首先用简短通俗的语言回顾数学和机器学习的基础知识，并引用了一些其他资源，这种教学的方法与一些深度学习书籍类似。此外，课程不单单注重理论的讲解，更强调完美地平衡理论与实践。因此，每个理论主题讲解后都有一个对应的练习专题，方便初学者通过自己动手来巩

9个value_counts()的小技巧，提高Pandas 数据分析效率

来源：DeepHub IMBA 本文约1800字，建议阅读5分钟我们将探讨 Pandas value_counts() 的不同用例。数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时，Pandas value_counts() 是最受欢迎的函数之一。该函数返回一个包含唯一值计数的系列。生成的Series可以按降序或升序排序，通过参数控制包括或排除NA。在本文中，我们将探讨 Pandas value_counts() 的不同用例。您将学习如何使用它来处理以下常见任务。默

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

来源：机器之心本文长度为2527字，建议阅读5分钟本文为你介绍如何在Keras深度学习库中搭建用于多变量时间序列预测的LSTM模型。长短期记忆循环神经网络等几乎可以完美地模拟多个输入变量的问题，这为时间序列预测带来极大益处。本文介绍了如何在 Keras 深度学习库中搭建用于多变量时间序列预测的 LSTM 模型。诸如长短期记忆（LSTM）循环神经网络的神经神经网络几乎可以无缝建模具备多个输入变量的问题。这为时间序列预测带来极大益处，因为经典线性方法难以适应多变量或多输入预测问题。通过本教程，你

9个value_counts()的小技巧，提高Pandas 数据分析效率

可自动构造机器学习特征的Python库

机器学习越来越多地从人工设计模型转向使用 H20、TPOT 和 auto-sklearn 等工具自动优化的工具。这些库以及随机搜索（参见《Random Search for Hyper-Parameter Optimization》）等方法旨在通过寻找匹配数据集的最优模型来简化模型选择和机器学习调优过程，而几乎不需要任何人工干预。然而，特征工程作为机器学习流程中可能最有价值的一个方面，几乎完全是人工的。

教程 | 基于Keras的LSTM多变量时间序列预测

选自machinelearningmastery 机器之心编译参与：朱乾树、路雪长短期记忆循环神经网络等几乎可以完美地模拟多个输入变量的问题，这为时间序列预测带来极大益处。本文介绍了如何在 Keras 深度学习库中搭建用于多变量时间序列预测的 LSTM 模型。诸如长短期记忆（LSTM）循环神经网络的神经神经网络几乎可以无缝建模具备多个输入变量的问题。这为时间序列预测带来极大益处，因为经典线性方法难以适应多变量或多输入预测问题。通过本教程，你将学会如何在 Keras 深度学习库中搭建用于多变量时间

FPGA 通过 UDP 以太网传输 JPEG 压缩图片

在 FPGA 上实现了 JPEG 压缩和 UDP 以太网传输。从摄像机的输入中获取单个灰度帧，使用 JPEG 标准对其进行压缩，然后通过UDP以太网将其传输到另一个设备（例如计算机），所有这些使用FPGA（Verilog）实现。

Pandas 学习手册中文第二版：1~5

欢迎来到《Pandas 学习手册》！在本书中，我们将进行一次探索我们学习 Pandas 的旅程，这是一种用于 Python 编程语言的开源数据分析库。 pandas 库提供了使用 Python 构建的高性能且易于使用的数据结构和分析工具。 pandas 从统计编程语言 R 中带给 Python 许多好处，特别是数据帧对象和 R 包（例如plyr和reshape2），并将它们放置在一个可在内部使用的 Python 库中。

初学者使用Pandas的特征工程

Pandas是用于Python编程语言的开源高级数据分析和处理库。使用pandas，可以轻松加载，准备，操作和分析数据。它是用于数据分析操作的最优选和广泛使用的库之一。

8 个 Python 高效数据分析的技巧

不管是参加Kaggle比赛，还是开发一个深度学习应用，第一步总是数据分析，这篇文章介绍了8个使用Python进行数据分析的方法，不仅能够提升运行效率，还能够使代码更加“优美”。

这 8 个 Python 技巧让你的数据分析提升数倍！

盘一盘 Python 系列 8 - Sklearn

Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上，里面的 API 的设计非常好，所有对象的接口简单，很适合新手上路。

盘一盘 Python 系列 8 - Sklearn

8个Python高效数据分析的技巧

厌倦了定义用不了几次的函数？ Lambda表达式是你的救星！ Lambda表达式用于在Python中创建小型，一次性和匿名函数对象。它能替你创建一个函数。

向量化操作简介和Pandas、Numpy示例

Pandas是一种流行的用于数据操作的Python库，它提供了一种称为“向量化”的强大技术可以有效地将操作应用于整个列或数据系列，从而消除了显式循环的需要。在本文中，我们将探讨什么是向量化，以及它如何简化数据分析任务。

在NLP项目中使用Hugging Face的Datasets 库

数据科学是关于数据的。网络上有各种来源可以为您的数据分析或机器学习项目获取数据。最受欢迎的来源之一是 Kaggle，我相信我们每个人都必须在我们的数据旅程中使用它。

1000+倍！超强Python『向量化』数据处理提速攻略

1000倍的速度听起来很夸张。Python并不以速度著称。这是真的吗？当然有可能，关键在于你如何操作！

资源 | Feature Tools：可自动构造机器学习特征的Python库

数据导入与预处理-第6章-02数据变换

主要是对数据进行规范化的操作，将数据转换成“适当的”格式，以适用于挖掘任务及算法的需要。

Pandas 2.2 中文官方教程和指南（十·二）

将多级索引的 DataFrames 存储为表与存储/选择同质索引的 DataFrames 非常相似。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐