python pandas:在行上按条件分组_Pandas按条件分组_Python Pandas按迭代分组 - 腾讯云开发者社区

会写python不难，写好却需要下一番功夫，上篇文章写了for循环的简单优化方法，原本想一鼓作气，梳理一下for循环优化的高级方法，但是梳理过程中发现for循环优化需要比较多的python基础知识，如果了解不透彻很难达到优化的效果，因此，笔者想用几个短篇先介绍一下python的常用包和方法，方便后续优化使用。

Pandas之实用手册

Pandas作为大数据分析最流行的框架之一。用好Pandas就像大数据工程师用好SQL用好Excel一样重要。如果你打算学习 Python 中的数据分析、机器学习或数据科学工具，大概率绕不开Pandas库。Pandas 是一个用于 Python 数据操作和分析的开源库。

您找到你想要的搜索结果了吗？

是的

没有找到

DataFrame和Series的使用

可以把DataFrame看作由Series对象组成的字典，其中key是列名，值是Series Series和Python中的列表非常相似，但是它的每个元素的数据类型必须相同

懂Excel轻松入门Python数据分析包pandas(十九)：文本条件统计

> 经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas

懂Excel轻松入门Python数据分析包pandas(十九)：文本条件统计

懂Excel轻松入门Python数据分析包pandas(二十四)：连续区域

详解Python数据处理Pandas库

通过导入pandas库，并使用约定的别名pd，我们可以使用pandas库提供的丰富功能。

懂Excel轻松入门Python数据分析包pandas(二十四)：连续区域

懂Excel轻松入门Python数据分析包pandas(二十)：数值条件统计

Python数据分析库Pandas

Pandas是一个Python数据分析库，它为数据操作提供了高效且易于使用的工具，可以用于处理来自不同来源的结构化数据。Pandas提供了DataFrame和Series两种数据结构，使得数据操作和分析更加方便和灵活。本文将介绍Pandas的一些高级知识点，包括条件选择、聚合和分组、重塑和透视以及时间序列数据处理等方面。

懂Excel轻松入门Python数据分析包pandas(二十)：数值条件统计

"Python替代Excel Vba"系列（二）：pandas分组统计与操作Excel

在本系列的上一节已经介绍了如何读写 excel 数据，并快速进行汇总处理。但有些小伙伴看完之后有些疑惑：

14个pandas神操作，手把手教你写代码

导读：Pandas是Python数据分析的利器，也是各种数据建模的标准工具。本文带大家入门Pandas，将介绍Python语言、Python数据生态和Pandas的一些基本功能。

Pandas常用命令汇总，建议收藏！

凭借其广泛的功能，Pandas 对于数据清理、预处理、整理和探索性数据分析等活动具有很大的价值。

最全面的Pandas的教程！没有之一!

Pandas 是基于 NumPy 的一个开源 Python 库，它被广泛用于快速分析数据，以及数据清洗和准备等工作。它的名字来源是由“ Panel data”（面板数据，一个计量经济学名词）两个单词拼成的。简单地说，你可以把 Pandas 看作是 Python 版的 Excel。

从Excel到Python：最常用的36个Pandas函数

本文涉及pandas最常用的36个函数，通过这些函数介绍如何完成数据生成和导入、数据清洗、预处理，以及最常见的数据分类，数据筛选，分类汇总，透视等最常见的操作。

我用Python展示Excel中常用的20个操

Excel与Python都是数据分析中常用的工具，本文将使用动态图(Excel)+代码(Python)的方式来演示这两种工具是如何实现数据的读取、生成、计算、修改、统计、抽样、查找、可视化、存储等数据处理中的常用操作！

Pandas 中级教程——数据分组与聚合

Pandas 是数据分析领域中广泛使用的库，它提供了丰富的功能来对数据进行处理和分析。在实际数据分析中，数据分组与聚合是常见而又重要的操作，用于对数据集中的子集进行统计、汇总等操作。本篇博客将深入介绍 Pandas 中的数据分组与聚合技术，帮助你更好地理解和运用这些功能。

python数据分析——数据分类汇总与统计

数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳，然后对这些数据进行统计分析，以便于更好地了解数据的特点和规律。

Pandas

Pandas 是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具，其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力，Pandas 离这个目标已经越来越近了。

Python中Pandas库的相关操作

Pandas是Python中常用的数据处理和分析库，它提供了高效、灵活且易于使用的数据结构和数据分析工具。

pandas分组聚合转换

从上述的例子中不难看出，想要实现分组操作，必须明确三个要素：分组依据分组依据、数据来源数据来源、操作及其返回结果操作及其返回结果。同时从充分性的角度来说，如果明确了这三方面，就能确定一个分组操作，从而分组代码的一般模式：

用Python执行SQL、Excel常见任务？10个方法全搞定！

数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大的数据集。使用基于 Python 构建的开源机器学习库。你可以轻松导入和导出不同格式的数据。

懂Excel也能轻松入门Python数据分析包pandas(二)：高级筛选(下)

经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas 。

pandas中基于范围条件进行表连接

❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills ❞

pandas_VS_Excel条件统计人数与求和

C3=SUMPRODUCT((明细表!$B$2:$B$31=统计!B3)*(明细表!$E$2:$E$31=12)*1)

懂Excel也能轻松入门Python数据分析包pandas(二)：高级筛选(下)

Pandas_Study02

在Pandas的各类数据Series和DataFrame里字段值为NaN的为缺失数据，不代表0而是说没有赋值数据，类似于python中的None值。数据的缺失有很多原因，缺失不是错误、无效，需要对缺失的数据进行必要的技术处理，以便后续的计算、统计。

一场pandas与SQL的巅峰大战（二）

上一篇文章一场pandas与SQL的巅峰大战中，我们对比了pandas与SQL常见的一些操作，我们的例子虽然是以MySQL为基础的，但换作其他的数据库软件，也一样适用。工作中除了MySQL，也经常会使用Hive SQL，相比之下，后者有更为强大和丰富的函数。本文将延续上一篇文章的风格和思路，继续对比Pandas与SQL，一方面是对上文的补充，另一方面也继续深入学习一下两种工具。方便起见，本文采用hive环境运行SQL，使用jupyter lab运行pandas。关于hive的安装和配置，我在之前的文章MacOS 下hive的安装与配置提到过，不过仅限于mac版本，供参考，如果你觉得比较困难，可以考虑使用postgreSQL，它比MySQL支持更多的函数(不过代码可能需要进行一定的改动)。而jupyter lab和jupyter notebook功能相同，界面相似，完全可以用notebook代替，我在Jupyter notebook使用技巧大全一文的最后有提到过二者的差别，感兴趣可以点击蓝字阅读。希望本文可以帮助各位读者在工作中进行pandas和Hive SQL的快速转换。本文涉及的部分hive 函数我在之前也有总结过，可以参考常用Hive函数的学习和总结。

如何用 Python 执行常见的 Excel 和 SQL 任务

作者：ROGER HUANG 本文翻译自：http://code-love.com/2017/04/30/excel-sql-python/ 来源：https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库中找到。有关如何使用 Github 的更多信息，请参阅本指南。数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大

统计师的Python日记【第十天：数据聚合】

本文是【统计师的Python日记】第10天的日记回顾一下：第1天学习了Python的基本页面、操作，以及几种主要的容器类型。第2天学习了python的函数、循环和条件、类。第3天了解了Numpy这个工具库。第4、5两天掌握了Pandas这个库的基本用法。第6天学习了数据的合并堆叠。第7天开始学习数据清洗，着手学会了重复值删除、异常值处理、替换、创建哑变量等技能。第8天接着学习数据清洗，一些常见的数据处理技巧，如分列、去除空白等被我一一攻破第9天学习了正则表达式处理文本数据原文复习（点击

「Python实用秘技15」pandas中基于范围条件进行表连接

这是我的系列文章「Python实用秘技」的第15期，本系列立足于笔者日常工作中使用Python积累的心得体会，每一期为大家带来一个几分钟内就可学会的简单小技巧。

强大且灵活的Python数据处理和分析库：Pandas

Pandas是一个强大且灵活的Python数据处理和分析库。它提供了高效的数据结构和数据操作工具，使得数据分析变得更加简单和便捷。本文将详细介绍Pandas库的常用功能和应用场景，并通过实例演示其在Python数据分析中的具体应用。

为什么python比vba更适合自动化处理Excel数据？

每当有人发布关于 python 处理 Excel 数据的文章，总会有人只看了标题就评论：

国外大神制作的超棒 Pandas 可视化教程

如果读者们计划学习数据分析、机器学习、或者用 Python 做数据科学的研究，你会经常接触到 Pandas 库。Pandas 是一个开源、能用于数据操作和分析的 Python 库。

Python数据分析，系统步骤介绍！

在用Python做数据分析的过程中，有一些操作步骤和逻辑框架是很固定的，只需要记住其用法即可。本节内容介绍Pandas模块在数据分析中的常用方法。

2020年入门数据分析选择Python还是SQL？七个常用操作对比！

SQL和Python几乎是当前数据分析师必须要了解的两门语言，它们在处理数据时有什么区别？本文将分别用MySQL和pandas来展示七个在数据分析中常用的操作，希望可以帮助掌握其中一种语言的读者快速了解另一种方法！

python数据科学系列：pandas入门详细教程

前2篇分别系统性介绍了numpy和matplotlib的入门基本知识，今天本文自然是要对pandas进行入门详细介绍，通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀"的盛誉。

Python Pandas PK esProc SPL，谁才是数据预处理王者？

做数据分析和人工智能运算前常常需要大量的数据准备工作，也就是把各种数据源以及各种规格的数据整理成统一的格式。因为情况非常复杂多样，很难有某种可视化工具来完成此项工作，常常需要编程才能实现。

（数据科学学习手札144）使用管道操作符高效书写Python代码

大家好我是费老师，一些比较熟悉pandas的读者朋友应该经常会使用query()、eval()、pipe()、assign()等pandas的常用方法（相关知识详见我的pandas专题教程https://www.cnblogs.com/feffery/tag/pandas/），书写可读性很高的链式数据分析处理代码，从而更加丝滑流畅地组织代码逻辑。

使用Python将一个Excel文件拆分成多个Excel文件

本文展示如何使用Python将Excel文件拆分为多个文件。拆分Excel文件是一项常见的任务，手工操作非常简单。然而，如果文件包含大量数据和许多类别，则此任务将变得重复且繁琐，这意味着我们需要一个自动化解决方案。

Python数据分析实战基础 | 灵活的Pandas索引

据不靠谱的数据来源统计，学习了Pandas的同学，有超过60%仍然投向了Excel的怀抱，之所以做此下策，多半是因为刚开始用Python处理数据时，选择想要的行和列实在太痛苦，完全没有Excel想要哪里点哪里的快感。

Python教程 | 数据分析系统步骤介绍！

在用Python做数据分析的过程中，有一些操作步骤和逻辑框架是很固定的，只需要记住其用法即可。本节内容介绍Pandas模块在数据分析中的常用方法。

Tableau中国五城市六年PM2.5数据挖掘

精品课 - Python 数据分析

有个人可能会问 NumPy-Pandas-SciPy 不都是免费资源吗，为什么还要花钱来上课？没错，我也是参考了大量书籍、优质博客和付费课程中汲取众多精华，才打磨出来的前七节课。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐