Pandas Dataframe整列到字符串数据类型_pandas dataframe列到datetime_Pandas DataFrame groupby列到字典 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

整理总结 python 中时间日期类数据处理与类型转换(含 pandas)

我自学 python 编程并付诸实战，迄今三个月。 pandas可能是我最高频使用的库，基于它的易学、实用，我也非常建议朋友们去尝试它。——尤其当你本身不是程序员，但多少跟表格或数据打点交道时，pandas 比 excel 的 VBA 简单优雅多了。

01

pandas入门教程

pandas是一个Python语言的软件包，在我们使用Python语言进行机器学习编程的时候，这是一个非常常用的基础编程库。本文是对它的一个入门教程。

02

您找到你想要的搜索结果了吗？

是的

没有找到

用Pandas处理缺失值

在数据表或 DataFrame 中有很多识别缺失值的方法。一般情况下可以分为两种：一种方法是通过一个覆盖全局的掩码表示缺失值，另一种方法是用一个标签值（sentinel value）表示缺失值。在掩码方法中，掩码可能是一个与原数组维度相同的完整布尔类型数组，也可能是用一个比特（0 或 1）表示有缺失值的局部状态。在标签方法中，标签值可能是具体的数据（例如用 -9999 表示缺失的整数），也可能是些极少出现的形式。另外，标签值还可能是更全局的值，比如用 NaN（不是一个数）表示缺失的浮点数。

01

数据分析常见技巧和经验总结

Pandas中有很多数据类型，其中有一种是datetime，即日期时间，如Timestamp(‘2020-09-22 20:43:00’)，表示其是一个时间戳类型，很多时候需要将其转化为字符串，以便获取到其中的日期或时间，此时可以对其调用strftime()方法，如strftime('%Y-%m-%d')就可以获取到字符串2020-09-22。在pandas中的DataFrame中，一般是整列替换，此时需要用到lambda表达式和apply方法，如下：

02

7步搞定数据清洗－Python数据清洗指南

作者：KOALA https://zhuanlan.zhihu.com/p/60241672

02

Python科学计算之Pandas

在我看来，对于Numpy以及Matplotlib，Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy（会在接下来的帖子中提及）当然是另一个主要的也十分出色的科学计算库，但是我认为前三者才是真正的Python科学计算的支柱。

00

python数据科学系列：pandas入门详细教程

前2篇分别系统性介绍了numpy和matplotlib的入门基本知识，今天本文自然是要对pandas进行入门详细介绍，通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀"的盛誉。

02

用Python执行SQL、Excel常见任务？10个方法全搞定！

数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大的数据集。使用基于 Python 构建的开源机器学习库。你可以轻松导入和导出不同格式的数据。

02

如何用 Python 执行常见的 Excel 和 SQL 任务

作者：ROGER HUANG 本文翻译自：http://code-love.com/2017/04/30/excel-sql-python/ 来源：https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库中找到。有关如何使用 Github 的更多信息，请参阅本指南。数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大

06

在Python如何将 JSON 转换为 Pandas DataFrame？

在数据处理和分析中，JSON是一种常见的数据格式，而Pandas DataFrame是Python中广泛使用的数据结构。将JSON数据转换为Pandas DataFrame可以方便地进行数据分析和处理。在本文中，我们将探讨如何将JSON转换为Pandas DataFrame，并介绍相关的步骤和案例。

02

pandas处理字符串方法汇总

字符串是一种常见的数据类型，我们遇到的文本、json数据等都是属于字符串的范畴。Python内置了很多处理字符串的方法，这些方法为我们处理和清洗数据提供了很大的便利。

02

Pandas处理csv表格

该文介绍了如何使用Pandas库对CSV文件进行数据处理和操作，包括读取CSV文件、处理缺失值、数据类型转换、数据筛选和排序、数据分组和统计等。同时，还介绍了如何使用Pandas进行数据预处理，包括数据标准化、数据编码、特征提取和特征选择等。最后，通过一个具体的示例，演示了如何使用Pandas进行数据分析和处理，并生成了对应的CSV文件。

05

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

本文我们讨论 pandas 的内存使用，展示怎样简单地为数据列选择合适的数据类型，就能够减少 dataframe 近 90% 的内存占用。

05

挑战30天学完Python：Day25 数据分析Pandas

Pandas是Python程序语言中一种开源、高性能、易于使用的数据结构和数据分析工具。Pandas添加了数据结构和工具，用于处理类似表格的数据，即 Series 和 Data Frames。它主要提供的数据操作工具有：

01

进步神速，Pandas 2.1中的新改进和新功能

Pandas 2.1于2023年8月30日发布。跟随本文一起看看这个版本引入了哪些新内容，以及它如何帮助用户改进Pandas的工作负载。它包含了一系列改进和一组新的弃用功能。

01

Pandas入门2

对于DataFrame，对齐会同时发生在行和列上，两个DataFrame对象相加后，其索引和列会取并集，缺省值用NaN。

02

读完本文，轻松玩转数据处理利器Pandas 1.0

常用数据科学库 Pandas 刚刚年满十二岁，现在已经发布到 1.0.0 版。首个 Pandas 1.0 候选版本显示出，现在的 Pandas 在遇到缺失值时会接收一个新的标量，遵循语义化版本控制（Semantic Versioning）形成了新的弃用策略，网站也经过了重新设计……

02

读完本文，轻松玩转数据处理利器Pandas 1.0

常用数据科学库 Pandas 刚刚年满十二岁，现在已经发布到 1.0.0 版。首个 Pandas 1.0 候选版本显示出，现在的 Pandas 在遇到缺失值时会接收一个新的标量，遵循语义化版本控制（Semantic Versioning）形成了新的弃用策略，网站也经过了重新设计……

01

python数据分析——数据预处理

数据预处理是数据分析过程中不可或缺的一环，它的目的是为了使原始数据更加规整、清晰，以便于后续的数据分析和建模工作。在Python数据分析中，数据预处理通常包括数据清洗、数据转换和数据特征工程等步骤。

01

数据科学 IPython 笔记本 7.7 处理缺失数据

许多教程中的数据与现实世界中的数据之间的差异在于，真实世界的数据很少是干净和同构的。特别是，许多有趣的数据集缺少一些数据。为了使事情变得更复杂，不同的数据源可能以不同的方式标记缺失数据。

02

Pandas 25 式

原文的数据集是 bit.ly 短网址的，我这里在读取时出问题，不稳定，就帮大家下载下来，统一放到了 data 目录里。

00

Pandas使用技巧：如何将运行内存占用降低90%！

当使用 pandas 操作小规模数据（低于 100 MB）时，性能一般不是问题。而当面对更大规模的数据（100 MB 到数 GB）时，性能问题会让运行时间变得更漫长，而且会因为内存不足导致运行完全失败。

02

pandas 变量类型转换的 6 种方法

对于变量的数据类型而言，Pandas除了数值型的int 和 float类型外，还有object ，category，bool，datetime类型。

02

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

Kevin Markham，数据科学讲师，2002 年，毕业于范德堡大学，计算机工程学士，2014 年，创建了 Data School，在线教授 Python 数据科学课程，他的课程主要包括 Pandas、Scikit-learn、Kaggle 竞赛数据科学、机器学习、自然语言处理等内容，迄今为止，浏览量在油管上已经超过 500 万次。

02

pandas 玩转 Excel 操作总结

pandas是一款基于NumPy的数据分析工具。它提供了大量的能使我们快捷处理数据的方法。

02

教程 | 简单实用的pandas技巧：如何将内存占用降低90%

选自DATAQUEST 作者：Josh Devlin 机器之心编译参与：Panda pandas 是一个 Python 软件库，可用于数据操作和分析。数据科学博客 Dataquest.io 发布了一篇关于如何优化 pandas 内存占用的教程：仅需进行简单的数据类型转换，就能够将一个棒球比赛数据集的内存占用减少了近 90%，机器之心对本教程进行了编译介绍。当使用 pandas 操作小规模数据（低于 100 MB）时，性能一般不是问题。而当面对更大规模的数据（100 MB 到数 GB）时，性能问题会让运行

Pandas创建DataFrame对象的几种常用方法

DataFrame是pandas常用的数据类型之一，表示带标签的可变二维表格。本文介绍如何创建DataFrame对象，后面会陆续介绍DataFrame对象的用法。首先，使用pip、conda或类似工具正确安装扩展库numpy和pandas，然后按照Python社区的管理，使用下面的方式进行导入： >>> import numpy as np >>> import pandas as pd 接下来就可以通过多种不同的方式来创建DataFrame对象了，为了避免排版混乱影响阅读，直接在我制作的PPT上进行截图

08

cuDF，能取代 Pandas 吗？

cuDF (Pandas GPU 平替)，用于加载、连接、聚合、过滤和其他数据操作。

01

Pandas知识点-比较操作

比较操作是很简单的基础知识，不过Pandas中的比较操作有一些特殊的点，本文进行介绍。

02

python-004_pandas.read_csv函数读取文件

pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。

00

（数据科学学习手札73）盘点pandas 1.0.0中的新特性

毫无疑问pandas已经成为基于Python的数据分析领域最重要的包，而就在最近，pandas终于迎来了1.0.0版本，对于pandas来说这是一次更新是里程碑式的，删除了很多旧版本中臃肿的功能，新增了一些崭新的特性，更加专注于高效实用的数据分析，本文就将针对pandas 1.0.0在笔者眼中比较重要的特性进行介绍，对于想要完整彻底了解新版本特性的朋友可以直接去看官方文档。

03

你一定不能错过的pandas 1.0.0四大新特性

毫无疑问pandas已经成为基于Python的数据分析领域最重要的包，而就在最近，pandas终于迎来了1.0.0版本，对于pandas来说这是一次更新是里程碑式的，删除了很多旧版本中臃肿的功能，新增了一些崭新的特性，更加专注于高效实用的数据分析，本文就将针对pandas 1.0.0在笔者眼中比较重要的特性进行介绍，对于想要完整彻底了解新版本特性的朋友可以直接去看官方文档。

02

[编程经验] Pandas入门（一）

今天和大家介绍一个非常厉害的数据处理的工具，Pandas。Python中比较有名的数据处理的库除了Pandas，还有Numpy，Matplotlib。这三个在平时学习的时候的会经常遇到，而且每一个功能都非常强大。对于这类库的学习，开始的时候，总是遇到某个问题的时候，就会去找度娘，所以有必要总结一下，方便自己也方便大家。恩，废话不多说，下面开始。 Pandas主要包括两种数据结构，一个是Series，一个是DataFrame。可以理解为多个Series组合在一起就构成了DataFrame。下面我分别介绍一下，

03

解决pandas.core.frame.DataFrame格式数据与numpy.ndarray格式数据不一致导致无法运算问题

在数据分析与机器学习中，经常会遇到处理数据的问题。而使用Python进行数据处理和分析时，pandas库和numpy库是常用的工具。其中，pandas库提供了DataFrame数据结构，numpy库提供了ndarray数据结构。然而，有时候我们会遇到DataFrame格式数据与ndarray格式数据不一致导致无法进行运算的问题。本文将介绍一种解决这个问题的方法。

02

python dtype o_python – 什么是dtype（’O’）？ – 堆栈内存溢出「建议收藏」

什么属于pandas或numpy ，或两者，或其他什么？如果我们检查一下pandas代码：

02

99%的人都不知道的pandas骚操作（一）

pandas有一种功能非常强大的方法，它就是accessor，可以将它理解为一种属性接口，通过它可以获得额外的方法。其实这样说还是很笼统，下面我们通过代码和实例来理解一下。

03

再见Pandas，又一数据处理神器！

cuDF (Pandas GPU 平替)，用于加载、连接、聚合、过滤和其他数据操作。

01

再见Pandas，又一数据处理神器！

cuDF (Pandas GPU 平替)，用于加载、连接、聚合、过滤和其他数据操作。

01

PySpark UD(A)F 的高效使用

Spark无疑是当今数据科学和大数据领域最流行的技术之一。尽管它是用Scala开发的，并在Java虚拟机(JVM)中运行，但它附带了Python绑定，也称为PySpark，其API深受panda的影响。在功能方面，现代PySpark在典型的ETL和数据处理方面具有与Pandas相同的功能，例如groupby、聚合等等。

03

快速提升效率的6个pandas使用小技巧

文章来源：towardsdatascience 作者：B.Chen 翻译\编辑：Python大数据分析

01

6个提升效率的pandas小技巧

文章来源：towardsdatascience 作者：B.Chen 翻译\编辑：Python大数据分析

02

[数据清洗]-看上去一样的数字

数据不正确（格式不正确，数据不准确，数据缺失）我们做什么都是徒劳。数据清洗时数据分析的第一步，也是最耗时的一步。数据清洗很枯燥，但是随着数据清理技巧越来越熟练，就有越有可能从他人无从下手的文档中获取

03

Python数据分析--Pandas知识

利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID.

05

数据分析与数据挖掘 - 07数据处理

Pandas是数据处理中非常常用的一个库，是数据分析师、AI的工程师们必用的一个库，对这个库是否能够熟练的应用，直接关系到我们是否能够把数据处理成我们想要的样子。Pandas是基于NumPy构建的，让以NumPy为中心的应用变得更加的简单，它专注于数据处理，这个库可以帮助数据分析、数据挖掘、算法等工程师岗位的人员轻松快速的解决处理预处理的问题。比如说数据类型的转换，缺失值的处理、描述性统计分析、数据汇总等等功能。它不仅仅包含各种数据处理的方法，也包含了从多种数据源中读取数据的方法，比如Excel、CSV等，这些我们后边会讲到，让我们首先从Pandas的数据类型开始学起。 Pandas一共包含了两种数据类型，分别是Series和DataFrame，我们先来学习一下Series类型。 Series类型就类似于一维数组对象，它是由一组数据以及一组与之相关的数据索引组成的，代码示例如下：

02

python：Pandas里千万不能做的5件事

作为一个在进入数据分析领域之前干过开发的攻城狮，我看到我的同行以及新手在使用 Pandas 时会犯很多低级错误。

02

灰太狼的数据世界（三）

一期我们了解了Pandas里面Series数据结构，了解了如何创建修改，清理Series，也了解了一些统计函数，例如方差，标准差，峰度这些数学概念。那么今天我们就来了解Pandas里面的另一个数据结构-----DataFrame。

03

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

这篇万字长文，是黄同学辛苦为大家辛苦翻译排版。希望大家一定从头到尾学习，否则，可能会找不到操作的数据源。

02

Pandas最详细教程来了！

导读：在Python中，进行数据分析的一个主要工具就是Pandas。Pandas是Wes McKinney在大型对冲基金AQR公司工作时开发的，后来该工具开源了，主要由社区进行维护和更新。

01

国外大神制作的超棒 Pandas 可视化教程

加载数据最方便、最简单的办法是我们能一次性把表格(CSV 文件或者 EXCEL 文件)导入。然后我们能用多种方式对它们进行切片和裁剪。

02

Python3快速入门（十四）——Pan

pandas.read_csv(filepath_or_buffer, na_values='NAN', parse_dates=['Last Update']) 从CSV文件中读取数据并创建一个DataFrame对象，na_vlaues用于设置缺失值形式，parse_dates用于将指定的列解析成时间日期格式。 dataframe.to_csv("xxx.csv", mode='a', header=False) 导出DataFrame数据到CSV文件。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭