在python中将包含具有二维数组的列的pandas数据帧保存为parquet文件。_如何将包含一列数组的Dask数据帧写入到parquet文件_如何使用pandas在python中将每N个值的列表拆分成数据帧的列和行 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

盘一盘 Python 系列 2 - NumPy (上)

盘一盘 NumPy (上)

【干货】NumPy入门深度好文 (上篇)

媲美Pandas？一文入门Python的Datatable操作

【导读】工具包 datatable 的功能特征与 Pandas 非常类似，但更侧重于速度以及对大数据的支持。此外，datatable 还致力于实现更好的用户体验，提供有用的错误提示消息和强大的 API 功能。通过本文的介绍，你将学习到如何在大型数据集中使用 datatable 包进行数据处理，特别在数据量特别大的时候你可以发现它可能比 Pandas 更加强大。

媲美Pandas？Python的Datatable包怎么用？

更高效的利用Jupyter+pandas进行数据分析，6种常用数据格式效率对比！

在使用Python进行数据分析时，Jupyter Notebook是一个非常强力的工具，在数据集不是很大的情况下，我们可以使用pandas轻松对txt或csv等纯文本格式数据进行读写。

精通 Pandas：1~5

在本节中，我们将讨论使数据分析成为当今快速发展的技术环境中日益重要的工作领域的趋势。

更高效的利用Jupyter+pandas进行数据分析，6种常用数据格式效率对比！

媲美Pandas？Python的Datatable包怎么用？

Cloudera机器学习中的NVIDIA RAPIDS

在本系列的上一篇博客文章中，我们介绍了在Cloudera Machine Learning（CML）项目中利用深度学习的步骤。今年，我们扩大了与NVIDIA的合作伙伴关系，使您的数据团队能够使用RAPIDS AI无需更改任何代码即可大大加快数据工程和数据科学工作负载的计算流程。Cloudera Data Platform上的RAPIDS预先配置了所有必需的库和依赖项，以将RAPIDS的功能带到您的项目中。

NumPy-读写文件「建议收藏」

(1) save 函数是以二进制的格式保存数据。格式: np.save (“./save_arr “, arr1) (2) load 函数是从二进制的文件中读取数据。格式: np.load(“./ save_arr.npy”) (3) savez 函数可以将多个数组保存到一个文件中。格式: np.savez(‘./savez_arr’,arr1,arr2) (4) 存储时可以省略扩展名，但读取时不能省略扩展名

干货！直观地解释和可视化每个复杂的DataFrame操作

大多数数据科学家可能会赞扬Pandas进行数据准备的能力，但许多人可能无法利用所有这些能力。操作数据帧可能很快会成为一项复杂的任务，因此在Pandas中的八种技术中均提供了说明，可视化，代码和技巧来记住如何做。

数据分析利器--Pandas

pandas是python数据分析中一个很重要的包；在学习过程中我们需要预备的知识点有：DataFrame、Series、NumPy、NaN/None；

PySpark UD(A)F 的高效使用

Spark无疑是当今数据科学和大数据领域最流行的技术之一。尽管它是用Scala开发的，并在Java虚拟机(JVM)中运行，但它附带了Python绑定，也称为PySpark，其API深受panda的影响。在功能方面，现代PySpark在典型的ETL和数据处理方面具有与Pandas相同的功能，例如groupby、聚合等等。

如何从 Pandas 迁移到 Spark？这 8 个问答解决你所有疑问

作者 | Sanket Gupta 译者 | 王强策划 | 刘燕本文最初发布于 Medium 网站，经原作者授权由 InfoQ 中文站翻译并分享。当你的数据集变得越来越大，迁移到 Spark 可以提高速度并节约时间。多数数据科学工作流程都是从 Pandas 开始的。 Pandas 是一个很棒的库，你可以用它做各种变换，可以处理各种类型的数据，例如 CSV 或 JSON 等。我喜欢 Pandas — 我还为它做了一个名为“为什么 Pandas 是新时代的 Excel”的播客。我仍然认为 Pandas

Pandas DataFrame创建方法大全

Pandas是Python的数据分析利器，DataFrame是Pandas进行数据分析的基本结构，可以把DataFrame视为一个二维数据表，每一行都表示一个数据记录。本文将介绍创建Pandas DataFrame的6种方法。

Pandas 学习手册中文第二版：1~5

欢迎来到《Pandas 学习手册》！在本书中，我们将进行一次探索我们学习 Pandas 的旅程，这是一种用于 Python 编程语言的开源数据分析库。 pandas 库提供了使用 Python 构建的高性能且易于使用的数据结构和分析工具。 pandas 从统计编程语言 R 中带给 Python 许多好处，特别是数据帧对象和 R 包（例如plyr和reshape2），并将它们放置在一个可在内部使用的 Python 库中。

用Python玩转Excel | 更快更高效处理Excel

前面我们介绍了xlrd、xlwt与openpyxl等第三方库操作Excel文件，但是这些第三方库依旧不够高效，无法替代Excel在数据处理方面的诸多功能，而Pandas这个第三方库可以完美解决上面提到的所有问题。

1. Pandas系列 - 基本数据结构

从这一篇文章开始，想要跟大家一起探讨关于数据科学最重要的工具了，就是Python提供了 Numpy 和 Pandas，咱们先从Pandas开始，走上数据分析高手之路hhhh

这么漂亮的图画，竟然是用NumPy画出来的？请跟我来，10行代码玩转NumPy！

NumPy也可以画图吗？当然！NumPy不仅可以画，还可以画得更好、画得更快！比如下面这幅画，只需要10行代码就可以画出来。若能整明白这10行代码，就意味着叩开了NumPy的大门。请打开你的Python IDLE，跟随我的脚步，一起来体验一下交互式编程的乐趣吧，看看如何用NumPy画图，以及用NumPy可以画出什么样的图画来。

Pandas 秘籍：1~5

本章的目的是通过彻底检查序列和数据帧数据结构来介绍 Pandas 的基础。对于 Pandas 用户来说，了解序列和数据帧的每个组件，并了解 Pandas 中的每一列数据正好具有一种数据类型，这一点至关重要。

从PlatEMO中提取真实PF前沿

从PlatEMO中提取真实PF前沿觉得有用的话,欢迎一起讨论相互学习~ 众所周知，我是Jmetal的重度爱好者，最近实验遇到一些难以解决的困难，当我在进行超多目标优化实验即MaOP时，需要M=10及以上的PF，然而在benchmark中没有提供，而且Jmetal不支持通过均匀取点的方式生成PF。因此，经过老师的指导，我们选择使用在PlatEMO中运行完相应目标数量的benchmark problem后，将通过均匀踩点得到的真实PF提取出来作为在Jmetal上进行实验的真实PF. 观察platEMO中PF

产生和加载数据集

read 函数不带参数使用时会一次读入文件的全部内容，因为会占用系统的内存，可以选择分块读入再进行拼接：

用python的pandas打开csv文件_如何使用Pandas DataFrame打开CSV文件 – python[通俗易懂]

message : UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte.

NumPy、Pandas中若干高效函数！

我们都知道，Numpy 是 Python 环境下的扩展程序库，支持大量的维度数组和矩阵运算；Pandas 也是 Python 环境下的数据操作和分析软件包，以及强大的数据分析库。二者在日常的数据分析中都发挥着重要作用，如果没有 Numpy 和 Pandas 的支持，数据分析将变得异常困难。但有时我们需要加快数据分析的速度，有什么办法可以帮助到我们吗？

盘一盘 Python 系列 4 - Pandas (上)

Pandas 是 Python 为解决数据分析而创建的，详情看官网 (https://pandas.pydata.org/)。在使用 pandas 之前，需要引进它，语法如下：

上手Pandas，带你玩转数据（1）-- 实例详解pandas数据结构

昨天写一个小项目的时候，想用pandas把数据写入到Excel中去，结果发现我原先写的那套pandas教程是真的垃圾啊。痛定思痛，我决定重写一份。

Pandas

Attitude is a little thing that makes a big difference.

【AI白身境】学AI必备的python基础

人生苦短，必须学好python！python现在火的程度已经不需要我多言了，它为什么为火，我认为有两个原因，第一是人工智能这个大背景，第二是它真的太容易学了，没有任何一门语言比它好上手，接下来我将和大家分享下python的基础操作。另外请注意，我的所有操作都是基于python3！

python numpy 的基础操作

e=np.array([['ding','mo'],['xiao','momo']])

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护航

在本文中，数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数，这些高效的函数会令数据分析更为容易、便捷。最后，读者也可以在 GitHub 项目中找到本文所用代码的 Jupyter Notebook。

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护

12 种高效 Numpy 和 Pandas 函数为你加速分析

Python一行命令生成数据分析报告

一般在python进行数据分析/统计分析时，第一步总是对数据进行一些描述性分析、相关性分析，但是总会是有一大堆代码，那么今天就介绍一个神器pandas_profiling，一行命令就能搞定大部分描述性分析！

Python与Excel协同应用初学者指南

本文将探讨学习如何在Python中读取和导入Excel文件，将数据写入这些电子表格，并找到最好的软件包来做这些事。

【小白必看】Python爬虫数据处理与可视化

Pandas图鉴(四)：MultiIndex

Polars[2]是Pandas最近的转世（用Rust编写，因此速度更快，它不再使用NumPy的引擎，但语法却非常相似，所以学习 Pandas 后对学习 Polars 帮助非常大。

Pandas数据探索分析，分享两个神器！

在使用 pandas 进行数据分析时，进行一定的数据探索性分析（EDA）是必不可少的一个步骤，例如常见统计指标计算、缺失值、重复值统计等。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐