如何检测pandas中哪个astype标头转换失败？ - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

（数据科学学习手札73）盘点pandas 1.0.0中的新特性

一文搞懂HTTPProxy丨含基础、高级路由、服务韧性

题图摄于北京奥利匹克中心【编者推荐】本文选自马哥教育 CEO 马永亮老师撰写的《Kubernetes进阶实战（第2版）》，第十三章 13.3.3-13.3.5 节。马老师曾经到我司给云原生开发人员讲授 Kubernetes 的课程，讲解内容细致入微、条理清晰，受到学员一致好评。文末赠书活动，欢迎参加。《Kubernetes进阶实战（第2版）》新增与重写多种知识点，基于 Kubernetes v1.19 与 v1.20 讲解新特性，值得推荐给大家。感兴趣的读者可参加文末赠书活动，或直接购买。 Cont

左手用R右手Python系列——因子变量与分类重编码

今天这篇介绍数据类型中因子变量的运用在R语言和Python中的实现。因子变量是数据结构中用于描述分类事物的一类重要变量。其在现实生活中对应着大量具有实际意义的分类事物。比如年龄段、性别、职位、爱好，星座等。之所以给其单独列出一个篇幅进行讲解，除了其在数据结构中的特殊地位之外，在数据可视化和数据分析与建模过程中，因子变量往往也承担中描述某一事物重要维度特征的作用，其意义非同寻常，无论是在数据处理过程中还是后期的分析与建模，都不容忽视。通常意义上，按照其所描述的维度实际意义，因子变量一般又可细分为无序因

13个Pandas奇技淫巧

先按Mt列进行分组，然后对分组之后的数据框使用idxmax函数取出Count最大值所在的列，再用iloc位置索引将行取出。有重复值的情况

【小白必看】Python爬虫数据处理与可视化

如何筛选和过滤ARWU网站上的大学排名数据

ARWU网站（ShanghaiRanking's Academic Ranking of World Universities）是一个公认的全球大学排名的先驱和最值得信赖的大学排名之一。它每年发布世界前1000所研究型大学的排名，基于透明的方法论和客观的第三方数据。ARWU网站上的大学排名数据可以为高考考生、专业选择、就业指导、行业发展等提供有价值的参考信息。

Pandas 25 式

原文的数据集是 bit.ly 短网址的，我这里在读取时出问题，不稳定，就帮大家下载下来，统一放到了 data 目录里。

将文本/字符串转换成数字，看pandas是如何清理数据的

本文研讨将字符串转换为数字的两个pandas内置方法，以及当这两种方法单独不起作用时，如何处理一些特殊情况。

pandas datetime与时间戳互相转换，字符串转换datetime

to_datetime 如果传入的是10位时间戳，unit设置为秒，可以转换为datetime

6个pandas新手容易犯的错误

我们在这里讨论6个新手容易犯的错误，这些错误与你所使用工具的API或语法无关，而是与你的知识和经验水平直接相关。在实际中如果出现了这些问题可能不会有任何的错误提示，但是在应用中却会给我们带来很大的麻烦。

一场pandas与SQL的巅峰大战（二）

上一篇文章一场pandas与SQL的巅峰大战中，我们对比了pandas与SQL常见的一些操作，我们的例子虽然是以MySQL为基础的，但换作其他的数据库软件，也一样适用。工作中除了MySQL，也经常会使用Hive SQL，相比之下，后者有更为强大和丰富的函数。本文将延续上一篇文章的风格和思路，继续对比Pandas与SQL，一方面是对上文的补充，另一方面也继续深入学习一下两种工具。方便起见，本文采用hive环境运行SQL，使用jupyter lab运行pandas。关于hive的安装和配置，我在之前的文章MacOS 下hive的安装与配置提到过，不过仅限于mac版本，供参考，如果你觉得比较困难，可以考虑使用postgreSQL，它比MySQL支持更多的函数(不过代码可能需要进行一定的改动)。而jupyter lab和jupyter notebook功能相同，界面相似，完全可以用notebook代替，我在Jupyter notebook使用技巧大全一文的最后有提到过二者的差别，感兴趣可以点击蓝字阅读。希望本文可以帮助各位读者在工作中进行pandas和Hive SQL的快速转换。本文涉及的部分hive 函数我在之前也有总结过，可以参考常用Hive函数的学习和总结。

Pandas图鉴(二)：Series 和 Index

Pandas[1]是用Python分析数据的工业标准。只需敲几下键盘，就可以加载、过滤、重组和可视化数千兆字节的异质信息。它建立在NumPy库的基础上，借用了它的许多概念和语法约定，所以如果你对NumPy很熟悉，你会发现Pandas是一个相当熟悉的工具。即使你从未听说过NumPy，Pandas也可以让你在几乎没有编程背景的情况下轻松拿捏数据分析问题。

pandas每天一题-题目6：文本转数值

这是一个关于 pandas 从基础到进阶的练习题系列，来源于 github 上的 guipsamora/pandas_exercises 。这个项目从基础到进阶，可以检验你有多么了解 pandas。

python强制类型转换astype

在进行将多个表的数据合并到一个表后，发现输出到EXCEL表的数据发生错误，数值型数据末尾都变成了0。这是因为excel数据超过11位,自动以科学计数法显示,其最大处理精度为15位,超过15位,以后数字自动变0。找了一些解决方法，发现用.astype(‘数据类型’)还是挺方便的。我在输出时，将数值型的数据（int)转化成了字符串(str)。

【新星计划】【数据清洗】pandas库清洗数据的七种方式

我们在处理真实的数据时，往往会有很多缺少的的特征数据，就是所谓的空值，必须要进行处理才能进行下一步分析

Pandas中文官档~基础用法6

大多数情况下，pandas 使用 Numpy 数组、Series 或 DataFrame 里某列的数据类型。Numpy 支持 float、int、bool、timedelta[ns]、datetime64[ns]，注意，Numpy 不支持带时区信息的 datetime。

不写爬虫，也能读取网页的表格数据

pandas中的read_html()函数是将HTML的表格转换为DataFrame的一种快速方便的方法，这个函数对于快速合并来自不同网页上的表格非常有用。在合并时，不需要用爬虫获取站点的HTML。但是，在分析数据之前，数据的清理和格式化可能会遇到一些问题。在本文中，我将讨论如何使用pandas的read_html()来读取和清理来自维基百科的多个HTML表格，以便对它们做进一步的数值分析。

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

Kevin Markham，数据科学讲师，2002 年，毕业于范德堡大学，计算机工程学士，2014 年，创建了 Data School，在线教授 Python 数据科学课程，他的课程主要包括 Pandas、Scikit-learn、Kaggle 竞赛数据科学、机器学习、自然语言处理等内容，迄今为止，浏览量在油管上已经超过 500 万次。

Datatable：Python数据分析提速高手，飞一般的感觉！

1 前言 Datatable是一个Python库：详细介绍大家可以去官网查看： https://datatable.readthedocs.io/en/latest/?badge=latest D

数据分析篇 | Pandas基础用法6【完结篇】

Pandas 中三个对列转换的小操作

现在我们想要将 name 列划分成两个列，其中一个列为 first_name，另外一个列为 last_name。比如：John Hunter，他的 first_name 为 John，last_name 为 Hunter。

Python数据分析--Pandas知识

利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID.

Pandas全景透视：解锁数据科学的黄金钥匙

当许多人开始踏足数据分析领域时，他们常常会对选择何种工具感到迷茫。在这个充满各种选项的时代，为什么会有这么多人选择 Pandas 作为他们的数据分析工具呢？这个问题似乎简单，但背后涉及了许多关键因素。在探究这个问题之前，让我们先理解一下 Pandas 的背景和特点。

【原创干货】6000字、22个案例详解Pandas数据分析/预处理时的实用技巧，超简单

上两篇原创的文章，小编主要是讲了数据可视化方面的内容，但是好像看得人不是很多的样子(搞得小编心里拔凉拔凉的....)

软件测试|数据处理神器pandas教程（十五）

在数据处理和分析中，重复数据是一个常见的问题。为了确保数据的准确性和一致性，我们需要对数据进行去重操作。Pandas提供了一个功能强大的去重函数——drop_duplicates()，它可以帮助我们轻松地处理数据中的重复值。本文将详细介绍drop_duplicates()函数的用法和应用场景。

python报错: 'list' object has no attribute 'shape'的解决

补充知识：Pandas使用DataFrame出现错误：AttributeError: ‘list’ object has no attribute ‘astype’

Python-科学计算-pandas-04-统计数据

系统：Windows 7 语言版本：Anaconda3-4.3.0.1-Windows-x86_64 编辑器：pycharm-community-2016.3.2

奇妙问题集 # 地理“经纬度”数据的4种 Python 转换方法！

关于“度、分、秒”的印象，我还是停留在初、高中的印象，因为那个时候学习过他们之间的数学转换。今天突然被问及，因此我将其整理出来，供大家学习。

盘点一个Pandas多列分组问题

大家好，我是皮皮。一、前言前几天在Python白银交流群【在途中要勤奋的熏肉肉🤪】问了一道Pandas处理的问题，如下图所示。 📷 原始数据如下图所示： 📷 下面是她自己写的代码： # df['name'] = df['name'].str.lower() test['pid'] = test['pid'].astype(int) test['arr0'] = test['arr0'].astype(str) test['arr1'] = test['arr1'].astype(str) test[

Pandas使用技巧：如何将运行内存占用降低90%！

当使用 pandas 操作小规模数据（低于 100 MB）时，性能一般不是问题。而当面对更大规模的数据（100 MB 到数 GB）时，性能问题会让运行时间变得更漫长，而且会因为内存不足导致运行完全失败。

利用 pandas 和 xarray 整理气象站点数据

平时用 xarray 库在处理 nc 格式的数据非常方便，但偶尔还是要用到一些站点数据来辅助分析，而站点数据一般都是用文本文件存储的，比如下图这种格式，从外到内的坐标依次是：年、月、站点、日

Pandas在Python面试中的应用与实战演练

Pandas作为Python数据分析与数据科学领域的核心库，其熟练应用程度是面试官评价候选者专业能力的重要依据。本篇博客将深入浅出地探讨Python面试中与Pandas相关的常见问题、易错点，以及如何避免这些问题，同时附上代码示例以供参考。

利用 pandas 和 xarray 整理气象站点数据

Pandas库常用方法、函数集合

Pandas是Python数据分析处理的核心第三方库，它使用二维数组形式，类似Excel表格，并封装了很多实用的函数方法，让你可以轻松地对数据集进行各种操作。

洞悉客户心声：Pandas标签帮你透视客户，标签化营销如虎添翼

在构建高效的数据分析体系时，我们经常会遇到两个核心概念：指标（Metrics）和标签（Tags）。指标是对业务性能的量化衡量，它们帮助我们追踪关键业务目标的达成情况。例如，我们可能会关注用户增长率、产品销售额或客户的增续投等指标。这些数字目标为我们提供了业务运行的直观快照，并允许我们对成功与否进行量化评估。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐