开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python Pandas read_excel，不将整型转换为浮点型

Python Pandas是一个开源的数据分析和数据处理工具，read_excel是Pandas库中的一个函数，用于读取Excel文件中的数据并将其转换为DataFrame对象。

read_excel函数的语法如下：

pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds)

参数说明：

io：Excel文件的路径或文件对象。
sheet_name：要读取的工作表的名称或索引。默认为0，表示第一个工作表。
header：指定作为列名的行号。默认为0，表示第一行。
names：用于替换列名的列表。默认为None，使用Excel文件中的列名。
index_col：用作行索引的列号或列名。默认为None，不使用行索引。
usecols：要读取的列的列表。默认为None，读取所有列。
dtype：指定列的数据类型。默认为None，自动推断数据类型。
converters：用于将列数据转换为特定类型的字典。
true_values：将被视为True的值的列表。
false_values：将被视为False的值的列表。
skiprows：要跳过的行数列表或整数。默认为None，不跳过任何行。
nrows：要读取的行数。默认为None，读取所有行。
na_values：将被视为缺失值的值的列表。
parse_dates：将列解析为日期。默认为False，不解析日期。
thousands：千位分隔符。
comment：注释标记。
skipfooter：要跳过的尾部行数。默认为0，不跳过任何行。
convert_float：将整型转换为浮点型。默认为True，将整型转换为浮点型。
mangle_dupe_cols：是否修改重复的列名。默认为True，修改重复的列名。

read_excel函数的返回值是一个DataFrame对象，可以对该对象进行各种数据分析和处理操作。

Pandas库的优势包括：

灵活的数据处理能力：Pandas提供了丰富的数据处理和操作函数，可以方便地进行数据清洗、转换、合并、分组等操作。
强大的数据分析功能：Pandas支持高效的数据分析和统计计算，可以进行数据聚合、透视表生成、时间序列分析等。
与其他库的兼容性：Pandas可以与其他数据分析和可视化库（如NumPy、Matplotlib、Seaborn）无缝集成，提供更强大的数据分析和可视化能力。
大数据处理能力：Pandas可以处理大规模数据集，支持数据的分块读取和处理，提高了处理大数据的效率。

read_excel函数的应用场景包括：

数据导入和清洗：可以使用read_excel函数将Excel文件中的数据导入到DataFrame中，并进行数据清洗和预处理操作。
数据分析和统计：通过读取Excel文件中的数据，可以使用Pandas提供的各种数据分析和统计函数进行数据分析和统计计算。
数据可视化：读取Excel文件中的数据后，可以使用Pandas结合Matplotlib等库进行数据可视化，生成图表和报表。

腾讯云提供的相关产品和产品介绍链接地址如下：

腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云云数据库MySQL版：https://cloud.tencent.com/product/cdb_mysql
腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云人工智能：https://cloud.tencent.com/product/ai
腾讯云物联网平台：https://cloud.tencent.com/product/iotexplorer
腾讯云移动开发：https://cloud.tencent.com/product/mobile
腾讯云云函数（SCF）：https://cloud.tencent.com/product/scf
腾讯云区块链服务（BCS）：https://cloud.tencent.com/product/bcs
腾讯云游戏多媒体引擎（GME）：https://cloud.tencent.com/product/gme
腾讯云元宇宙：https://cloud.tencent.com/product/mu

请注意，以上链接仅供参考，具体产品选择应根据实际需求进行评估和决策。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

本文我们讨论 pandas 的内存使用，展示怎样简单地为数据列选择合适的数据类型，就能够减少 dataframe 近 90% 的内存占用。

05

Python数据分析之Pandas读写外部数据文件

数据分析、数据挖掘、可视化是Python的众多强项之一，但无论是这几项中的哪一项都必须以数据作为基础，数据通常都存储在外部文件中，例如txt、csv、excel、数据库。本篇中，我们来捋一捋Python中那些外部数据文件读取、写入的常用方法。

01

Python读书笔记（数字型数据）

Python与其它编程语言一样，常见的数字型无法整型（int）和浮点型两种（Float）两种。整型就是整数，浮点型就是小数。如果在Python中输入一个数字，则默认为10进制的，如何变为2进制、8

05

资源 | 23种Pandas核心操作，你需要过一遍吗？

Pandas 是基于 NumPy 构建的库，在数据处理方面可以把它理解为 NumPy 加强版，同时 Pandas 也是一项开源项目。它基于 Cython，因此读取与处理数据非常快，并且还能轻松处理浮点数据中的缺失数据（表示为 NaN）以及非浮点数据。在本文中，基本数据集操作主要介绍了 CSV 与 Excel 的读写方法，基本数据处理主要介绍了缺失值及特征抽取，最后的 DataFrame 操作则主要介绍了函数和排序等方法。

02

资源 | 23种Pandas核心操作，你需要过一遍吗？

Pandas 是基于 NumPy 构建的库，在数据处理方面可以把它理解为 NumPy 加强版，同时 Pandas 也是一项开源项目。它基于 Cython，因此读取与处理数据非常快，并且还能轻松处理浮点数据中的缺失数据（表示为 NaN）以及非浮点数据。在本文中，基本数据集操作主要介绍了 CSV 与 Excel 的读写方法，基本数据处理主要介绍了缺失值及特征抽取，最后的 DataFrame 操作则主要介绍了函数和排序等方法。

02

资源 | 23种Pandas核心操作，你需要过一遍吗？

Pandas 是基于 NumPy 构建的库，在数据处理方面可以把它理解为 NumPy 加强版，同时 Pandas 也是一项开源项目。它基于 Cython，因此读取与处理数据非常快，并且还能轻松处理浮点数据中的缺失数据（表示为 NaN）以及非浮点数据。在本文中，基本数据集操作主要介绍了 CSV 与 Excel 的读写方法，基本数据处理主要介绍了缺失值及特征抽取，最后的 DataFrame 操作则主要介绍了函数和排序等方法。

04

python读取与写入csv EXCEK HDF 文件

一. 数据文件 pd指pandas简称，df指DataFrame对象。 1. csv 读取 pd.read_csv('foo.csv') 写入 df.to_csv('foo.csv') 2. HDF5 读取 pd.read_hdf('foo.h5', 'df') 写入 df.to_hdf('foo.h5', 'df') 3. Excel 读取 pd.read_excel('foo.xlsx', 'sheet1', index_col=None, na_values=['NA'])

04

python读取与写入csv EXCEK HDF 文件

一. 数据文件 pd指pandas简称，df指DataFrame对象。 1. csv 读取 pd.read_csv('foo.csv') 写入 df.to_csv('foo.csv') 2. HDF5 读取 pd.read_hdf('foo.h5', 'df') 写入 df.to_hdf('foo.h5', 'df') 3. Excel 读取 pd.read_excel('foo.xlsx', 'sheet1', index_col=None, na_values=['NA']) 写入 df.to_excel('foo.xlsx', sheet_name='sheet1') 二. 数据结构 1. Series Series是一维标记数组，可以存储任意数据类型，如整型、字符串、浮点型和Python对象等，轴标一般指索引。创建Series的方法为 >>>s=Series(data, index=index) data可以是Python词典、ndarray和标量值。 2. DataFrame DataFrame是二维标记数据结构，列可以是不同的数据类型。它是最常用的pandas对象，像Series一样可以接收多种输入：lists、dicts、series和DataFrame等。初始化对象时，除了数据还可以传index和columns这两个参数。 3. Panel Panel很少使用，然而是很重要的三维数据容器。Panel data源于经济学，也是pan(el)-da(ta)-s的来源。在交叉分析中，坐标轴的名称略显随意 items: axis 0 代表DataFrame的item major_axis: axis 1 代表DataFrames的index(行) minor_axis: axis 2 代表DataFrames的列 4. Panel4D Panel4D是像Panel一样的4维容器，作为N维容器的一个测试。 labels: axis 0 每个item相当于panel items: axis 1 每个item相当于DataFrame major_axis: axis 2 它是dataframe的index minor_axis: axis 3 它是dataframe的columns Panel4D是Panel的一个子集，因此Panel的大多数方法可用于4D，但以下方法不可用：join, to_excel, to_frame, to_sparse, groupby。 5. PanelND PanelND是一个拥有factory集合，可以创建像Panel4D一样N维命名容器的模块。

03

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

04

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

03

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

01

一文带你快速入门Python | 初识Pandas

这是Python数据分析实战基础的第一篇内容，主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学，可以加快手速滑动浏览或者直接略过本文。

00

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

03

Python数据分析实战基础 | 初识Pandas

这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像自己什么都会了一点，然而实际操作起来既不知从何操起，又漏洞百出。

02

Python黑帽编程2.2 数值类型

Python黑帽编程2.2 数值类型数值类型，说白了就是处理各种各样的数字，Python中的数值类型包括整型、长整型、布尔、双精度浮点、十进制浮点和复数，这些类型在很多方面与传统的C类型有很大的区别。 Python中的数值类型都是不可变类型，意味着创建、修改数字的值，都会产生新的对象，当然这是幕后的操作，编程过程中大可不必理会。 2.2.1 标准整型和长整型标准整型等价于C中的有符号长整型（long），与系统的最大整型一致（如32位机器上的整型是32位，64位机器上的整型是64位），可以表示的整数范围

09

Python学习(5)：基本数据类型之Number

Number.png Number类型的要点： Python3相对于Python2增加了布尔类型，而且去除了Python的Long类型。 Number是不可改变的数据类型，这意味着改变数字，数据类型会分配一个新的对象。一、整型 Python3中的整型包括正或负整数，区别于其他语言的是：其他语言中的整型细分为：短整型(short) 、整型(int)、长整型(long) 不同进制数字表示：表示二进制：数字前加"ob"，比如表示十进制2：”0b10" 表示八进制：数字前加"0o"，比如表示十进制8：

08

手把手教你做一个“渣”数据师，用Python代替老情人Excel

现在，要成为一个合格的数据分析师，你说你不会Python，大概率会被江湖人士耻笑。

03

python学习3-python变量以及

Python2.7 (r27:82500, Jul 28 2016, 02:42:00)

01

Pandas 高性能优化小技巧

Pandas 对于Pythoner的搞数据分析的来说是常用的数据操作库，对于很多刚接触Pandas的人来说会发现它是一个很方便而且好用的库，它提供了各种数据变化、查询和操作，它的dataframe数据结构和R语言、Spark的dataframe的API基本一样，因此上手起来也非常简单。但是很多新手在使用过程中会发现pandas的dataframe的性能并不是很高，而且有时候占用大量内存，并且总喜欢将罪名归于Python身上(lll￢ω￢)，今天我这里给大家总结了在使用Pandas的一些技巧和代码优化方法。

02

【二】Python基础之数据类型：数字

Python 数字数据类型用于存储数值。数据类型是不允许改变的,这就意味着如果改变数字数据类型的值，将重新分配内存空间。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭