pandas是基于numpy的一种工具,该工具是为解决数据分析任务而创建的。
pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量快速便捷地处理数据的函数和方法
它是数据分析的核心库之一,广泛应用于数据清洗、数据转换、数据探索和数据可视化等领域
【pandas安装】
pip install pandas
安装完成以后,使用如下命令可查看pandas是否已安装成功
pip show pandas
显示如下信息表明pandas成功安装
【Series】
Series是Pandas中的一个核心数据结构,它类似于一维数组,但又比一维数组更为灵活和强大。
Series是一种一维数据,是由一行一行的数据构成的,每条数据分为数据和索引两个部分
数据(Values):用于保存任何数据类型的数据
索引(Index):索引用于对数据进行标记,类似于Excel中的行号或列标签
【创建Series】
在Pandas中,创建Series的方法主要有两种:通过数组创建和通过字典创建。
1.通过数组创建Series
import pandas as pd
a = pd.Series([100, 200, 300, 500, 600])
print(a)
因为没有索引,所以索引是默认从0开始的整数
如果想要指定索引的值,可以在创建Series时,通过index这个参数来实现。
import pandas as pd
a = pd.Series([100, 200, 300, 500, 600], index=['a', 'b', 'c', 'd', 'e'])
print(a)
2.通过字典创建Series
在Python中,字典的键和值的关系与Series的索引和数据的关系类似,因此也可以通过字典来生成Series。
字典的键会作为Series的索引,字典的值会作为Series的数据。
import pandas as pd
b = {'a': 100, 'b': 200, 'c': 300}
a = pd.Series(b)
print(a)
以上两种方法都可以用来创建Pandas的Series数据结构。实际应用中,可以根据自己的需求和数据的特点来选择合适的方法。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。