首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python下Pandas中DataFrame基本操作(二),DataFrame、dict、array构造简析

DataFrame简介:   DataFrame是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(Rdata.frame),DataFrame中面向行和面向操作基本上是平衡。...:列表或数组赋值给某个时,其长度必须跟DataFrame长度相匹配!!..."b" : b}#列表a,b转换成字典 data=DataFrame(c)#字典转换成为数据框 print(data) 输出结果为 a b 0 1 5 1 2 6 2 3...7 3 4 8 第二种:包含不同子列表列表转换为数据框 from pandas.core.frame import DataFrame a=[[1,2,3,4],[5,6,7,8]]#包含两个不同子列表

4.3K30
您找到你想要的搜索结果了吗?
是的
没有找到

【精心解读】用pandas处理大数据——节省90%内存消耗小贴士

Dataframe对象内部表示 在底层,pandas会按照数据类型分组形成数据块(blocks)。...每当我们查询、编辑或删除数据时,dataframe类会利用BlockManager类接口将我们请求转换为函数和方法调用。...这对我们原始dataframe影响有限,这是由于它只包含很少整型。 同理,我们再对浮点型进行相应处理: 我们可以看到所有的浮点型都从float64换为float32,内存用量减少50%。...dtype参数接受一个以列名(string型)为键字典、以Numpy类型对象为值字典。 首先,我们每一目标类型存储在以列名为键字典中,开始前先删除日期,因为它需要分开单独处理。...总结 我们学习了pandas如何存储不同数据类型,并利用学到知识将我们pandas dataframe内存用量降低了近90%,仅仅只用了一点简单技巧: 数值型降级到更高效类型 字符串列转换为类别类型

8.6K50

python数据科学系列:pandas入门详细教程

,仅支持一维和二维数据,但数据内部可以是异构数据,仅要求同数据类型一致即可 numpy数据结构仅支持数字索引,而pandas数据结构则同时支持数字索引和标签索引 从功能定位上看: numpy虽然也支持字符串其他数据类型...考虑series和dataframe兼具numpy数组和字典特性,那么就不难理解二者以下属性: ndim/shape/dtypes/size/T,分别表示了数据维数、形状、数据类型和元素个数以及置结果...前者是已有的一信息设置为标签,而后者是原标签归为数据,并重置为默认数字标签 set_axis,设置标签,一次只能设置一信息,与rename功能相近,但接收参数为一个序列更改全部标签信息(...例如,当标签类型(可通过df.index.dtype查看)为时间类型时,若使用无法隐式转换为时间字符串作为索引切片,则引发报错 ? 切片形式返回行查询,且为范围查询 ?...时间类型向量化操作,字符串一样,在pandas中另一个得到"优待"数据类型是时间类型,正如字符串列可用str属性调用字符串接口一样,时间类型可用dt属性调用相应接口,这在处理时间类型时会十分有效。

13.8K20

Python数据分析数据导入和导出

可以是标量、字符串、列表或字典。 parse_dates:指定是否解析日期。默认为False。 date_parser:指定用于解析日期函数。默认为None。...parse_float:可选,一个函数,用于解析浮点数转换为自定义Python对象。默认为None。 parse_int:可选,一个函数,用于解析整数转换为自定义Python对象。...object_pairs_hook:可选,一个函数,用于解析JSON键值对转换为自定义Python对象。默认为None。 **kw:可选,一些其他参数,用于控制解析过程细节。...JSON文件可以包含不同类型数据,字符串、数字、布尔值、列表、字典等。 解析后Python对象类型根据JSON文件中数据类型进行推断。...CSV文件是一种常用文本文件格式,用于存储表格数据。该函数可以DataFrame对象数据保存为CSV文件,以便后续可以通过其他程序或工具进行读取和处理。

14510

十分钟入门 Pandas

series字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行和); 可对行和执行算术运算; Panel 定义 三维,大小可变数组...)) # 9、T,置 print('T:\n', dataFrame.T) # 10、shape,返回表示DataFrame维度元祖 print('shape:\n', dataFrame.shape...""" # 1、lower() Series/Index中字符串换为小写。...# 2、upper() Series/Index中字符串换为大写。 # 3、len() 计算字符串长度。 # 4、strip() 帮助从两侧系列/索引中每个字符串中删除空格(包括换行符)。...# 9、replace(a,b) 值a替换为值b。 # 10、repeat(value) 重复每个元素指定次数。 # 11、count(pattern) 返回模式中每个元素出现总数。

3.7K30

十分钟入门Pandas

字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行和); 可对行和执行算术运算; Panel 定义 三维,大小可变数组; 关键点...)) # 9、T,置 print('T:\n', dataFrame.T) # 10、shape,返回表示DataFrame维度元祖 print('shape:\n', dataFrame.shape...""" # 1、lower() Series/Index中字符串换为小写。...# 2、upper() Series/Index中字符串换为大写。 # 3、len() 计算字符串长度。 # 4、strip() 帮助从两侧系列/索引中每个字符串中删除空格(包括换行符)。...# 9、replace(a,b) 值a替换为值b。 # 10、repeat(value) 重复每个元素指定次数。 # 11、count(pattern) 返回模式中每个元素出现总数。

4K30

Pandas全景透视:解锁数据科学黄金钥匙

优化数据结构:Pandas提供了几种高效数据结构,DataFrame和Series,它们是为了优化数值计算和数据操作而设计。这些数据结构在内存中以连续块方式存储数据,有助于提高数据访问速度。...DataFrame就是Series,Series可以转化为DataFrame,调用方法函数to_frame()即可 Series 是 pandas 中一种数据结构,可以看作是带有标签一维数组。...值(Values): 值是 Series 中存储实际数据,可以是任何数据类型,整数、浮点数、字符串等。...底层使用C语言:Pandas许多内部操作都是用Cython或C语言编写,Cython是一种Python超集,它允许Python代码转换为C语言代码,从而提高执行效率。...2, 3, 4])# 使用 astype() 方法 Series 数据类型转换为字符串类型s_str = s.astype(str)print("转换数据类型后 Series:")print(s_str

8910

python数据分析——数据分类汇总与统计

关键技术:对于由DataFrame产生GroupBy对象,如果用一个(单个字符串)或一组(字符串数组)列名对其进行索引,就能实现选取部分列进行聚合目的。...使用函数分组 比起使用字典或Series,使用Python函数是一种更原生方法定义分组映射。 【例6】以上一小节DataFrame为例,使用len函数计算一个字符串长度,并用其进行分组。...程序代码如下所示: people.groupby(len).sum() 函数跟数组、列表、字典、Series混合使用也不是问题,因为任何东西在内部都会被转换为数组 key_list = ['one',...具体办法是向agg传入一个从列名映射到函数字典: 只有多个函数应用到至少一时,DataFrame才会拥有层次化 2.3.返回不含行索引聚合数据 到目前为止,所有例中聚合数据都有由唯一分组键组成索引...; index=用于分组列名或其他分组键,出现在结果透视表行; columns =用于分组列名或其他分组键,出现在结果透视表; values = 待聚合名称,默认聚合所有数值;

15410

Python 学习小笔记

: a="string"; a=a*2; print(a) 就会输出stringstring python中字符串格式化用法和C中一样 end end一般用于print语句中,用于结果输出到同一行...对整个dataframe进行groupby,然后访问Amean() >>>data.groupby(['B'])['A'].mean() dataframe中axis意义 这里有一篇博客说很详细...data.loc[data[‘Age’]50,‘Survived’]=1 #所有年龄为50岁乘客存活情况设置为1(行条件为Age50,条件为标签是Survived) 如果要修改筛选出来数据...1,‘b’]=3 标签为b第2行数据替换为3 >>>data[data.age.isnull(),‘Age’]=34 标签为Age空数据全部替换为34 >>>data[data.Survived...==1] 显示所有符合data.Survived值是1数据(包括其他属性) 替换数据 方法DataFrame.replace(to_replace=None, value=None, inplace

96530

Pandas 25 式

目录 查看 pandas 及其支持项版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...操控缺失值 把字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...创建 DataFrame 创建 DataFrame 方式有很多,比如,可以把字典传递给 DataFrame 构建器,字典 Key 是列名,字典 Value 为列表,是 DataFrame 值...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串换为数值 再创建一个新 DataFrame 示例。 ?...年龄列有 1 位小数,票价列有 4 位小数,如何这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

8.4K00

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

目录 查看 pandas 及其支持项版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...操控缺失值 把字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...创建 DataFrame 创建 DataFrame 方式有很多,比如,可以把字典传递给 DataFrame 构建器,字典 Key 是列名,字典 Value 为列表,是 DataFrame 值...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串换为数值 再创建一个新 DataFrame 示例。 ?...年龄列有 1 位小数,票价列有 4 位小数,如何这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

7.1K20

Pandas知识点-Series数据结构介绍

因为数据是一维(只有一),所以Series只有行索引,没有索引。 ? Series由行索引和数据组成。如果数据行数很多,会自动数据折叠,中间显示为“...”。...取出DataFrame任意一(或任意一行,行用iloc获取,df.iloc[0]),其数据类型都是Series,说明DataFrame是由Series构成。...传入DataFrame数据时,可以传入一个字典,每个键值对是一数据,key是索引,value是中保存数据,每个value都是一个Series数据,如上面的df1,这也再次说明DataFrame...) s2 = s.T print("置后形状:", s2.shape) 形状:(4726,) 置后形状:(4726,) 需要注意是,Series置之后形状与置之前是一样,这是因为Series...以上就是Pandas中Series数据结构基本介绍。Series与DataFrame很多方法是一样使用head()和tail()来显示前n行或后n行。

2.2K30

时间序列数据处理,不再使用pandas

DarTS GluonTS Pandas DataFrame是许多数据科学家基础。学习简单方法是将其转换为其他数据格式,然后再转换回来。本文还将介绍长格式和宽格式数据,并讨论库之间转换。..."Date" 转换为 Pandas 中日期格式是十分关键,因为其他库通常需要日期字段采用 Pandas 数据时间格式。... (ds:143, component:1, sample:1) 所示,每周有 143 周、1 和 1 个样本。...Gluonts数据集是Python字典格式时间序列列表。可以长式Pandas数据框转换为Gluonts。...图(3)中宽格式商店销售额转换一下。数据帧中每一都是带有时间索引 Pandas 序列,并且每个 Pandas 序列将被转换为 Pandas 字典格式。

10710

1w 字 pandas 核心操作知识大全。

]) # 对不同执行不同计算 df.agg({"salary":np.sum,"score":np.mean}) 时间格式转换 # 时间戳时间字符串 df_jj2['cTime'] =df_jj2...pd.DataFrame(dict) # 从字典中,列名称键,列表中数据值 导出数据 df.to_csv(filename) # 写入CSV文件 df.to_excel(filename) #...# 用均值替换所有空值(均值可以用统计模块中几乎所有函数替换 ) s.astype(float) # 系列数据类型转换为float s.replace...how='inner') # SQL样式 df1 与 df2 行所在col 具有相同值连接起来。'...4) 11.replace 指定位置字符,替换为给定字符串 df["身高"].str.replace(":","-") 12.replace 指定位置字符,替换为给定字符串(接受正则表达式

14.8K30
领券