首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas库简单介绍(3)

4 pandas基本功能 4.1 重建索引(见上一篇文章) 4.2 数据选择 pandas数据选择是十分重要一个操作,它操作数组类似,但是pandas数据选择数组不同。...数据选择方法:1、直接选择;2、使用loc选择数据;3、使用iloc选择数据。 直接选择中,frame[[列名列名]]表示选择,frame[:3]表示选择行。...loc是根据轴标签进行选择,frame[行标签1,[列名列名]]。 iloc是根据整数标签进行选择,frame[:1,[1,2]]选择第一行第一、二。...DataFrame中选择单列或多或行(整数表示选择行) df.loc[val] 根据标签选择单行或多行 df.loc[:, val] 根据标签选择单列或多 df.loc[val1, val2] 根据标签同时选中行一部分...df.iloc[where] 根据整数选择一行或多行 df.iloc[:, where] 根据整数选择或多 df.iloc[where_i, where_i] 根据整数选择行和 df.at[label_i

1.2K10

python数据科学系列:pandas入门详细教程

支持一维和二维数据,但数据内部可以是异构数据,要求同数据类型一致即可 numpy数据结构支持数字索引,而pandas数据结构则同时支持数字索引和标签索引 从功能定位上看: numpy虽然也支持字符串等其他数据类型...自然毫无悬念 dataframe:无法访问单个元素,只能返回一、多或多行:单或多值(多个列名组成列表)访问时按进行查询,单访问不存在列名歧义时还可直接用属性符号" ....isin/notin,条件范围查询,即根据特定是否存在于指定列表返回相应结果 where,仍然是执行条件查询,但会返回全部结果,只是将不满足匹配条件结果赋值为NaN或其他指定,可用于筛选或屏蔽...,要求每个df内部列名是唯一,但两个df间可以重复,毕竟有相同才有拼接实际意义) merge,完全类似于SQL中join语法,支持横向拼接,通过设置连接字段,实现对同一记录不同信息连接,支持...不过,pandas绘图中集成了常用图表接口,更多复杂绘图需求往往还需依赖matplotlib或者其他可视化库。

13.8K20
您找到你想要的搜索结果了吗?
是的
没有找到

python之pandas数据筛选和csv操作

[df['a']>30] # 如果想筛选a取值大于30记录,但是之显示满足条件b,c可以这么写 df[['b','c']][df['a']>30] # 使用isin函数根据特定筛选记录。...筛选a等于30或者54记录 df[df.a.isin([30, 54])] (2)多条件筛选   可以使用&(并)| (或)操作符或者特定函数实现多条件筛选 # 使用&筛选a取值大于30,b...切片操作   df[行索引,索引]或df[[列名1,列名2]] #使用切片操作选择特定df[1:4] #传入列名选择特定 df[['a','c']] b. loc函数   当每已有column...c 1 6 10 3 18 22 5 30 34 e. at函数   根据指定行index及label,快速定位DataFrame元素,选择支持列名。...(df.loc[df['Part Number'].astype(int).isin(li),:]) #行中匹配某个模式 print(df[df['Invoice Number'].str.startswith

2.5K10

python df 替换_如何用Python做数据分析,没有比这篇文章更详细了(图文详情)...

“定位条件”在“开始”目录下“查找和选择”目录中。  查看空  Isnull 是 Python 中检验空函数,返回结果是逻辑,包含空返回 True,不包含则返回 False。...1#使用数字 0 填充数据表中空  2df.fillna(value=0)  我们选择填充方式来处理空,使用 price 均值来填充 NA 字段,同样使用 fillna 函数,在要填充数值中使用...1#其他数据表匹配模式  2df_left=pd.merge(df,df1,how='left')  3df_right=pd.merge(df,df1,how='right')  4df_outer=...1#对 category 字段依次进行分列,并创建数据表,索引df_inner 索引列名称为 category 和 size  2pd.DataFrame((x.split('-') for...下面代码中行位置按索引日期设置,按位置设置。

4.4K00

Pandas merge用法解析(用Excel数据为例子)

可以是列名,索引级名称,也可以是长度等于DataFrame长度数组。 right_on: 左侧DataFrame中或索引级别用作键。...对于具有MultiIndex(分层)DataFrame,级别数必须右侧DataFrame中连接键数相匹配。 right_index: left_index功能相似。...outer’取并集,出现A会进行一一匹配,没有同时出现会将缺失部分添加缺失。 sort: 按字典顺序通过连接键对结果DataFrame进行排序。..._merge是分类类型,并且对于其合并键出现在“左”DataFrame中观察,取得为left_only,对于其合并键出现在“右”DataFrame中观察为right_only,并且如果在两者中都找到观察点合并键...(df1,df2,how='inner') 如果是用 how=’inner’,是取交集 则可以看到【2019010 鸠摩智】【2019011 丁春秋】两个数据丢失了 vlookup_data=

1.6K20

pandas merge left_并集和交集区别图解

可以是列名,索引级名称,也可以是长度等于DataFrame长度数组。 right_on: 左侧DataFrame中或索引级别用作键。...可以是列名,索引级名称,也可以是长度等于DataFrame长度数组。 left_index: 如果为True,则使用左侧DataFrame中索引(行标签)作为其连接键。...对于具有MultiIndex(分层)DataFrame,级别数必须右侧DataFrame中连接键数相匹配。 right_index: left_index功能相似。...outer’取并集,出现A会进行一一匹配,没有同时出现会将缺失部分添加缺失。 sort: 按字典顺序通过连接键对结果DataFrame进行排序。..._merge是分类类型,并且对于其合并键出现在“左”DataFrame中观察,取得为left_only,对于其合并键出现在“右”DataFrame中观察为right_only,并且如果在两者中都找到观察点合并键

93220

对比Excel,Python pandas删除数据框架中

标签:PythonExcel,pandas 删除也是Excel中常用操作之一,可以通过功能区或者快捷菜单中命令或者快捷键来实现。...上一篇文章,我们讲解了Python pandas删除数据框架中行一些方法,删除之类似。然而,这里想介绍一些新方法。取决于实际情况,正确地使用一种方法可能比另一种更好。...唯一区别是,在该方法中,我们需要指定参数axis=1。下面是.drop()方法一些说明: 要删除单列:传入列名(字符串)。 删除多:传入要删除名称列表。...实际上我们没有删除,而是创建了一个新数据框架,其中只包含用户姓名、城市和性别,有效地“删除”了其他。然后,我们将新创建数据框架赋值给原始数据框架以完成“删除操作”。注意代码中双方括号。...重赋值 当数据框架只有几列时效果最好;或者数据框架有很多,但我们只保留一些。 如果我们需要保留许多,必须键入计划保留所有列名称,这可能需要大量键入。

7.1K20

Pandas实现简单筛选数据功能

一、简述 pythonpandas库可以轻松处理excel中比较难实现筛选功能,以下简单介绍几种利用pandas实现筛选功能方式: 二、模块介绍 pandas——专为解决数据分析处理任务而创建...'' 多条件匹配时 自定义函数data_many data_many=df[(df['列名1']== ‘1’)&(df['列名2']==‘2’)] 多值匹配时 data_many="...是不是很像SQL语句:select * from id where name in (‘1’,‘2’,‘3’) 3.2 模式匹配中开头是某,中间包含某模式匹配法,可能在Excel中实现比较困难...自定义函数获取返回函数值——cond 开头包含某模式匹配 cond=df['列名'].str.startswith('') 中间包含某模式匹配 cond=df['列名'].str.contains...('') 3.3 范围区间筛选 筛选出基于两个之间数据: 自定义函数cond cond=df[(df['列名1']>‘1’)&(df['列名1']<‘2’)] 返回列名1介于1和

1.4K10

【Python】详解pandas库中pd.merge函数代码示例

可以是列名,索引级名称,也可以是长度等于DataFrame长度数组。 right_on: 左侧DataFrame中或索引级别用作键。...对于具有MultiIndex(分层)DataFrame,级别数必须右侧DataFrame中连接键数相匹配。 right_index: left_index功能相似。...outer’取并集,出现A会进行一一匹配,没有同时出现会将缺失部分添加缺失。 sort: 按字典顺序通过连接键对结果DataFrame进行排序。..._merge是分类类型,并且对于其合并键出现在“左”DataFrame中观察,取得为left_only,对于其合并键出现在“右”DataFrame中观察为right_only,并且如果在两者中都找到观察点合并键...如果为True,则将名为_mergeCategorical类型添加到具有输出对象: df1 = pd.DataFrame({'col1': [0, 1], 'col_left':['a',

42710

MySQL 系列教程之(七)DQL:从 select 开始丨【绽放吧!数据库】

只要返回相同数目的行,就是正常 检索多个 select id,name,age,sex from user 在选择多个时,一定要在列名之间加上逗号,但最后一个列名后不加。...,如果不明确规定排序顺序,则不应该假定检索出数据顺序有意义 通常,ORDER BY子句中使用将是为显示所选择。...使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成 确定表中行数(或者满足某个条件或包含某个特定行数)。 获得表中行和。...返回某之和 AVG() 返回某平均值 注意 在使用count时,如果指定列名,则指定为空行被忽略,但如果COUNT()函数中用是星号(*),则不忽略 数据分组 GROUP BY...这使我们能够对行进行计数,计算和平均数,获得最大和最小而不用检索所有数据 目前为止所有计算都是在表所有数据或匹配特定WHERE子句数据上进行

3.5K43

MySQL(五)汇总和分组数据

②获得表中行和 ③找出表列(或所有行或某些特定行)最大、最小和平均值 聚集函数(aggregate function):运行在行组上,计算和返回单个函数(MySQL还支持一些标准偏差聚集函数...1、avg()函数 avg()通过对表中行数计数并计算特定之和,求得该平均值;avg()可用来返回所有平均值,也可用来返回特定平均值; select avg(prod_price) as...①使用count(*)对表中行数目进行计数,不管表列中包含是空(null)还是非空; ②使用count(column)对特定中具有行进行计数,忽略null; select count(...; PS:如果指定列名,则指定为空行被count()函数忽略,但如果count()函数中用是星号(*),则不忽略;  3、max()函数 max()返回指定最大,max()要求指定列名...(sum()函数忽略为null行) 6、distinct聚集函数 MySQL5.0.3以及之后版本,聚集函数和distinct可以搭配使用,比如: ①对所有的行执行计算,指定all参数或不给参数

4.7K20

Mysql| Mysql函数,聚集函数介绍使用(Lower,Date,Mod,AVG,...)

,MySQL提供了Date函数来解决这个问题.Date(order_date)指示MySQL提取日期部分,更可靠SELECT语句为:  SELECT * FROM orders WHERE DATE...COUNT()函数有两种使用方式:  ①使用COUNT(*)对表中行数目进行计数, 不管表列中包含是空( NULL)还是非空。...关于空: column如果指定列名,则指定为空行被COUNT()函数忽略,但如果COUNT()函数中用是星号(*),则不忽略。 ...EG: SELECT MAX(prod_price) AS max_price FROM products; ④MIN()函数用法: MIN()功能正好MAX()功能相反,它返回指定最小。...MAX()一样, MIN()要求指定列名.对非数值数据使用MIN() MIN()函数MAX()函数类似,MySQL允许将它用来返回任意最小,包括返回文本最小

1.5K10

Python Pandas 用法速查表

() 数据表基本信息(维度、列名称、数据格式、所占空间等) df.dtypes 数据格式 df[‘Name’].dtype 某一格式 df.isnull() 空 df.isnull() 查看某一...df[Name’].unique() 某一唯一 df.values 数据表 df.columns 列名df.head() 查看前10行数据 df.tail() 查看后10行数据 数据操作...索引列名称为category和size df_inner=pd.merge(df_inner,split,right_index=True, left_index=True) 将完成分裂后数据表和原...(df,df1,how=‘outer’) 全连接(取两个集合并集,包含有 dfdf1 全部数据行,无匹配则填充空) 修改列名 代码 作用 a.columns = [‘a’,‘b’,‘c’]...num为1 frame.insert(0, ‘num’, np.

1.8K20

pandas用法-全网最详细教程

2、数据表基本信息(维度、列名称、数据格式、所占空间等): df.info() 3、每一数据格式: df.dtypes 4、某一格式: df['B'].dtype 5、空df.isnull...() 6、查看某一df['B'].isnull() 7、查看某一唯一df['B'].unique() 8、查看数据表df.values 9、查看列名称: df.columns...如果字典中传递,将作为键参数,使用排序键,除非它传递,在这种情况下将会选择 (见下文)。任何没有任何反对将默默地被丢弃,除非他们都没有在这种情况下将引发 ValueError。...请注意在联接中仍然受到尊重其他轴上索引。 join_axes︰ 索引对象列表。具体指标,用于其他 n-1 轴而不是执行内部/外部设置逻辑。 keys︰ 序列,默认为无。...,并创建数据表,索引df_inner索引列名称为category和size pd.DataFrame((x.split('-') for x in df_inner['category']),

5.7K31

直观地解释和可视化每个复杂DataFrame操作

考虑一个二维矩阵,其一维为“ B ”和“ C ”(列名),另一维为“ a”,“ b ”和“ c ”(行索引)。 我们选择一个ID,一个维度和一个包含/。...Stack 堆叠采用任意大小DataFrame,并将“堆叠”为现有索引子索引。因此,所得DataFrame具有一和两级索引。 ? 堆叠名为df表就像df.stack()一样简单 。...包括df2所有元素, 当其键是df2键时才 包含df1元素 。 “outer”:包括来自DataFrames所有元素,即使密钥不存在于其他-缺少元素被标记为NaN。...“inner”:包含元件键是存在于两个数据帧键(交集)。默认合并。 记住:如果您使用过SQL,则单词“ join”应立即添加相联系。...例如,考虑使用pandas.concat([df1,df2])串联具有相同列名 两个DataFrame df1 和 df2 : ?

13.3K20
领券