首页
学习
活动
专区
圈层
工具
发布

Pandas入门教程

(label)的,包括行标签(index)和列标签(columns),即行名称和列名称,可以使用df.loc[index_name,col_name],选择指定位置的数据,其它的用法有: 1....axis :{0, 1, …},默认为 0。要沿其连接的轴。 join: {'inner', 'outer'}, 默认为 'outer'。如何处理其他轴上的索引。外部用于联合,内部用于交集。...生成的分层索引中级别的名称。 verify_integrity: 布尔值,默认为 False。检查新的串联轴是否包含重复项。相对于实际的数据串联,这可能非常昂贵。 copy: 布尔值,默认为真。...Series 对象;right:另一个 DataFrame 或命名的 Series 对象; on: 要加入的列或索引级别名称; left_on:左侧 DataFrame 或 Series 的列或索引级别用作键...可以是列名称、索引级别名称或长度等于 DataFrame 或 Series 长度的数组;right_on:来自正确 DataFrame 或 Series 的列或索引级别用作键。

1.6K30

【愚公系列】2023年07月 Pandas数据分析之MultiIndex

([0, 1, 0, 1]) 4.使用多重索引构建一个Dataframe 除了从CSV文件读取和从现有列构建外,还有一些方法可以创建多重索引。...当关卡形成规则结构时,您可以指定关键元素,并让Pandas自动交织它们,如下所示: 上面列出的所有方法也适用于列。...这种方法无法同时过滤行和列,因此名称xs(代表“横截面”)背后的原因并不完全清楚。它不能用于设置值。 3.可以为pd创建别名。...8.操作级别 除了前面提到的方法之外,还有一些其他的方法: pdi.get_level(obj, level_id)返回通过数字或名称引用的特定级别,可用于DataFrames, Series和MultiIndex...这意味着前三行包含有关列的信息,后续每一行的前四个字段包含索引级别(如果列的级别不止一个,你不能再通过名称来引用行级别,只能通过编号)。

46810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas图鉴(四):MultiIndex

    作为一维的,Series在不同情况下可以作为行向量或列向量,但通常被认为是列向量(例如DataFrame的列)。 比如说: 也可以通过名称或位置索引来指定要堆叠/取消堆叠的级别。...如果需要把级别放在其他地方,可以使用df.swaplevel().sort_index()或者pdi.swap_level(df, sort=True) 列必须不包含重复的值才有资格进行 stack(unstack...使用pdi.insert(df.columns, 0, 'new_col', 1)可以正确处理带有CategoricalIndex的级别。...操作levels 除了已经提到的方法之外,还有一些其他的方法: pdi.get_level(obj, level_id)返回一个通过数字或名称引用的特定级别,适用于DataFrames、Series和MultiIndex...例如,要读取一个有三层高的列和四层宽的索引的DataFrame,你需要指定 pd.read_csv('df.csv', header=[0,1,2], index_col=[0,1,2,3]) 这意味着前三行包含了列的信息

    1.7K20

    直观地解释和可视化每个复杂的DataFrame操作

    初始DataFrame中将成为索引的列,并且这些列显示为唯一值,而这两列的组合将显示为值。这意味着Pivot无法处理重复的值。 ? 旋转名为df 的DataFrame的代码 如下: ?...我们选择一个ID,一个维度和一个包含值的列/列。包含值的列将转换为两列:一列用于变量(值列的名称),另一列用于值(变量中包含的数字)。 ?...Unstack 取消堆叠将获取多索引DataFrame并对其进行堆叠,将指定级别的索引转换为具有相应值的新DataFrame的列。在表上调用堆栈后再调用堆栈不会更改该堆栈(原因是存在“ 0 ”)。...堆叠中的参数是其级别。在列表索引中,索引为-1将返回最后一个元素。这与水平相同。级别-1表示将取消堆叠最后一个索引级别(最右边的一个)。...作为另一个示例,当级别设置为0(第一个索引级别)时,其中的值将成为列,而随后的索引级别(第二个索引级别)将成为转换后的DataFrame的索引。 ?

    16.8K20

    Pandas 学习手册中文第二版:11~15

    -2e/img/00535.jpeg)] 与在axis=1上进行连接连接一样,在不考虑创建重复项的情况下复制行中的索引标签,并且以确保在结果中不包含重复的列名的方式连接列标签。...由于两个DataFrame对象都有一个具有相同名称key的列,结果中的这些列将附加_x和_y后缀以标识它们源自的DataFrame对象。 _x用于左侧,_y用于右侧。...同样,在枢轴在索引上保留相同数量的级别的情况下,堆叠和非堆叠总是会增加其中一个轴(用于堆叠的列和用于堆叠的行)的索引上的级别,而会降低另一轴上的级别。...此外,如果已命名级别,则可以通过名称而不是位置来指定它们。...使用索引级别来分组 可以使用索引中的值而不是列进行分组。 传感器数据非常适合用于层次结构索引,可用于演示此概念。

    4.5K20

    高效的10个Pandas函数,你都用过吗?

    ,则 loc=0 column: 给插入的列取名,如 column='新的一列' value:新列的值,数字、array、series等都可以 allow_duplicates: 是否允许列名重复,选择...Ture表示允许新的列名与已存在的列名重复 接着用前面的df: 在第三列的位置插入新列: #新列的值 new_col = np.random.randn(10) #在第三列位置插入新列,从0开始计算...如果未指定, 请使用未设置为id_vars的所有列 var_name [scalar]:指代用于”变量”列的名称。...如果为None, 则使用- - frame.columns.name或’variable’ value_name [标量, 默认为’value’]:是指用于” value”列的名称 col_level...[int或string, 可选]:如果列为MultiIndex, 它将使用此级别来融化 例如有一串数据,表示不同城市和每天的人口流动: import pandas as pd df1 = pd.DataFrame

    5.2K20

    pandas用法-全网最详细教程

    (pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) 或者 import pandas as...、空值: df.isnull() 6、查看某一列空值: df['B'].isnull() 7、查看某一列的唯一值: df['B'].unique() 8、查看数据表的值: df.values 9、查看列名称...join_axes︰ 索引对象的列表。具体的指标,用于其他 n-1 轴而不是执行内部/外部设置逻辑。 keys︰ 序列,默认为无。构建分层索引使用通过的键作为最外面的级别。...如果多个级别获得通过,应包含元组。 levels︰ 列表的序列,默认为无。具体水平 (唯一值) 用于构建多重。否则,他们将推断钥匙。 names︰ 列表中,默认为无。由此产生的分层索引中的级的名称。...[:3,:2] #冒号前后的数字不再是索引的标签名称,而是数据所在的位置,从0开始,前三行,前两列。

    8.7K31

    《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑8.1 层次化索引8.2 合并数据集8.3 重塑和轴向旋转8.4 总结

    在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。 首先,我会介绍pandas的层次化索引,它广泛用于以上操作。...5 b 9 10 11 根据级别汇总统计 许多对DataFrame和Series的描述和汇总统计都有一个level选项,它用于指定在某条轴上求和的级别。...注意:在进行列-列连接时,DataFrame对象中的索引会被丢弃。 对于合并运算需要考虑的最后一个问题是对重复列名的处理。...它还可用于合并多个带有相同或相似索引的DataFrame对象,但要求没有重叠的列。...,最后一个可选值则是用于填充DataFrame的数据列。

    2.9K90

    Python数据科学手册(五)【Pandas 数据操作】

    Numpy的一个优点就是提供了快速的元素级别操作,比如算术运算以及其他复杂操作。DataFrame继承 了大部分功能。 Pandas在这些函数的基础上提供了更为高级的功能。...比如,一元运算不修改行索引和列索引;而对于二元操作,Pandas会自动对齐行索引。...索引不变的通用函数 由于Pandas是基于Numpy搭建的,所以任何Numpy的通用函数都适用于Pandas Series对象和DataFrame对象。...image.png 如果将Numpy通用函数作用与Pandas对象上,得到的结果索引保持不变: np.exp(ser) 结果为: 0 403.428793 1 20.085537 2...image.png 上述操作是行级别的,如果需要列级别的操作,需要指定aixs: df.subtract(df['R'], axis=0) ? image.png

    74040

    事务隔离级别与MVCC (1)—mysql进阶(六十七)

    Sql标准中的四种隔离级别 综上所述,脏写>脏读>不可重复读>幻读 为了解决这些问题,于是mysql设计了四种隔离级别: Read uncommit:未提交读。可能发生脏读,不可重复读,幻读。...; 则只对执行完该语句之后产生的会话起作用,当前已存在的会话无效。...* FROM hero WHERE number = 1; # 得到的列name的值为'刘备' 这个select的执行过程如下: 在执行select语句时会生成一个read View,readView的...* FROM hero WHERE number = 1; # 得到的列name的值为'刘备 # SELECT2:Transaction 100提交,Transaction 200未提交 SELECT...* FROM hero WHERE number = 1; # 得到的列name的值仍为'刘备' 因为当前事务隔离级别是repatable read ,而之前执行selet1的时候已经生成了readView

    48520

    数据可视化(5)-Seaborn系列 | 柱状图countplot()

    或Python对象,但推荐使用pandas对象, 因为关联的名称将用于注释轴。...可选: x,y,hue:数据变量的名称(如上表,date,name,age,sex为数据字段变量名) 用于绘制数据的输入 data: DataFrame,数组或数组列表 用于绘图的数据集,如果x和y不存在...(垂直或水平,即横向或纵向),这通常可以从输入变量的dtype推断得到 palette:调色板名称,list列表,dict字典 用于对变量调不同级别的颜色 saturation(饱和度):float...用于绘制颜色的原始饱和度的比例,如果希望绘图颜色与输入颜色规格完美匹配, 则将其设置为1 dodge:bool 使用色调嵌套时,是否应沿分类轴移动元素。...=5, edgecolor=sns.color_palette("dark", 3)) plt.show() [q1j1izo1qx.png] 案例地址 案例代码已上传:Github

    14.9K00

    mysql事务隔离级别与MVCC

    这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构(如B树索引或双向链表)也都必须是正确的 隔离性(Isolation):数据库系统提供一定的隔离机制,...max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值(max_trx_id并不是m_ids中的最大值。...hero WHERE number = 1; # 得到的列name的值为'刘备 这个SELECT1的执行过程如下: 在执行SELECT语句时会先生成一个ReadView,ReadView的m_ids列表的内容就是...下一个版本的列name的内容是’张飞’,该版本的trx_id值为100,而m_ids列表中是包含值为100的事务id的,所以该版本也不符合要求,同理下一个列name的内容是’关羽’的版本也不符合要求。...SELECT查询得到的结果是重复的,记录的列c值都是’刘备’,这就是可重复读的含义。

    48200
    领券