`set_index()`不对索引进行排序吗？

set_index()函数是Pandas库中的一个函数，用于将指定的列作为索引来重新设置数据的索引。它不会对索引进行排序。

该函数的语法如下：

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

参数说明：

keys：要设置为索引的列名或列名列表。
drop：是否将原来的列从数据中删除，默认为True。
append：是否将新的索引添加到现有索引中，默认为False。
inplace：是否在原始DataFrame上进行操作，默认为False。
verify_integrity：是否检查新的索引是否唯一，默认为False。

使用set_index()函数可以方便地将某列作为索引来操作数据。它适用于数据集中某一列具有唯一值的场景，例如日期、ID等。通过设置索引，可以提高数据访问和查询的效率，并且可以使用Pandas提供的各种索引相关的功能和方法。

以下是一个示例：

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3, 4],
        'B': [5, 6, 7, 8]}
df = pd.DataFrame(data)

# 将列'A'设置为索引
df.set_index('A', inplace=True)

# 输出结果
print(df)

输出结果如下：

在这个示例中，我们创建了一个包含两列的DataFrame。然后，使用set_index()函数将列'A'设置为索引，并通过inplace=True参数在原始DataFrame上进行操作。最终的输出结果显示了新的索引。

概述无论何时对基础数据执行插入、更新或删除操作，SQL Server 数据库引擎都会自动维护索引。随着时间的推移，这些修改可能会导致索引中的信息分散在数据库中（含有碎片）。当索引包含的页中的逻辑排序（基于键值）与数据文件中的物理排序不匹配时，就存在碎片。碎片非常多的索引可能会降低查询性能，导致应用程序响应缓慢，所以在日常的维护工作当中就需要对索引进行检查对那些填充度很低碎片量大的索引进行重新生成或重新组织，但是在这个过程也需要注意一些小的细节，否则会产生错误。正文语法内容载自SQL Server联机

写在前面：索引对查询的速度有着至关重要的影响，理解索引也是进行数据库性能调优的起点。考虑如下情况，假设数据库中一个表有10^6条记录，DBMS的页面大小为4K，并存储100条记录。如果没有索引，查询将对整个表进行扫描，最坏的情况下，如果所有数据页都不在内存，需要读取10^4 个页面，如果这10^4个页面在磁盘上随机分布，需要进行10^4次I/O，假设磁盘每次I/O时间为10ms(忽略数据传输时间)，则总共需要 100s(但实际上要好很多很多)。如果对之建立B-Tree索引，则只需要进行log100(10^6)=3次页面读取，最坏情况下耗时30ms。这就是索引带来的效果，很多时候，当你的应用程序进行SQL查询速度很慢时，应该想想是否可以建索引。进入正题：

注意取index多级索引：构造的时候是zip对，所以这样取取column多级索引：构造的时候是第一层和第一层数量一致，取的时候df.iloc[1:]把第一行去掉再去 pd.to_datetime()很重要，可以把str日期转化为datetime 也可以这样取 ix 可以自适应loc iloc 但不建议用 apply 可赋值也可过滤新增列直接 df['列名'] = data 就可以删除列 df.remove('列名')，插入用appenf/insert 取列 set_index 这个方法很有用，可将c

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

`set_index()`不对索引进行排序吗？

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐