首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

在 Pandas 中,索引可以设置为一个(或多个)唯一值,这就像在工作表中有一列用作行标识符一样。与大多数电子表格不同,这些索引值实际上可用于引用行。...读取外部数据 Excel 和 pandas 都可以从各种来源以各种格式导入数据。 CSV 让我们从 Pandas 测试中加载并显示提示数据集,这是一个 CSV 文件。...DataFrame.drop() 方法从 DataFrame 中删除一列。...按值排序 Excel电子表格中的排序,是通过排序对话框完成的。 pandas 有一个 DataFrame.sort_values() 方法,它需要一个列列表来排序。...按位置提取子串 电子表格有一个 MID 公式,用于从给定位置提取子字符串。获取第一个字符: =MID(A2,1,1) 使用 Pandas,您可以使用 [] 表示法按位置位置从字符串中提取子字符串。

19.6K20

从Excel到Python:最常用的36个Pandas函数

5.查看唯一值 Excel中查看唯一值的方法是使用“条件格式”对唯一值进行颜色 标记。 ? Python中使用unique函数查看唯一值。...Python中需要使用ort_values函数和sort_index函数完成排序 #按特定列的值排序 df_inner.sort_values(by=['age']) ?...Sort_index函数用来将数据表按索引列的值进行排序。 #按索引列排序 df_inner.sort_index() ?...2.按位置提取(iloc) 使用iloc函数按位置对数据表中的数据进行提取,这里冒号前后 的数字不再是索引的标签名称,而是数据所在的位置,从0开始。...4.按条件提取(区域和条件值) 使用loc和isin两个函数配合使用,按指定条件对数据进行提取 #判断city列的值是否为beijing df_inner['city'].isin(['beijing'

11.5K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python df 列替换_如何用Python做数据分析,没有比这篇文章更详细的了(图文详情)...

    1import numpy as np  2import pandas as pd  导入数据表  下面分别是从 excel 和 csv 格式文件导入数据并创建数据表的方法。...Python 中使用 unique 函数查看唯一值。  查看唯一值  Unique 是查看唯一值的函数,只能对数据表中的特定列进行检查。下面是代码,返回的结果是该列中的唯一值。...1#按特定列的值排序  2df_inner.sort_values(by=['age'])  sort_values  Sort_index 函数用来将数据表按索引列的值进行排序。  ...1#对 category 字段的值依次进行分列,并创建数据表,索引值为 df_inner 的索引列,列名称为 category 和 size  2pd.DataFrame((x.split('-') for...下面代码中行的位置按索引日期设置,列按位置设置。

    4.5K00

    Pandas速查卡-Python数据科学

    pd.read_clipboard() 获取剪贴板的内容并将其传递给read_table() pd.DataFrame(dict) 从字典、列名称键、数据列表的值导入 输出数据 df.to_csv(...) 所有列的唯一值和计数 选择 df[col] 返回一维数组col的列 df[[col1, col2]] 作为新的数据框返回列 s.iloc[0] 按位置选择 s.loc['index_one'] 按索引选择...按升序对值排序 df.sort_values(col2,ascending=False) 将col2按降序对值排序 df.sort_values([col1,ascending=[True,False]...) 将col1按升序排序,然后按降序排序col2 df.groupby(col) 从一列返回一组对象的值 df.groupby([col1,col2]) 从多列返回一组对象的值 df.groupby(col1...=max) 创建一个数据透视表,按col1分组并计算col2和col3的平均值 df.groupby(col1).agg(np.mean) 查找每个唯一col1组的所有列的平均值 data.apply(

    9.2K80

    pandas用法-全网最详细教程

    : df.dtypes 4、某一列格式: df['B'].dtype 5、空值: df.isnull() 6、查看某一列空值: df['B'].isnull() 7、查看某一列的唯一值: df['B']...) 3、按照特定列的值排序: df_inner.sort_values(by=['age']) 4、按照索引列排序: df_inner.sort_index() 5、如果prince列的值>3000,group...主要用到的三个函数:loc,iloc和ix,loc函数按标签值进行提取,iloc按位置进行提取,ix可以同时按标签和位置进行提取。...1、按索引提取单行的数值 df_inner.loc[3] 2、按索引提取区域行数值 df_inner.iloc[0:5] 3、重设索引 df_inner.reset_index() 4、设置日期为索引...7、适应iloc按位置单独提起数据 df_inner.iloc[[0,2,5],[4,5]] #提取第0、2、5行,4、5列 8、使用ix按索引标签和位置混合提取数据 df_inner.ix[:'2013

    7.3K31

    用 Pandas 进行数据处理系列 二

    [‘b’].unique()查看某一列的唯一值df.values查看数据表的值df.columns查看列名df.head()查看默认的前 10 行数据df.tail()查看默认的后 10 行数据 数据表清洗...设置索引列 df.set_index('id') 按照特定列的值排序 df.sort_values(by=['age']) 按照索引列排序 df.sort_index() 如果 pr 列的值大于 3000...loc函数按标签值进行提取iloc按位置进行提取ix可以同时按标签和位置进行提取 具体的使用见下: df.loc[3]按索引提取单行的数值df.iloc[0:5]按索引提取区域行数据值df.reset_index...()重设索引df=df.set_index(‘date’)设置 date 为索引df[:‘2013’]提取 2013 之前的所有数据df.iloc[:3,:2]从 0 位置开始,前三行,前两列,这里的数据不同去是索引的标签名称...,然后将符合条件的数据提取出来pd.DataFrame(category.str[:3])提取前三个字符,并生成数据表 数据筛选 使用与、或、非三个条件配合大于、小于、等于对数据进行筛选,并进行计数和求和

    8.2K30

    玩转数据处理120题|Pandas版本

    Python解法 df.isnull().sum() 54 缺失值处理 题目:提取日期列含有空值的行 难度:⭐⭐ 期望结果 ?...(1,100,20) df1 = pd.DataFrame(tem) 83 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100固定步长的数 Python...解法 tem = np.arange(0,100,5) df2 = pd.DataFrame(tem) 84 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20...Python解法 df.columns = ['col1','col2','col3'] 89 数据提取 题目:提取第一列中不在第二列出现的数字 难度:⭐⭐⭐ Python解法 df['col1'][~...[df['col1'] > 50] = '高' 100 数据计算 题目:计算第一列与第二列之间的欧式距离 难度:⭐⭐⭐ 备注 不可以使用自定义函数 Python解法 np.linalg.norm(df[

    7.6K41

    Pandas知识点-排序操作

    本文使用的数据来源于网易财经,具体下载方法可以参考:Pandas知识点-DataFrame数据结构介绍 本文的代码在Jupyter Notebook中编写,Jupyter Notebook的安装可以参考...:Jupyter Notebook的安装和使用 一、数据读取 数据文件是600519.csv,将此文件放到代码同级目录下,从文件中读取出数据。...为了方便后面进行排序操作,只读取了数据中的前十行,并删除了一些列,设置“日期”和“收盘价”为索引。 ? 读取的原始数据如上图,本文基于这些数据来进行排序操作。 二、DataFrame排序操作 1....如果要按多重索引内的多个行索引排序,可以给level传入一个列表,这样会先按列表中的第一个行索引排序,当第一个行索引有相等的值时,再按第二个行索引进行排序,以此类推。...inplace参数用于设置是否对原数据修改,对原数据修改时没有返回值,不能链式调用。kind参数用于设置使用的排序算法,在按多重索引排序和按多个列排序时无效。

    1.9K30

    Pandas进阶修炼120题|完整版

    答案 data.isnull().sum() 54 缺失值处理 题目:提取日期列含有空值的行 难度:⭐⭐ 期望结果 ?...__version__) 82 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100随机数 答案 tem = np.random.randint(...1,100,20) df1 = pd.DataFrame(tem) 83 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100固定步长的数 答案 tem...= np.arange(0,100,5) df2 = pd.DataFrame(tem) 84 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个指定分布...df.columns = ['col1','col2','col3'] 89 数据提取 题目:提取第一列中不在第二列出现的数字 难度:⭐⭐⭐ 答案 df['col1'][~df['col1'].isin

    12.7K106

    Pandas 25 式

    目录 查看 pandas 及其支持项的版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择列 把字符串转换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...~ 按行 用多个文件建立 DataFrame ~ 按列 从剪贴板创建 DataFrame 把 DataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大的类别筛选 DataFrame...注意:如果索引值有重复、不唯一,这种方式会失效。 13. 根据多个类别筛选 DataFrame 预览 movies。 ? 查看 genre(电影类型)列。 ?...要把第二列转为 DataFrame,在第二列上使用 apply() 方法,并把结果传递给 Series 构建器。 ?...创建样式字符字典,指定每列使用的格式。 ? 把这个字典传递给 DataFrame 的 style.format() 方法。 ? 注意:日期是月-日-年的格式,闭市价有美元符,交易量有千分号。

    8.4K00

    Pandas速查手册中文版

    pandas-cheat-sheet.pdf 关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 同时我们需要做如下的引入: import pandas...pd.read_html(url):解析URL、字符串或者HTML文件,抽取其中的tables表格 pd.read_clipboard():从你的粘贴板获取内容,并传给read_table() pd.DataFrame...s.value_counts(dropna=False):查看Series对象的唯一值和计数 df.apply(pd.Series.value_counts):查看DataFrame对象中每一列的唯一值和计数...():检查DataFrame对象中的空值,并返回一个Boolean数组 pd.notnull():检查DataFrame对象中的非空值,并返回一个Boolean数组 df.dropna():删除所有包含空值的行...=col1, values=[col2,col3], aggfunc=max):创建一个按列col1进行分组,并计算col2和col3的最大值的数据透视表 df.groupby(col1).agg(np.mean

    12.2K92

    精选100个Pandas函数

    精选100个Pandas函数 精心整理100个pandas常用函数,建议收藏~ a aggregate() #聚合;基于内置函数或者自定义函数的聚合运算 argmin() 最小值所在的索引 argmax...dropna() # 删除缺失值 diff() 一阶差分 dt.date() 提取日期 dt.time() 提取时间 dt.year() 提取年份 dt.month() 提取年份 dt.day...最大的前n个值 p pct_change 运算比率;后一个和前一个的比例 pd.to_datetime() 转日期时间类型 pd.Series() # 创建Series数据 pd.DataFrame...抽样 str.split() 字符分割 str.findall() sort_values() # 按值排序 sort_index() 按索引排序 stack() # 堆叠;列转行 t to_dict...() 转为字典 tolist() 转为列表 transpose .T # 转置 u unique() 元素唯一值(去重) unstack # 不要堆叠,多行转列 v var() 计算方差

    27530
    领券