首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas 查找,丢弃列值唯一的列

    前言 数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如...:已支付,已支付,已支付… 这些列大多形同虚设,所以当数据集列很多而导致人眼难以查找时,这个方法尤为好用。...上代码前先上个坑吧,数据列中的空值 NaN 也会被 Pandas 认为是一种 “ 值 ”,如下图: 所以只要把列的缺失值先丢弃,再统计该列的唯一值的个数即可。...代码实现 数据读入 检测列值唯一的所有列并丢弃 最后总结一下,Pandas 在数据清洗方面有非常多实用的操作,很多时候我们想不到只是因为没有接触过类似的案例或者不知道怎么转换语言描述,比如 “...列值唯一 ” --> “ 除了空值以外的唯一值的个数等于1 ” ,许多坑笔者都已经踩过了,欢迎查看我的其余文章,提建议,共同进步。

    10.2K21

    pandas | DataFrame基础运算以及空值填充

    今天是pandas数据处理专题的第四篇文章,我们一起来聊聊DataFrame的基本运算。...数据对齐 我们可以计算两个DataFrame的加和,pandas会自动将这两个DataFrame进行数据对齐,如果对不上的数据会被置为Nan(not a number)。...然后我们将两个DataFrame相加,会得到: ? 我们发现pandas将两个DataFrame加起来合并了之后,凡是没有在两个DataFrame都出现的位置就会被置为Nan。...df3.fillna(3, inplace=True) 除了填充具体的值以外,我们也可以和一些计算结合起来算出来应该填充的值。比如说我们可以计算出某一列的均值、最大值、最小值等各种计算来填充。...fillna这个函数不仅可以使用在DataFrame上,也可以使用在Series上,所以我们可以针对DataFrame中的某一列或者是某些列进行填充: ?

    4.7K20

    C# 存储相同键多个值的Dictionary

    涉及到两个问题: 一、访问磁盘中文件夹、文件夹下面的文件夹 先看一下磁盘文件夹结构 C盘下面有个根文件夹SaveFile,SaveFIle下面有两个子文件夹分别为,2018、2019, ?...的区别 1.HashTable   哈希表(HashTable)表示键/值对的集合。...Hashtable中key-value键值对均为object类型,所以Hashtable可以支持任何类型的keyvalue键值对,任何非 null 对象都可以用作键或值。   ...: HashtableObject.Contains(key);   2.Dictionary   Dictionary表示键和值的集合。   ...[key]值一一对应的存入该泛型   通过某一个一定的[key]去找到对应的值   3.HashTable和Dictionary的区别:   (1).HashTable不支持泛型,而Dictionary

    5.9K20

    Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)

    Pandas数据处理——渐进式学习 ---- 目录 Pandas数据处理——渐进式学习 前言 环境 DataFrame删除NaN空值 dropna函数参数 测试数据 删除所有有空的行 axis属性值...---- 环境 系统环境:win11 Python版本:python3.9 编译工具:PyCharm Community Edition 2022.3.1 Numpy版本:1.19.5 Pandas...我这里清除的是[name,age]两列只要有NaN的值就会删除行 import pandas as pd import numpy as np df = pd.DataFrame( {'name...定义了填充空值的方法,                 pad / ffill表示用前面行/列的值,填充当前行/列的空值,                 backfill / bfill表示用后面行.../列的值,填充当前行/列的空值。

    5.4K20

    Python 数据处理 合并二维数组和 DataFrame 中特定列的值

    numpy 是 Python 中用于科学计算的基础库,提供了大量的数学函数工具,特别是对于数组的操作。pandas 是基于 numpy 构建的一个提供高性能、易用数据结构和数据分析工具的库。...首先定义了一个字典 data,其中键为 “label”,值为一个列表 [1, 2, 3, 4]。然后使用 pd.DataFrame (data) 将这个字典转换成了 DataFrame df。...每个元素都是从 0 到 1 之间均匀分布的随机浮点数。...结果是一个新的 NumPy 数组 arr,它将原始 DataFrame 中 “label” 列的值作为最后一列附加到了随机数数组之后。...运行结果如下: 总结来说,这段代码通过合并随机数数组和 DataFrame 中特定列的值,展示了如何在 Python 中使用 numpy 和 pandas 进行基本的数据处理和数组操作。

    7.7K00

    python dataframe筛选列表的值转为list【常用】

    筛选列表中,当b列中为’1’时,所有c的值,然后转为list 2 .筛选列表中,当a列中为'one',b列为'1'时,所有c的值,然后转为list 3 .将a列整列的值,转为list(两种) 4....筛选列表,当a=‘one’时,取整行所有值,然后转为list 具体看下面代码: import pandas as pd from pandas import DataFrame df = DataFrame...one 1 一 1 one 1 一 2 two 2 二 3 three 3 三 4 four 1 四 5 five 5 五 """ # 筛选列表中,当b列中为...当a列中为'one',b列为'1'时,所有c的值,然后转为list a_b_c = df.c[(df['a'] == 'one') & (df['b'] == '1')].tolist() print(...a_b_c) # out: ['一', '一'] # 将a列整列的值,转为list(两种) a_list_1 = df.a.tolist() a_list_2 = df['a'].tolist()

    5.9K10

    Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量)

    Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量) ---- 目录 Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量) 前言...---- 环境 系统环境:win11 Python版本:python3.9 编译工具:PyCharm Community Edition 2022.3.1 Numpy版本:1.19.5 Pandas...版本:1.4.4 基础函数的使用 Pandas数据处理——渐进式学习1、Pandas入门基础 Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索) ---- DataFrame...记录每个值出现的次数 语法 DataFrame.duplicated(subset=None,keep='first') 参数 subset:判断是否是重复数据时考虑的列 keep:保留第一次出现的重复数据还是保留最后一次出现的...重复值的数量 import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗', '王语嫣

    3.6K30

    用过Excel,就会获取pandas数据框架中的值、行和列

    标签:python与Excel,pandas 至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。...在Python中,数据存储在计算机内存中(即,用户不能直接看到),幸运的是pandas库提供了获取值、行和列的简单方法。 先准备一个数据框架,这样我们就有一些要处理的东西了。...图5 获取多列 方括号表示法使获得多列变得容易。语法类似,但我们将字符串列表传递到方括号中。...请注意双方括号: dataframe[[列名1,列名2,列名3,…]] 图6 使用pandas获取行 可以使用.loc[]获取行。请注意此处是方括号,而不是圆括号()。...在pandas中,这类似于如何索引/切片Python列表。 要获取前三行,可以执行以下操作: 图8 使用pandas获取单元格值 要获取单个单元格值,我们需要使用行和列的交集。

    30.8K60
    领券