开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Dataframe使用unique，但行是一个列表，而不是“类似一维数组”

Dataframe使用unique方法时，要求行是一个列表，而不是“类似一维数组”。

在数据分析和处理中，Dataframe是一种二维表格数据结构，类似于关系型数据库中的表。它由行和列组成，每列可以包含不同的数据类型。Dataframe提供了许多方法和函数，用于对数据进行操作和分析。

在Dataframe中，unique方法用于获取某一列中的唯一值。它返回一个由唯一值组成的列表，这些值是该列中出现的不重复的值。

然而，要使用unique方法，行必须是一个列表，而不是“类似一维数组”。这意味着行必须以列表的形式传递给unique方法，而不是以其他形式，例如一维数组。

下面是一个示例，展示了如何正确使用Dataframe的unique方法：

import pandas as pd

# 创建一个Dataframe
data = {'Name': ['John', 'Alice', 'Bob', 'John'],
        'Age': [25, 28, 30, 25]}
df = pd.DataFrame(data)

# 使用unique方法获取Name列的唯一值
unique_names = df['Name'].unique()

print(unique_names)

输出结果为：

['John' 'Alice' 'Bob']

在上述示例中，我们创建了一个包含姓名和年龄的Dataframe。然后，我们使用unique方法获取了Name列的唯一值，并将结果存储在unique_names变量中。最后，我们打印了unique_names的值，即Name列中的唯一姓名。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云数据分析平台（https://cloud.tencent.com/product/dap）
腾讯云云数据库（https://cloud.tencent.com/product/cdb）
腾讯云人工智能（https://cloud.tencent.com/product/ai）
腾讯云物联网（https://cloud.tencent.com/product/iotexplorer）
腾讯云移动开发（https://cloud.tencent.com/product/mobdev）
腾讯云对象存储（https://cloud.tencent.com/product/cos）
腾讯云区块链（https://cloud.tencent.com/product/baas）
腾讯云元宇宙（https://cloud.tencent.com/product/mu）
腾讯云安全产品（https://cloud.tencent.com/product/safety）

相关搜索:在React Native中使用数组映射而不是FlatList是一个好的模式吗？如何创建一个新的列表，其中new_array[i][j] = b[a[i][j]] (a是一个数组，b是一个向量)，而不使用for循环尝试使用groupby()函数，但仍收到"TypeError:列表索引必须是整数或切片，而不是字符串“有没有办法使用类似于OpenCv的MinMaxLoc的方法来获得n个最大值的列表，而不是只有一个最大值？商品筛选html 数量增减html 闪电效果html 什么是chtml 商品网页html 首页轮播html

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

数据分析利器 pandas 系列教程（二）：强大的 DataFrame

df.valuse df 对象值，是一个二维 ndarray 数组 print(df.shape,'\n') print(df.index,'\n') print(df.columns,'\n')...dataframe 查询 loc[] 和 iloc[] 看过上一篇文章的读者应该知道，iloc[] 的 i 是 integer 的意思，意味着 iloc[] 只能通过位置查询，而 loc[] 可以通过行...这里我纠正一下我上篇文章中的错误之处：series.values 或 series.unique() 返回的并不是列表，虽然打印结果像列表（因为对 __str__()函数进行了重载），但实际上却是 ndarray...对象，一种类似列表的数组，可以通过 .tolist() 转为列表。...注意 apply() 函数是有返回值的，并且是要用 df['grade'] 接收而不是 df，否则整个 dataframe 只会剩下 grade 这一列。

1.2K3 0

Python 数据处理：Pandas库的使用

虽然 Pandas 采用了大量的 NumPy 编码风格，但二者最大的不同是 Pandas 是专门为处理表格和混杂数据设计的。而 NumPy 更适合处理统一的数值数组数据。...DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共用同一个索引）。DataFrame中的数据是以一个或多个二维块存放的（而不是列表、字典或别的一维数据结构）。...，只要有一个索引数组或列表即可。...'max' 使用整个分组的最大排名 'first' 按值在原始数据中的出现顺序分配排名 'dense' 类似于'min'方法，但是排名总是在组间增加1，而不是组中相同的元素数 ---- 2.11 带有重复标签的轴索引...虽然许多 Pandas 函数（如reindex）都要求标签唯一，但这并不是强制性的。

22.7K1 0

Python 数据分析（PYDA）第三版（二）

asarray 将输入转换为 ndarray，如果输入已经是 ndarray，则不复制 arange 类似于内置的range，但返回一个 ndarray 而不是列表 ones, ones_like 生成所有值为...（类似于 Python 内置函数sorted），而不是在原地修改数组。...，NumPy 版本更快，并返回一个 NumPy 数组而不是 Python 列表。...由于 DataFrame 是二维的，您可以使用类似 NumPy 的符号使用轴标签（loc）或整数（iloc）选择行和列的子集。..."max" 使用整个组的最大等级 "first" 按数据中值出现的顺序分配等级 "dense" 类似于method="min"，但等级总是在组之间增加 1，而不是在组中相等元素的数量之间增加具有重复标签的轴索引

2170 0

Pandas图鉴(二)：Series 和 Index

在这里使用方括号而不是小括号的目的是为了获得方便的Python切分：可以使用一个单冒号或双冒号，其含义是熟悉的start:stop:step。缺失的 start（end）就是从系列的开始（到结束）。...索引是一个真正的多态对象。默认情况下，当创建一个没有索引参数的Series（或DataFrame）时，它初始化为一个类似于Python的range()的惰性对象。...（实际上是一个DataFrame），而array_equal直接返回一个布尔值。...，而不是第一个。...请注意，s.unique()比np.unique要快（O(N)vs O(NlogN)），它保留了顺序，而不是像np.unique那样返回排序后的结果。

2332 0

python数据科学系列：pandas入门详细教程

正因为pandas是在numpy基础上实现，其核心数据结构与numpy的ndarray十分相似，但pandas与numpy的关系不是替代，而是互为补充。...二者之间主要区别是：从数据结构上看： numpy的核心数据结构是ndarray，支持任意维数的数组，但要求单个数组内所有数据是同质的，即类型必须相同；而pandas的核心数据结构是series和dataframe...、切片访问、通函数、广播机制等 series是带标签的一维数组，所以还可以看做是类字典结构：标签是key，取值是value；而dataframe则可以看做是嵌套字典结构，其中列名是key，每一列的series...，而join则只适用于dataframe对象接口 append，concat执行axis=0时的一个简化接口，类似列表的append函数一样实际上，concat通过设置axis=1也可实现与merge...unique、nunique，也是仅适用于series对象，统计唯一值信息，前者返回唯一值结果列表，后者返回唯一值个数(number of unique） ?

13.8K2 0

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

虽然pandas采用了大量的NumPy编码风格，但二者最大的不同是pandas是专门为处理表格和混杂数据设计的。而NumPy更适合处理统一的数值数组数据。...，即使它包含的是字符串而不是整数。...如果你使用过数据库，你可以认为是类似join的操作。...DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共用同一个索引）。DataFrame中的数据是以一个或多个二维块存放的（而不是列表、字典或别的一维数据结构）。...它们可以让你用类似NumPy的标记，使用轴标签（loc）或整数索引（iloc），从DataFrame选择行和列的子集。

6K7 0

Pandas 2.2 中文官方教程和指南（十七）

顺序由categories的顺序而不是值的词法顺序定义。在内部，数据结构由一个categories数组和一个指向categories数组中实际值的整数数组codes组成。...numpy数组目前，分类数据和底层的Categorical是作为 Python 对象实现的，而不是作为低级别的 NumPy 数组 dtype。...NumPy 数组而不是 Categorical 时也会发生这种情况：使用整数数组（例如 np.array([1,2,3,4])）会表现出相同的行为，而使用字符串数组（例如 np.array(["a",...numpy 数组当前，分类数据和底层的 Categorical 是作为 Python 对象实现的，而不是作为低级 NumPy 数组 dtype。...NumPy 数组而不是Categorical时也会发生这种情况：使用整数数组（例如np.array([1,2,3,4])）将表现出相同的行为，而使用字符串数组（例如np.array(["a","b",

3281 0

Pandas的列表值处理技巧，避免过多循环加快处理速度

问题1:列表存储为字符串您经常会遇到的一个问题是，panda将以字符串的形式读取列表，而不是以列表的形式。...这个类型比较困难，eval()函数因为列表缺少内部引号而不能工作，以便将其识别为一个列表对象。快速而粗糙的解决方案是简单地向字符串添加引号，然后应用eval()。...如果我们将列表数据集化作为一个2D数组,然后将其维度从2减少到1,将允许我们再次应用经典的Pandas功能。...其思想是，我们创建一个dataframe，其中的行与以前相同，但每个水果都被分配了自己的列。...请注意，“相关性”并不是真正正确的术语，因为我们使用的不是度量或序数数据，而是二进制数据。同样，有多种方法来关联这些水果。一个直接的方法是皮尔逊相关系数，它也可以用于二进制数据。

1.9K3 1

Pandas笔记-基础篇

Series Series是一种类似一维数组的对象，由一组数据和一组与之相关的数据索引组成 In [9]: obj = Series([4,7,-5,3]) In [10]: obj.index Out...DataFrame可以被看做有Series组成的字典（共用一个索引），构建DataFrame最常用的方法是直接传入一个由等长列表或Numpy数组组成的字典。...DataFrame还可以通过类似字典标记的方式或属性的方式获取DataFrame为一个Series。...将列表或者数组赋值给某个列时，其长度必须与DataFrame长度匹配。如果赋值的是Series，就会精准匹配DataFrame的索引，所有空位都将被填上缺失值。...max 使用整个分组的最大排名 first 按值在原始数据中的出现顺序分配排名带有重复值得轴索引虽然许多pandas函数如reindex都要求标签唯一，但这并不是强制性的。

6482 0

python pkl文件_Python字符串格式化输出的方式包括

,index=["a","b","c"]) print('data:\n',df) print('\n.unique:(列)\n',df['C'].unique()) #.loc默认逗号分隔，逗号前是行...，逗号后是列 print('\n.unique:(行)\n',df.loc['b'].unique()) print('\n.unique:(列)\n',df.loc[:,'C'].unique())...data: A B C a 1 4 7 b 2 5 5 c 3 6 7 .unique:(列) [7 5] .unique:(行) [2 5] .unique:(列) [7 5]...Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。...在没有指定具体的索引时，则自动创建一个0~N-1的整数型索引 0 9 1 23 2 3 3 56 dtype: int64 可以通过Series的values和index属性获取数组的值和索引

2.7K2 0

数据分析利器 pandas 系列教程（一）：从 Series 说起

Series 是一种类似于一维数组的对象，由一组数据（数据类型可以是整数、浮点数、字符串和其他 Python 对象）和与之同长度的索引（或称标签）组成。...data 是必选参数，index 如缺省，其默认是 range(len(data))，如上面的代码没有指定 index，则 index = [0,1,2,3]，而不是[1,2,3,4]；dtype 如缺省...其他常用函数新增一行数据有两个函数：append() 和 set_value() 可以完成该功能，不过 append() 只接受 Series/DataFrame 形式参数，是通过新建了一个 Series...删除一行数据使用 drop() 函数即可，注意它不默认是原地修改，需要接收返回值： s2 = s2.drop('math') print(s2) ?...中的不重复数据，直接用 unique() , 它返回一个列表，Series 本身并没有变化；如果想去掉 Series 里的重复数据，推荐用 drop_duplicates()，它也有 inplace

4804 0

pandas数据清洗，排序，索引设置，数据选取

“Series各值是否包含传入的值序列中”的布尔数组 unique #返回唯一值的数组 value_counts #返回一个Series，其索引为唯一值，值为频率...组成的Series类型 df.duplicated('key')#两行key这一列一样就算重复 df['A'].unique()# 返回唯一值的数组（类型为array） df.drop_duplicates...fill_value=0) # inplace=Ture，在DataFrame上修改数据，而不是返回一个新的DataFrame df1.reindex(['a','b','c','d','e'],...的每一个元素施加一个函数 func = lambda x: x+2 df.applymap(func), dataframe每个元素加2 (所有列必须数字类型) contains # 使用DataFrame...模糊筛选数据(类似SQL中的LIKE) # 使用正则表达式进行模糊匹配,*匹配0或无限次,?

3.2K2 0

python pandas 基础之一

pandas的两大数据结构：Series和DataFrame. Series用于储存一个序列一样的一维数据；DataFrame用于多维数据。一....Series: 跟数组numpy类似，多了一些额外的功能。主数组的每个元素都有一个与之相关的标签，存储在Index里。...(): s.unique(),返回一个去重后的元素。...它能够通过标签对齐，其中标签不一致的值为NaN 二. pandas: 数据结构跟excel类似，类似于将Series使用场景应用的多维。各列的数据结构可以是不同类型的。...获取一行的数据：frame.ix[3] 获取多行：frame.ix[[1,2,5]] 获取多行：frame.in[0:5] 获取某一个元素，需要指定列名称和行名称：frame['price'][4]

1.3K5 0

最全面的Pandas的教程！没有之一!

上面的 data 参数可以是任意数据对象，比如字典、列表甚至是 NumPy 数组，而index 参数则是对 data 的索引值，类似字典的 key。...在使用这个函数的时候，你需要先指定具体的删除方向，axis=0 对应的是行 row，而 axis=1 对应的是列 column 。删除 'Birth_year' 列： ? 删除 'd' 行： ?...你可以从一个包含许多数组的列表中创建多级索引（调用 MultiIndex.from_arrays ），也可以用一个包含许多元组的数组（调用 MultiIndex.from_tuples ）或者是用一对可迭代对象的集合...请注意，如果你没有指定 axis 参数，默认是删除行。删除列： ? 类似的，如果你使用 .fillna() 方法，Pandas 将对这个 DataFrame 里所有的空值位置填上你指定的默认值。...和 .merge() 不同，连接采用索引作为公共的键，而不是某一列。 ? 同样，inner 代表交集，Outer 代表并集。

25.8K6 4

pandas库的简单介绍（2）

DataFrame既包含行索引，也包含列索引，可以视为多个Series集合而成，是一个非常常用的数据结构。...3.1 DataFrame的构建 DataFrame有多种构建方式，最常见的是利用等长度的列表或字典构建（例如从excel或txt中读取文件就是DataFrame类型）。...索引对象类似数组；也像一个固定大小的集合，但是集合不允许有重复元素，索引对象则可以。...由于类似数组和集合，索引对象的一些方法和属性如下：一些索引对象的方法和属性方法描述 append 将额外的索引对象粘贴到原对象后，产生一个新的索引 difference 计算两个索引的差集 intersection...另外一种重建索引的方式是使用loc方法，可以了解一下： reindex方法的参数表常见参数描述 index 新的索引序列(行上) method 插值方式，ffill前向填充，bfill后向填充

2.3K1 0

从pandas中的这几个函数，我看懂了道家“一生二、二生三、三生万物”

nunique()既适用于一维的Series也适用于二维的DataFrame，但一般用于Series较多，此时返回一个标量数值，表示该series中唯一值的个数。...02 unique nunique用于统计唯一值个数，而unique则用于统计唯一值结果序列。接收一个series类型作为输入，返回一个去重后的一维ndarray对象作为输出。...正因为各列的返回值是一个ndarray，而对于一个dataframe对象各列的唯一值ndarray长度可能不一致，此时无法重组成一个二维ndarray，从这个角度可以理解unique不适用于dataframe...03 value_counts 如果说unique可以返回唯一值结果的话，那么value_counts则在其基础上进一步统计各唯一值出现的个数；类似的，unique返回一个无标签的一维ndarray作为结果...分组后如不加['成绩']则也可返回dataframe结果从结果可以发现，与用groupby进行分组统计的结果很是相近，不同的是groupby返回对象是2个维度，而pivot_table返回数据格式则更像是包含

2.5K1 0

盘点66个Pandas函数，轻松搞定“数据清洗”！

df["迟到天数"] = df["迟到天数"].clip(0,31) 唯一值，unique()是以数组形式返回列的所有唯一值，而nunique()返回的是唯一值的个数。...df["gender"].unique() df["gender"].nunique() 输出：在数值数据操作中，apply()函数的功能是将一个自定义函数作用于DataFrame的行或者列；applymap...列操作数据清洗时，会将带空值的行删除，此时DataFrame或Series类型的数据不再是连续的索引，可以使用reset_index()重置索引。...df.select_dtypes("int64") 输出： isin()接受一个列表，判断该列中元素是否在列表中。...df["累计销量"] = df["销量"].cumsum() 输出：注：cumprod()方法是指连乘，用于与连加一样，但使用频率较少。

3.7K1 1

Python数据分析-pandas库入门

pandas使用最多的数据结构对象是 DataFrame，它是一个面向列（column-oriented）的二维表结构，另一个是 Series，一个一维的标签化数组对象。...，即使它包含的是字符串而不是整数。...DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共用同一个索引）。DataFrame 中的数据是以一个或多个二维块存放的（而不是列表、字典或别的一维数据结构）。...，最常用的一种是直接传入一个由等长列表或 NumPy 数组组成的字典，代码示例： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'...例如，我们可以给那个空的 “debt” 列赋上一个标量值或一组值（数组或列表形式），代码示例： frame2.debt = np.arange(6.) frame2 注意：将列表或数组赋值给某个列时，

3.7K2 0

资源 | 23种Pandas核心操作，你需要过一遍吗？

一般而言，Pandas 是使 Python 成为强大而高效的数据分析环境的重要因素之一。...输出到一张表： print(tabulate(print_table, headers=headers)) 当「print_table」是一个列表，其中列表元素还是新的列表，「headers」为表头字符串组成的列表...（13）将 DataFrame 转换为 NumPy 数组 df.as_matrix() （14）取 DataFrame 的前面「n」行 df.head(n) （15）通过特征名取数据 df.loc[feature_name...] DataFrame 操作（16）对 DataFrame 使用函数该函数将令 DataFrame 中「height」行的所有值乘上 2： df["height"].apply(*lambda* height...： df["name"].unique() （19）访问子 DataFrame 以下代码将从 DataFrame 中抽取选定了的行「name」和「size」： new_df = df[["name",

2.9K2 0

资源 | 23种Pandas核心操作，你需要过一遍吗？

一般而言，Pandas 是使 Python 成为强大而高效的数据分析环境的重要因素之一。...输出到一张表： print(tabulate(print_table, headers=headers)) 当「print_table」是一个列表，其中列表元素还是新的列表，「headers」为表头字符串组成的列表...（13）将 DataFrame 转换为 NumPy 数组 df.as_matrix() （14）取 DataFrame 的前面「n」行 df.head(n) （15）通过特征名取数据 df.loc[feature_name...] DataFrame 操作（16）对 DataFrame 使用函数该函数将令 DataFrame 中「height」行的所有值乘上 2： df["height"].apply(*lambda* height...： df["name"].unique() （19）访问子 DataFrame 以下代码将从 DataFrame 中抽取选定了的行「name」和「size」： new_df = df[["name",

1.4K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭