Pandas:如何在稀疏表中选择非零值的列

Pandas是一个基于Python的数据分析工具，它提供了丰富的数据结构和数据分析功能。在处理稀疏表（Sparse DataFrame）时，可以使用Pandas提供的方法来选择非零值的列。

要在稀疏表中选择非零值的列，可以使用Pandas的SparseDataFrame对象的sparse.to_dense()方法将稀疏表转换为密集表（Dense DataFrame），然后使用DataFrame对象的loc属性进行列选择。

以下是一个示例代码：

import pandas as pd

# 创建稀疏表
sparse_data = pd.SparseDataFrame({"A": [0, 1, 0, 0], "B": [0, 0, 1, 0], "C": [1, 0, 0, 1]}, default_fill_value=0)

# 将稀疏表转换为密集表
dense_data = sparse_data.to_dense()

# 选择非零值的列
non_zero_columns = dense_data.loc[:, (dense_data != 0).any()]

print(non_zero_columns)

输出结果为：

在这个示例中，我们首先创建了一个稀疏表sparse_data，然后使用to_dense()方法将其转换为密集表dense_data。接着，我们使用loc属性和(dense_data != 0).any()条件来选择非零值的列，最后打印出结果。

对于Pandas的相关产品和产品介绍，您可以参考腾讯云提供的云原生数据库TDSQL和云数据库TencentDB for PostgreSQL。这些产品提供了高性能、可扩展的数据库解决方案，适用于各种应用场景。

Pandas:如何在稀疏表中选择非零值的列

python、pandas

我有一个包含2000列的稀疏表，我想选择一些特定的行和它们的非零值。我该怎么做呢？

浏览 0提问于2017-06-09得票数 2

2回答

将每行10个随机非零值的值设置为零

python、pandas

我有一个非常稀疏的Pandas DataFrame，大约有1,000行和10,000列。大多数行只包含20-100个非零值。现在，我想在每一行中选择任意10个随机非零值，并将它们的值设置为0。

浏览 0提问于2018-07-24得票数 0

1回答

有效地更新特征中的大型稀疏矩阵的某些块？

c++、sparse-matrix、eigen、eigen3

假设我有一个具有以下模式的大型稀疏矩阵：为列主稀疏矩阵保留每列非

浏览 8提问于2022-06-13得票数 5

回答已采纳

1回答

对具有稀疏列的pandas.DataFrame中行的基于索引的访问

python、pandas、dataframe、sparse-matrix

由于内存限制，我不得不在pandas.DataFrame (pandas版本1.0.5)中使用稀疏列。我对这里发生的事情的假设是，内部csc矩阵表示和我正在访问列中不包含任何非零值的行中的值的事实最初会扰乱填充值。int32, 0]2 Spar

浏览 8提问于2020-08-01得票数 3

回答已采纳

3回答

C语言中的稀疏矩阵存储

c、matrix、sparse-matrix

我有一个不对称的稀疏矩阵，即稀疏程度是随机的，我不能指望所有的值都离对角线有一定的距离。也就是说，如果第m行的第一个非零值</

浏览 1提问于2010-08-13得票数 2

回答已采纳

1回答

如何在只有一个值集的稀疏矩阵中查找列

matrix、julia

我有一个很大的稀疏矩阵M。如何在只有一个值集的矩阵中找到列的索引？这恰好是一个非零值。

浏览 7提问于2020-05-13得票数 1

回答已采纳

1回答

求稀疏矩阵中的逐行极小值

matlab、sparse-matrix、accumarray

我想得到稀疏矩阵中每行的最小非零值。我为稠密矩阵找到的解决方案建议通过将零值设置为NaN或Inf来掩盖零值。然而，这显然不适用于稀疏矩阵。理想情况下，我应该得到所有逐行极小值的列向量，就像我使用但是，显然，由于稀疏性，使用min给我留下了一个全零

浏览 2提问于2013-10-14得票数 2

回答已采纳

1回答

在CUDA中为RDF三元组实现一个大型布尔稀疏矩阵(可能有1000万个条目)

matrix、cuda

我正在寻找一个合适的矩阵格式来表示一个非常大的布尔稀疏矩阵(只包含0和1)。我一直在阅读，发现了几种格式，如压缩稀疏行、压缩稀疏列等。由于矩阵非零元素都是1，那么哪种格式应该是最好的选择？矩阵中的操作基本上是根据某种条件将0转换为1的写操作。其主要目的是查询特定行中每个1的(行，col)对的矩

浏览 1提问于2014-03-09得票数 1

回答已采纳

1回答

构造SciPy稀疏CSC矩阵的索引for

python、arrays、numpy、scipy、sparse-matrix

我有许多表示稀疏矩阵(即具有非零条目的列)的列表，我需要将其表示为SciPy稀疏csc_matrix。但是，请注意，在我的稀疏矩阵中只有一行，因此该列表只是指向该行中具有非零条目的列。例如：这个列表告诉我，在我

浏览 4提问于2020-02-16得票数 2

1回答

SQL -稀疏表、总大小和单元格空间

c#、sql-server

好的，所以我一直在做一个项目，在这个项目中我需要创建一个sql 'wide表‘或者一个sql表，它可以处理超过1000列的数据。为了建立一个示例，让我们假设1502列中的列为一行： 1495列专用于使用"number_in

浏览 4提问于2016-08-09得票数 0

回答已采纳

1回答

将稀疏矩阵保存为行、列和值向量

matlab、matrix、sparse-matrix

我在mat文件中保存了一个稀疏矩阵。我希望在C++中处理它，但我的库希望稀疏矩阵表示为三个向量：colIdx (非零列索引的向量)、rowIdx (非零行索引的向量)和val (值向量)。有没有执行类似操作的内置命令？

浏览 3提问于2015-08-24得票数 0

2回答

如何将稀疏矩阵写入文本文件

matlab

我想写一个稀疏矩阵到一个文本文件中。假设我的稀疏矩阵是A.The，A的第一行在10，11索引处有非零值。第二行在第1，2个索引处具有非零值。我如何在MATLAB中做到这一点？

浏览 0提问于2014-02-24得票数 0

1回答

SQL中的稀疏点积

sql、performance、optimization、query-optimization

假设我有一个表，其中存储了一系列稀疏向量。稀疏向量意味着它只在数据结构中显式地存储非零值。我可以有一个一百万维向量，但我只存储非零维度的值。因此，大小与非零条目的数量成比例，而不是与向量的维数成比例。表定义如下: vector_id : int dimension : int value : float 现在，在普通编程领域，我

浏览 3提问于2009-06-29得票数 8

回答已采纳

2回答

如何将SparseMatrix.valuePtr()、SparseMatrix.outerIndexPtr()和SparseMatrix.innerIndexPtr()设置为CSR格式？

c++、eigen

我已经有了中的稀疏矩阵数据，即:我已经拥有非零值(以double[]的形式)、非零值的行和列索引(都是int[])的数据。我的问题是，如何将它们直接分配给特征库中的稀疏矩阵？我知道稀疏矩阵中的相关字段是valuePtr、outerInde

浏览 5提问于2017-02-27得票数 1

回答已采纳

1回答

将tf.nn.top_n的输出转换为稀疏矩阵

python、matrix、indexing、tensorflow、sparse-matrix

正如标题所述，我试图从tensorflow中的矩阵中提取每一行的最高n个元素，并将结果存储在稀疏张量中。我已经能够用tf.nn.top_n提取索引和值，但是索引并不遵循tf.SparseTensor所要求的约定。具体来说，tf.nn.top_n返回一个与结果值矩阵(行x)形状相同的col索引矩阵，而tf.SparseTensor则需要一个(#非零x2)矩阵，其中每个非零</

浏览 1提问于2017-04-05得票数 0

回答已采纳

1回答

如何从MATLAB中将稀疏矩阵传递给共享库

c、matlab、sparse-matrix、mex

我想从MATLAB中向共享库传递一个稀疏矩阵，在那里执行一些操作(用C编写)，然后返回它。如果在MATLAB中给出稀疏矩阵格式的一些信息，用C语言进行转换，这是值得赞赏的。提前谢谢。

浏览 1提问于2013-01-28得票数 3

1回答

转换为一个热向量的字符串索引对于某些行是否为空(没有将索引设置为1)？

apache-spark-mllib

我有一个有一个分类列的pyspark，该列正在通过.df = si.transform(1,[],[])知道这里会发生什么吗？

浏览 3提问于2020-01-17得票数 1

回答已采纳

1回答

稀疏列不显示任何节省

sql、sql-server、null、sparse-columns

我运行了一个测试，将包含几个稀疏列的表与不包含稀疏列的表进行比较，我发现节省的空间为零。我有两个表，这两个表主要在varchar列中存储地址信息。两个表都允许空值，其中一个表设置了列稀疏属性。我在每个函数中插入1000行默认值</

浏览 9提问于2013-03-03得票数 1

回答已采纳

2回答

关于稀疏存储dok_matrix的几个问题

python、numpy、scipy、sparse-matrix

现在我有八千万行，六十万列，五亿个值是非零值，它是稀疏的。我选择scipy api dok_matrix来存储它，当使用dok_matrix时，它似乎不仅仅是存储非零值，.And是什么内存？我有5亿个非零值，但是内存不足，为什么？value for i

浏览 5提问于2019-07-22得票数 0

1回答

在稀疏数据的情况下，如何更快地训练LDA(潜在的Dirichlet分配)并预测新的文档？

apache-spark、machine-learning、cluster-analysis、lda、unsupervised-learning

关于培训LDA：经过培训，现在我们有了一个新的LDA模型，因此我们可以使用它来预测哪些主题具有新的文档。但在向模型提供新文档之前，我们需要将其转换为单

浏览 3提问于2017-09-26得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas:如何在稀疏表中选择非零值的列

相关·内容

Pandas:如何在稀疏表中选择非零值的列

将每行10个随机非零值的值设置为零

有效地更新特征中的大型稀疏矩阵的某些块？

对具有稀疏列的pandas.DataFrame中行的基于索引的访问

C语言中的稀疏矩阵存储

如何在只有一个值集的稀疏矩阵中查找列

求稀疏矩阵中的逐行极小值

在CUDA中为RDF三元组实现一个大型布尔稀疏矩阵(可能有1000万个条目)

构造SciPy稀疏CSC矩阵的索引for

SQL -稀疏表、总大小和单元格空间

将稀疏矩阵保存为行、列和值向量

如何将稀疏矩阵写入文本文件

SQL中的稀疏点积

如何将SparseMatrix.valuePtr()、SparseMatrix.outerIndexPtr()和SparseMatrix.innerIndexPtr()设置为CSR格式？

将tf.nn.top_n的输出转换为稀疏矩阵

如何从MATLAB中将稀疏矩阵传递给共享库

转换为一个热向量的字符串索引对于某些行是否为空(没有将索引设置为1)？

稀疏列不显示任何节省

关于稀疏存储dok_matrix的几个问题

在稀疏数据的情况下，如何更快地训练LDA(潜在的Dirichlet分配)并预测新的文档？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐