按列元素聚合数据框行时，保留对应的行名

文章/答案/技术大牛

发布

2回答

、、

我有一个数据帧Df，其中一些行在column A and B上有重复的元素 A B C D E F G4 Cab Cast 2 0 1 2 1 我知道我可以使用a

浏览 16提问于2021-05-27得票数 1

回答已采纳

4回答

提取R中列的最高和最低值，以及行标识符

、

假设我有以下类型的数据： df<-as.data.frame(matrix(rnorm(10*10000, 1, .5), ncol=10)) 我想要一个新的数据帧，它保留10个原始列，但对于每一列，只保留最高的10个和最低的10个值。重要的是，行具有与需要保留在新数据框中的id值相对应

浏览 37提问于2017-02-03得票数 2

回答已采纳

4回答

子集数据框并保留行名和列名

、、、、

我有一个71521行X894列的数据帧，其中包含相关性值(-1.0到+1.0)。行名是基因名，而列名是miRNA名。我想创建一个仅包含以下相关值的子数据帧(或矩阵，无关紧要)：1)在-1.0和-0.9之间(负相关) 2)在+0.9和+1.0 (正相关)之间3)在-0.05和+0.05 (无相关性)之间我使用which()函数，发现我的数据帧中有4,120个负相关值，380,132

浏览 1提问于2013-12-06得票数 3

1回答

如何在R中排序数据的行名？

我使用从一个导入的CSV文件中的生物数据，其中基因符号作为行名被放入“列0”中。我想根据基因符号按字母顺序排列行。我正在考虑将0列行名提取到一个新列中，然后排序，但我更喜欢保留数据集的原样。是否仍然需要排序行名呢？

浏览 3提问于2019-10-15得票数 0

回答已采纳

2回答

Groupby列保留具有最小值的多行

、、

我有一个由两列id和一列数值组成的dataframe。我想按第一个id列分组，并保留与第二列中最小值对应的所有行，以便在需要时保留多行。这是我的熊猫数据框 id1 id2 num11 1 41 2 32 6 92 65 2 9

浏览 46提问于2019-01-17得票数 2

回答已采纳

2回答

在R中，如何使用combn检索完整的矩阵？

、

我的问题是删除特定的用途，看起来像这样:如何转换一个组合:首先使用combn(letters[1:4], 2)计算组合[1,] "a" "a" "a" "b" "b" "c" [2,] "b" "c" "d" "c" "d" "d"

浏览 1提问于2011-04-09得票数 4

回答已采纳

2回答

在pandas列中跨连续的非NaN单元格聚合字符串，但不跨整个列聚合字符串

、、、、

我正在处理一个nlp问题，其中我必须分析格式奇怪的excel文件。有一列包含文本，其中每个文档跨越多个单元格。文档本身由空单元格分隔。我还想从文本数据中预测其他具有分数的列。This is what it looks like 我已经将工作表导入到pandas数据框中，现在我正在尝试聚合属于每个文档的单元格，同时保留分数。This is the goal state 我已经开始尝试嵌套循环，但我觉得它比必要

浏览 26提问于2019-01-09得票数 2

1回答

有没有办法在使用groupby.sum的同时保留其他列？

、、、、

假设我有一个大约40列的文本文件，我需要删除重复项/组，方法是使用5列的。4 h 我想要groupby或df.drop_duplicates() df = df.groupby([1,2,4])[5].sum().reset_index() 所以结果会是这样的1 2 4 5b c 456 12 h c 456 4 有没有办法让我把其他列加入到这个结果数据中，因为它们不需要作为g

浏览 37提问于2020-01-11得票数 0

回答已采纳

2回答

在R中读取表的问题

、、

我的数据(txt文件)如下：Australia 1 2 4 3 2读取此表的问题包括： 1)第一行只有5个元素(a~e)，而它下面的所有行都有6个元素。它的列名应该是"Country“。然后，a对应于第一个数字1，b对应于2，..and e对应于2(在澳大利亚的情况下)。如何在第一列中添加一个列名，这

浏览 2提问于2014-11-15得票数 1

1回答

在不显式指定路径的情况下，自动绑定到路径可以吗？

、、、

有效的)我仍然想问。DataGrid具有根据发送到它的元素的字段自动创建列的功能。但是，在我的应用程序中，我们已经在行中禁用了数据编辑，相反，当用户单击一行时，会弹出一个对话框，用于编辑与单击的行对应的对象的每个字段的值。我正在发送与行对应的对象，单击该对话

浏览 5提问于2015-08-07得票数 0

回答已采纳

2回答

为R中的数据字段中的列的每个唯一值选择前有限行数

我有一个有3列的数据框。a，b，c。有多行对应于a列的每个唯一值。我想选择与a列的每个唯一值对应的前5行。c列是某个值，并且数据帧已经按其降序排序，所以这不是问题。

浏览 2提问于2012-08-30得票数 0

回答已采纳

2回答

在R中为列中的唯一元素在数据帧中创建附加行

、、、

我在R中有这个数据帧。secondn2 c;c 3;3我想把这个转换成这样的数据框架nr first secondn1 b 7n3 d 4对于每一行，我只想在‘first’中保留唯一的元素；对于每个唯一的<em

浏览 2提问于2016-07-29得票数 1

回答已采纳

1回答

python Aggregate (groupby) 2D矩阵

、、、

我有一个正方形的数据数组/矩阵(大约2000行和2000列)，我想把它聚合成一个更小的数组(大约1000行和1000列)。我有一个main_ids列表，它对应于原始数组中的行/列。例如new_ids = 0,0,0,1,1,2，...将把聚合的前3行/列发送到新行</em

浏览 0提问于2014-12-03得票数 1

1回答

在没有主键的情况下，仅检索表的最后一行

我有一个有三列的表：列2:包含与XML数据记录相对应的文件名(及其路径)(关于XML数据存储在哪个文件中)C:\Extended Events\ReadWrite_0_130863592475800000 C:\Exten

浏览 0提问于2015-09-14得票数 0

回答已采纳

1回答

将日期列合并为一个

、

我希望按每行的最新日期(如果日期不同)合并日期列，但保留ID列。我的数据框看起来像图像。我想保留NA行。正如您在某些行中看到的那样，timestamp_c是填充的，而不是时间戳(在其他一些行中，时间戳是相反的)。我想保留已完成的列，而不是NA。我试着跟踪this，但我找不到解

浏览 15提问于2021-11-01得票数 0

1回答

如何对Pandas中的最后两行进行分组和删除

、

在pandas数据框中，我想按一列( ID )分组，然后删除每个ID的最后两行。我知道这段代码将为每个ID保留最后两行，但我希望删除最后两行，并保留其余行。df.groupby('ID').nth(-2) 感谢你的帮助

浏览 45提问于2021-04-06得票数 0

回答已采纳

1回答

SSRS -按组划分的中位数-锯齿数组？

、、

我被要求替换矩阵中的3列，该矩阵在行组中按名称聚合。这3列位于列组之外。我也是VB的<

浏览 3提问于2015-04-29得票数 0

1回答

将csv或表变量写入文件

假设我有一个这样的文件：2 3 4 55 7 8 4例如write.csv(myobject$a && myobject$b, file="outfile.csv")

浏览 0提问于2013-05-19得票数 3

回答已采纳

1回答

从一些不均匀的XML构建db记录的最好方法是什么？

、、、

我有一些XML需要使用python中的lxml方法进行解析。解析了元素后，我希望能够比较一些结构化对象(查找增量)。我需要解析大约50个XML文件，XML中的数据是“不均匀的”形式(我不确定正确的名称是什么)。1> <parameter A> <parameter C> <ID 3><&

浏览 0提问于2012-04-11得票数 0

回答已采纳

1回答

如何为我的多索引pandas数据帧中的每个级别(0)只选择前两行？

、、、

假设我有一个df，我按两列分组。然后，我希望只获取grouped by object的前两行。即 grouped_data = df.groupby(['company','person']).first() 那么如何为每一行选择前两行呢？例如，company = asda有8行，即该公司下的9个人，但我只想要前两行。我如何使用上面的数据帧来做这件事？注我之所以使用first

浏览 16提问于2020-07-17得票数 0

点击加载更多