基于另一个数据框中的列的子集pandas数据框

、、

我正在处理一个非常大的以制表符分隔(大约20000行* 30000列)的.txt形式的表，这使得文件大于20 tab。我检查了桌面的内存，似乎无法直接使用R中的read.delim或python中的pandas来读取该文件。我目前正在考虑基于列的过滤器制作表的一个小子集，新的文本文件将是20000行* 1200列</em

浏览 34提问于2020-10-19得票数 0

回答已采纳

3回答

在pandas中从较大的数据帧中删除较小数据帧中的值

、、

我在pandas中有一个非常大的数据帧，其中一列被标记为"Col2“，该列的行值包含一个长字符串。我从这个数据框中解析出另一个较小的数据框，其中包含我想要从原始数据框中删除的列"Col2“值。基本上，我希望遍历原始数据帧，并根据与

浏览 0提问于2015-11-19得票数 0

1回答

无法子集Pandas* dataframe中的数据*

、、、

基于某些条件，我尝试从Pandas dataframe创建一个子集。我可以创建两个子集，但在尝试创建另一个子集时出现语法错误。数据框是具有列标题的.csv文件:编号、环境、阶段、类型、计划结束日期、关闭代码、结束子类别、由更改引起的事件、待定更改。我应该尝试使用“计划结束日期”创建一个子集，其中计划结束日期离今天日期超过4天的记录应该在不同的<e

浏览 1提问于2019-11-21得票数 0

1回答

我有两个不同的数据集。根据column values in these 2 data frames的一个条件，我想创建一个新的数据集。10000 4 61 Day_2 5000 如果这些条件满足真temp=d1[d1.ID.isin(d2.ID) & d1['Period']<=d2['Period']]，则temp将是子集ValueError: Can only compare identically-labeled Se

浏览 10提问于2020-07-27得票数 1

回答已采纳

1回答

如何获取pandas数据框中列的子集？

、、

我得到了一个具有多列的pandas数据帧和一个具有列索引(0，1，...，n)的列表，该列表索引数据帧的列的子集。如何创建恰好包含这个列子集的新数据框？

浏览 3提问于2021-11-30得票数 0

1回答

如何打印一串数据帧的输出？帮助我改进代码

、、

我正在努力提高我的蟒蛇技术。我能做些什么来使我的代码更有效率？我在k_frames中有10个数据集，如何将它们分别设置为新的数据帧并打印输出。

浏览 0提问于2018-04-22得票数 0

1回答

如何在dataframe中创建基于列名的变量？

、、、、

我想在python中根据我的dataframe的列名创建变量。我不确定这是否可能，因为我是Python的新手。假设我的df是这样的： ID Date Name Counts2 05/04/2018 1XMK 223 05/04/2018 N2IS 130 如何创建一个变量来引用此数据帧中</e

浏览 18提问于2019-04-04得票数 0

1回答

我正在尝试从一行中获取多列数据，如果该行中的一列等于today date

、、、

import pandasfile = "BT_Schedule_04_27_2020_PM.xlsx"site = df["BLC ID"] if date == today: print(date) 这就得到了我想要的日期，大概是5000行中的8行。我希望能够

浏览 28提问于2020-04-28得票数 0

回答已采纳

1回答

Pandas -连接多个名称不同但数据类型相同的excel文件

、、

我想将一个特定的工作表连接到pandas DataFrame中(所有工作表的名称都相同)。我遇到的问题是，每个工作表中的列名称并不完全相同。我使用pandas编写了一段代码，但它的工作方式是将所有值连接到pandas数据框中的同一列中，但基于列的名称。所以举

浏览 29提问于2021-08-10得票数 0

1回答

更新R中的列

我有一个数据框架：为此，我添加了一个离散变量我给他们起了一些有意义的名字：现在，我想创建一个新变量，它是第一个变量+ 10 --但前提是我的离散变量的值为1 df$new_var <- as.numericdf$discrete == 1]

浏览 3提问于2017-06-02得票数 0

2回答

在pandas数据框中选择唯一的观测值

、

我有一个包含uniqueid列的pandas数据框。我想从基于此列的数据框中删除所有重复项，以便所有剩余的观测值都是唯一的。

浏览 0提问于2013-11-01得票数 7

回答已采纳

1回答

根据Pandas中的条件过滤重复行

、

我有下面的数据框，其中有基于列“原因”的重复行。Reason 123 -345 -546 Poor feedback我试图遍历上面的行子集，并仅当相应重复行的“原因”都丢失或任何一个丢

浏览 2提问于2021-04-13得票数 3

2回答

当列包含因子时，使用OR将数据框子集

、

我想在R中创建一个数据框的子集，它基于一列因子中的一个或另一个值，但似乎我不能对因子值使用|。显然，我的实际数据框的因子列中有3个以上的值，因此仅使用!= "c"是行不通的。

浏览 0提问于2011-04-16得票数 18

回答已采纳

3回答

获取基于列名的pandas数据框的子集

、、

我有一个包含140个样本(列)和大约27000个SNP(行)的pd.DataFrame。每个列名都有一个人口名称和一个数字(例如'FLFL04‘或'MI03’)具有6个不同的种群和不同数量的种群中的样本。我希望基于种群名称的各个种群的子集用于进一步的计算(Hardy-Weinberg精确测试)；我可以使用循环和正则表达式进行计算，但希望有更快的解决方案。有没有一

浏览 3提问于2013-04-21得票数 2

回答已采纳

4回答

从其他数据帧的子集中获取随机样本

、、

我有一个100，000行的大数据框，我想添加一个列，其中值是基于数据框中常见名称的另一个数据框的子集的样本。用例子来解释可能更容易。colB = c('x','x','y','y','x','y','y',&

浏览 24提问于2017-05-24得票数 1

回答已采纳

1回答

rowSums为0的子集行数

基于条件寻找数据框(所有列都是数字)的子集。我希望将rowSum =0的行设置为子集。只能找到一个解决方案来子集不等于0的行！提前谢谢。

浏览 1提问于2021-02-10得票数 0

4回答

如何从pandas数据框中选择包含非重复项的列

、

我想从pandas数据框中选择包含非重复项的列，并使用这些列组成一个子集数据框。例如，我有一个这样的数据框： x y zb 1 2 2d 4 2 3 列"x“和"z”具有非重复值，因此我希望将它们挑选出来并创建一个新的数据框</em

浏览 26提问于2019-03-22得票数 3

回答已采纳

2回答

根据另一列的值向python pandas数据框添加列

、

我有一些pandas数据框，我想添加一列，这是一列的差异，基于第三列的值。下面是一个玩具示例： import numpy as np d = {'one' : pd.Series(range(4), index'] == i]['two'][j + 1] - df[df['three

浏览 1提问于2014-08-26得票数 0

2回答

Pandas，如何使用带有多索引数据帧的子集来丢弃NA值？

、、

我有一个包含多个索引列的数据框。从这个数据框中，我需要删除列的子集中具有NaN值的行。我尝试使用pd.dropna的subset选项，但我无法找到指定列子集的方法。在下面的示例中，我需要获得最后一行的乘车。import pandas as pd a = [1, 1, 2, 2

浏览 34提问于2019-09-11得票数 3

回答已采纳

1回答

如何使用Python和Pandas创建十进制列和五分之一列来根据大小对另一个变量进行排名？

、、

我有一个数据框，它的列包含Investment，它表示交易员的投资金额。我想在数据框中创建两个新列；一个基于Investment大小给出十进制排名，另一个给出五分之一排名。我希望1代表投资最大的十进制，10代表最小的。简单地说，我希望1代表投资最大的五分位数，5代表最小的。我是Pandas的

浏览 0提问于2014-10-22得票数 18

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

非常大的制表符分隔的文本文件的列选择

在pandas中从较大的数据帧中删除较小数据帧中的值

无法子集Pandas* dataframe中的数据*

如何获取pandas数据框中列的子集？

如何打印一串数据帧的输出？帮助我改进代码

如何在dataframe中创建基于列名的变量？

我正在尝试从一行中获取多列数据，如果该行中的一列等于today date

Pandas -连接多个名称不同但数据类型相同的excel文件

更新R中的列

在pandas数据框中选择唯一的观测值

根据Pandas中的条件过滤重复行

当列包含因子时，使用OR将数据框子集

获取基于列名的pandas数据框的子集

从其他数据帧的子集中获取随机样本

rowSums为0的子集行数

如何从pandas数据框中选择包含非重复项的列

根据另一列的值向python pandas数据框添加列

Pandas，如何使用带有多索引数据帧的子集来丢弃NA值？

如何使用Python和Pandas创建十进制列和五分之一列来根据大小对另一个变量进行排名？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐