如何重塑/分解熊猫数据帧？_如何重塑/“颠覆”熊猫数据帧_熊猫重塑/转换数据帧 - 腾讯云开发者社区

pandas、dataframe、merge、append、concat

我正在尝试将多个熊猫数据帧合并为一个。我有一个主框架与位置的测量。其他数据帧包含一个位置的多个测量值。如下所示： df 1:位置ID \x_ 1 df 2:位置ID /日期-测量 1.1.1.1. df 2:位置ID /日期-测量 1月2日12:30 3 1月16日12 :30 9. df n:位置ID _。 1月1日12:30 4月16日12 :30 6月20日11:30 7 我试图创建这样一个数据框架： df_final:位置ID :X，Y，Y，Z，1，1，12:00，1，16，12 :30，12:30，20，11:30等等。 1 1 2 3 1 4 NaN 2 3 2 3 3

浏览 0提问于2019-05-09得票数 0

2回答

熊猫操纵多个数据帧

python、pandas

我正在尝试做一些数据帧操作。我如何获取像这样的数据帧？ 2018 data Age City1 City2 0 5 10 1 6 11 2 8 21 2019 data Age City1 City2 0 15 20 1 63 21 2 83 41 并像这样创建单独的数据帧 Age 0 2018 2019 City1 5 15 City2 10

浏览 3提问于2019-07-10得票数 2

1回答

如何从熊猫数据中删除多行

python、pandas、dataframe、slice

我正在尝试删除那些我认为是错误的数据帧( trying )。我看到了奇怪的行为。 spurs = [(16, 62), (72, 83)] for spur in spurs: full_path.drop(full_path.index[spur[0]: spur[1]], inplace=True) 它只会在循环中从dataframe中删除第一个支点。如果我这么做： full_path.drop(full_path.index[spurs[0][0]: spurs[0][1]], inplace=True) full_path.drop(full_path.index[spur

浏览 1提问于2021-09-06得票数 0

回答已采纳

1回答

如何用NaN值计算熊猫的时差

python、pandas、nan

我是Pandas的新手，我已经尝试过搜索，但我找不到解决方案。我有一个数据框，里面有Transaction-No，customerId和购买日期，看起来像这样： Transaction 12345 12346 12347 12348 12349 customerID 1 NaN 2019-09-01 NaN 2019-09-11 2019-09-22... 2 2019-10-01 NaN NaN NaN 2019-10-07... 3

浏览 25提问于2020-11-11得票数 3

回答已采纳

1回答

熊猫将多行交换为列

python、pandas

有谁知道如何转置熊猫数据帧吗，我有这样的数据集： # 99564, Noam Hop Company LLC, 10503 Cher rd (123) 456-7890, Motor SR 5032 # 99843, Noam Hop Prods, 902010 Rogg rd (123) 456-7890, Ed CA 3534 # 99223, Noam Skyline LLC, 12795 Rodf Road (123) 456-7890, Sats Road 3922 我想把它变成这样： # 99564, Noam, Hop Company LLC, 10503 Cher rd

浏览 14提问于2020-05-13得票数 2

回答已采纳

1回答

熊猫数据类型转换或Isomap转换

python、pandas、dataframe

我用misc.imread加载图像，在我的例子中返回2304x3 ndarray。稍后，我将这个数组附加到列表中，并将其转换为DataFrame。这样做的目的是以后在DataFrame上应用Isomap转换。我的数据框架是84行/样本(文件夹中的图像)，并且有2304个特性，每个特性都是由3个元素组成的数组/列表。当我尝试使用Isomap转换时，会得到错误： ValueError: setting an array element with a sequence. 我认为存在错误是因为我的数据框架的元素是对象类型的。首先，我尝试在每个列上使用一个转换to_numeric，但是得到了一个错误，然

浏览 0提问于2016-09-28得票数 0

回答已采纳

1回答

使用get_loc通过迭代Pandas中的数据帧来获取多个值的索引

python、pandas、loops、dataframe、data-science

Events是以日期为索引的DataFrame。它看起来是这样的： co_code co_stkdate 2009-03-17 11 2010-02-03 11 2011-02-14 363 2015-01-09 363 2010-10-15 365 residual是另一个以date作为索引的数据帧，它包含events数据帧的co_code中的元素作为列名。residual看起来像这样(有700多个专栏，但我已经发布了3个供参考)： 11 363 365 co_stkdate 1997-07-02 NaN -

浏览 22提问于2020-07-23得票数 0

1回答

熊猫:重组DataFrames

python、pandas、dataframe

我有以下熊猫的数据和基线值： df = pd.DataFrame(data=[ {'yr': 2010, 'month': 0, 'name': 'Johnny', 'total': 50},, {'yr': 2010, 'month': 0, 'name': 'Johnny', 'total': 50}, {'yr': 2010, 'month': 1, 'name

浏览 4提问于2017-07-25得票数 3

回答已采纳

1回答

在Python中如何在list的元素中组合多个数组？

arrays、python-3.x、numpy

我有一个关于将几个数组组合成一个数组的问题。我有一个长度为1000的列表，在列表的每个元素中有16个维度为100的数组，我想要实现的是一个包含1000个元素的列表，每个元素都有一个维度为1600的数组。如何实现这一点:我尝试了以下方法:返回16'000 x 100维度的x=np.concetate(x, axis=0)和返回16 x 100'000维度的x=np.concetate(x, axis=1)。我还尝试了x=np.vstack和x=np.hstack，但我自己无法获得它。有人能帮帮我吗？谢谢! 编辑:最小工作样本：我有类似这样的东西，首先是数据帧 Date

浏览 21提问于2019-03-18得票数 0

回答已采纳

1回答

熊猫多级Dataframe

python、python-3.x、pandas、dataframe

我有一个旋转的多级熊猫数据结构： Example1 Example2 Weight Rank Difference VC X Y X Y 0 ABC XYZ 1 2 1 2 0 1 PQR BCD 3 4 3 4 1 我想要融化数据框架并得到以下结构： VC Example1 Example2 Weight Rank Difference X ABC XYZ 1 1 0 Y ABC

浏览 0提问于2017-08-24得票数 0

回答已采纳

1回答

如何将单列数据框转换为多列？

pandas、dataframe

我有数据帧： col1 1a 2b 3d 4a 5a 6f 7a 8a 9e 如何获取数据帧： col1 col2 col3 1a 2b 3d 4a 5a 6f 7a 8a 9e

浏览 18提问于2021-09-02得票数 0

回答已采纳

1回答

在R中拆分大数据帧有哪些更好的方法？

我想将尺寸为103740 x 4的数据框重塑为宽格式，即从下面的第一个文本块到第二个文本块。以下函数在应用于部分数据帧时运行良好，但在应用于整个数据帧时会耗尽我机器的可用内存： reshape(analysis1[1:8], idvar=c("name", "sire_name"), timevar = "course", direction = "wide")[, -c(1,2)] 有什么更好的方法来拆分这个数据帧？ name sire_name course appea

浏览 8提问于2011-10-29得票数 1

回答已采纳

1回答

使用shape或pivot_table重新塑造熊猫数据帧(每一行堆叠)

python、pandas、stack、reshape

我有一个几乎令人尴尬的简单问题，我自己想不出来。下面是一个演示我想做什么的玩具示例，假设我有一个简单的数据框架： df = pd.DataFrame([[1,2,3,4,5,6],[7,8,9,10,11,12]],index=range(2),columns=list('abcdef')) a b c d e f 0 1 2 3 4 5 6 1 7 8 9 10 11 12 我想要的是堆叠它，以便它采取以下形式，其中列标识符已被更改(X和Y)，以便它们对于所有重新叠加的值都是相同的： X Y 0 1 2

浏览 1提问于2014-01-05得票数 2

回答已采纳

2回答

通过将某些列转换成行来重塑大熊猫的数据

python、pandas、dataframe

浏览 4提问于2020-03-30得票数 2

2回答

熊猫将列添加到列底部

python、pandas

我有一个df = pd.DataFrame([[1, 3, 5], [2, 4, 6]])，它看起来像 0 1 2 0 1 3 5 1 2 4 6 我正在尝试将每一列移动到第一列的底部。它应该看起来像..。 0 0 1 1 2 2 3 3 4 4 5 5 6 正在寻找一种在更大的数据帧上使用n行来完成此任务的方法。我正在寻找熊猫stack()的其他方法，但还没有找到解决方案。

浏览 0提问于2020-12-28得票数 2

2回答

熊猫综合指数

python、pandas

我有一个多索引的熊猫数据- a b c c1 c2 c1 c2 c1 c2 9 10.0 162 165 16 15.0 我想要创建另一个列，它将包含该行的c1列和c2列，如下所示- a b c total c1 c2 c1 c2 c1 c2 c1 c2 9 10.0 162 165 16 15.0 187 190 考虑到一级列的数目

浏览 4提问于2021-07-04得票数 0

回答已采纳

1回答

有没有办法改善熊猫框架的爆炸功能？

python、pandas、dataframe

我有一个csv文件，其中'|‘作为某些列值的分隔符。我使用了以下函数来重建数据帧，但它消耗了大量内存，并且在我的Mac16G电脑上过了一段时间后无法继续。 df = df.assign(tag=df.tag.str.split('|')).explode(tag).drop_duplicates() 我的文件大小是1.1G，大约160万行。性能监视器显示Python进程正在消耗超过30G的内存，并且很难继续，所以我必须终止它。有大量的内存交换。这类行的一个示例是： id tag uid date a|b|c label

浏览 11提问于2021-10-02得票数 1

回答已采纳

1回答

熊猫-数值栏

python、pandas、dataframe

如何选择具有数据帧中所有列的数值的列？我们可以通过使用列名来选择所需的列，然后从数据帧中切片这些列，但是如何使用其中存在的数据类型提取这些列呢？

浏览 17提问于2022-03-02得票数 0

1回答

如何将数据放入带有角点的一维ConvLSTM2D中？

keras、tensorflow、cnn、lstm

我正在尝试使基于角蛋白实例的帧预测模型与一组一维传感器一起工作.我有android可穿戴传感器数据，并且正在设计一种算法，希望能够根据过去的传感器读数来预测未来的传感器读数。模型 model = Sequential() model.add(ConvLSTM2D(filters=filters, kernel_size=(1, 1), input_shape=(None, 9, 1, 1), padding='same', return_sequences=True)) model.add(BatchNormalization()) model.add(ConvLSTM2D(

浏览 0提问于2019-05-23得票数 2

1回答

如何将数据帧重塑为包含[-1，1]的数组？

python、arrays、numpy、dataframe

我正在尝试将我的数据帧重塑为一个[-1, 1]数组。我试过了 z.reshape(-1,1) 我需要[-1, 1]数组，以便为我的时间序列模型缩放我的数据。

浏览 7提问于2019-04-10得票数 0

3回答

将Pandas DataFrame转换为一个块数组

python、pandas、numpy-ndarray

我有像这样的熊猫数据帧。但是我想让'KDB‘列像这样(没有索引)，有人能帮我吗？ [9. 3. 3. 2. .....] 我尝试使用pd.DataFrame.to_numpy()，但得到的结果如下所示。 [[ 9] [ 3] [ 3] [ 2] ...]

浏览 0提问于2020-02-25得票数 0

2回答

熊猫:在dataframe中使用重复的x列的两条条状图。

python、pandas、matplotlib、plot

我有一个稍微奇怪的csv文件，其中月份列是这样重复的。我的目标是创建一个条形图，其中每个月都有两个y列(来自a和b)。我试图通过将数据帧分割成两个--a只和b--来实现这一点，但月份列的重复却阻碍了这一过程。Python和Pandas非常新，所以也许有一个函数我不知道？任何帮助都是非常感谢的。 month cond. y Jan a 4 Jan b 8 Feb a 2 Feb b 9 March a 3 March b 7

浏览 1提问于2021-07-10得票数 0

回答已采纳

2回答

R如何将函数应用于分组数据帧的行？

假设我生成的数据帧如下所示 dataframe <- data.frame(name = (rep(c('A', 'B', 'C', 'D'), 25)), probe = rep(number, each = 4), a = rnorm(100), b = (rnorm(100)+1), c = (rnorm(100)+5)) > head(dataframe) name probe a b c 1 A 1 0.03394554 2.973

浏览 0提问于2015-10-13得票数 1

1回答

根据列名替换熊猫数据中的值

python、pandas

我想从另一个基于列名的系列中替换熊猫数据中的值。我拿到了那本书。数据文件： Y2000 Y2001 Y2002 Y2003 Y2004 Item Item Code 34 43 0 0 25 Test Val 我还有一个系列： Y2000 41403766 Y2001 45283735 Y2002 47850796 Y2003 38639101 Y2004 45226813 如何根据第二系列中的值替换第一个数据帧中的值？ -更多的编辑:要重新创建这个问题，代码和数

浏览 2提问于2015-09-22得票数 1

回答已采纳

1回答

如何获取指定列的值计数？

python、pandas

rev_id worker_id label 37675 1362 1.0 37675 2408 0.0 37675 1493 0.0 37675 1439 1.0 37675 170 0.0 37675 176 0.0 37675 481 1.0 37675 487 0.0 37675 578 0.0 这里是数据框的段落，我想按rev_id和label的值计数进行分组，label只有两个值:1和0。新的数据帧应该有两个新的列，即每个rev_id的label=1和label

浏览 0提问于2018-01-18得票数 1

回答已采纳

1回答

分类数据的真实散点图与预测散点图

r、scatter-plot、prediction、scatter

我想要一个散点图，显示分类数据的真实与预测之间的比较。数据在数据帧中。数据如下所示： predicted true 1 3 3 2 2 2 3 3 2 4 2 2 5 3 2 6 2 2 dput(tr25，)给出 structure(list(predicted = 3, true = 2), row.names = 5L, class = "data.frame") 有没有人能帮我一下？

浏览 32提问于2021-06-07得票数 0

1回答

为分类Keras准备视频数据

python、numpy、keras、deep-learning

我无法决定是否将视频数据提供给keras模型。在这种情况下，我想使用像ImageDataGenerator这样的DataGenerator。从这个answer我推测，ImageDataGenerator不适合这样做。我在keras中查看了这个github repo，它在目录中使用.npy文件。但缺点是，目前还没有数据增强。我该如何实现这一点呢？有没有办法让我用ImageDataGenerator？假设我将所有视频分成帧，然后加载包含.jpg文件的目录，结果会怎样呢？如果我用这个data generator tutorial写一个自定义数据生成器，我该如何安排这个分区字典？我的数据由.

浏览 15提问于2019-02-24得票数 0

2回答

将DataFrame重塑为np.array

python、pandas、numpy、dataframe

下午好，我有一个维度为(963,1)的数据帧，我如何将这样的内容更改为numpy格式： array ([244.1462534,212.68483386, 212.04058487, 236.39615555] 当我使用np.array (a)时，在我看来，每个元素都在不同的行中 [244.1462534, 244.1462534, 244.1462534, 244.1462534] 因为有很多，所以很难这样看

浏览 0提问于2020-09-01得票数 0

回答已采纳

1回答

如何将numpy数组转换为pandas数据帧？

python、numpy、pandas

我想要一个numpy数组的3列 px[:,:,0] px[:,:,1] px[:,:,0] 变成了熊猫的数据帧。我应该使用吗？ df = pd.DataFrame(px, columns=['R', 'G', 'B']) 谢谢雨果

浏览 1提问于2014-02-21得票数 16

回答已采纳

1回答

我怎样才能把互相堆叠在一起的条子画成格图呢？

r、ggplot2

我想用这个数据制作一个条形图： library(ggplot2) mydf=data.frame(c("A","B","C","D"),c(100,110,90,120),c(150,200,160,180)) names(mydf)=c("myfirstC","mysecondC","mythirdC") 为了绘制一个条形图，条形图上的条形图相互叠加在一起，我尝试使用以下代码： ggplot(data=mydf, aes(x=myfirstC))+ geom_col(aes

浏览 2提问于2018-01-22得票数 0

回答已采纳

1回答

大熊猫系列

python、pandas、dataframe

我在DataFrame上做了一个计算，然后想对结果进行缩放。我一直在错误地期待一个2D数组，并且“如果您的数据只有一个特性，可以使用array.reshape(-1，1)重新塑造您的数据”。 import pandas as pd df = pd.DataFrame({'a': ['aaa', 'bbb', 'ccc'], 'b': [1, 2, 3], 'c'

浏览 2提问于2020-11-17得票数 3

回答已采纳

1回答

python熊猫数据群值和多个图

python、pandas、plot

现在我有一个像下面这样的大熊猫数据框架，整个数据行是2923922。我想要生成多个线条图。GYEAR范围为1963至1999年，国家价值为非美国和美国.专利是代码，CAT是绝对价值。我希望x轴是GYEAR，y轴是“Us”/“Non”/ Total的专利和绘图线的数量，另一条是“Other”/“机械”/“药品和医疗”的绘图线。我怎么才能画出来呢？ GYEAR COUNTRY PATENT CAT 0 1963 Non-US 3070801 Other 1 1963 US 3070802 Other 2 1963 US 3070803 Other

浏览 5提问于2017-04-19得票数 3

回答已采纳

1回答

在第一次合并的结果为空时执行第二次合并

python-3.x、pandas

我为我的格式化提前道歉。假设我有两个数据帧，一个包含姓名和电话号码，另一个包含ID#，以及两个姓名-电话对。 df1 = pd.DataFrame([['John Doe', '555-555-5555'], ['Jane Doe', '555-555-5556'], ['Joe Doe', '555-555-5557']], columns=['Name', 'Phone']) df2 = pd.DataFrame([['111','Jim

浏览 0提问于2020-07-01得票数 1

3回答

熊猫--把大数据块切成块。

python、pandas、dataframe、slice

我有一个大的dataframe (>3MM行)，我正在尝试传递一个函数(下面这个函数很大程度上简化了)，并且我一直收到一条Memory Error消息。我认为我把太大的数据文件传递到函数中，所以我试图： 1)将数据分割成较小的块AcctName**)** (最好由切片) 2)将dataframe传递给函数。 3)将数据连接回一个大数据帧。 def trans_times_2(df): df['Double_Transaction'] = df['Transaction'] * 2 large_df AcctName Timestamp

浏览 5提问于2017-06-23得票数 62

回答已采纳

2回答

如何因式分解两个数据框架，同时与蟒蛇-熊猫？

python、pandas

我有两个数据框架，一个是用户项目评等，另一个是项目的侧信息： #df1 A12VH45Q3H5R5I B000NWJTKW 5.0 A3J8AQWNNI3WSN B000NWJTKW 4.0 A1XOBWIL4MILVM BDASK99000 1.0 #df2 B000NWJTKW .... BDASK99000 .... 现在我想将项目和用户的名称映射到整数ID。 df.apply(lambda x: pd.factorize(x)[0] + 1) 但是，我希望确保两个数据帧中的项的整数是一致的。因此，结果数据帧是： #df1 1 1 5.0 2 1

浏览 1提问于2016-04-03得票数 2

回答已采纳

1回答

列表中的r整形和子集数据帧

r、dataframe

我的问题如下:我想在新的数据帧中对每个数据帧的某些组合列进行子集。我需要这样做，因为我想对每个DF分别进行进一步的计算。 1.我将我的数据组织在一个由四个数据框架组成的列表中，每个框架都包含一个变量，为期一年。 nms <- c(paste0("tiva.EXGR.wide",c(1995, 2005)),paste0("tiva.VA.wide",c(1995, 2005))) df.list <- lapply(nms, get) 数据框架1:出口措施1,1995年，26栏： |COU |PAR | Time|

浏览 1提问于2015-07-12得票数 0

回答已采纳

1回答

R中的聚类条形图

r、ggplot2、bar-chart、geom-bar

我正在尝试为3种不同类型的降水数据创建一个聚类条形图。我一直在做各种搜索，如何在R中使用类似的数据集来实现这一点。然而，我找不到任何好的帮助。 ? 这是我当前使用的数据集。我尝试添加多个geom_bar()，但没有成功。请参阅下面的尝试： ggplot(ppSAcc,aes(x=date,y=as.numeric(Precipitation)))+geom_bar(stat="identity",aes(color="blue"),show.legend=FALSE,size=1)+ geom_bar(ppMAcc,stat="identi

浏览 15提问于2020-04-17得票数 1

回答已采纳

1回答

创建新列并根据另一个列值填充这些列

python、pandas、rename

假设我有一个数据帧df，如下所示： |ColA | |---------| |B=7 | |(no data)| |C=5 | |B=3,C=6 | 如何将数据提取到新的列中，如下所示： |ColA | B | C | |------|---|---| |True | 7 | | |False | | | |True | | 5 | |True | 3 | 6 | 为了填充我知道的列，我可以使用正则表达式.extract，如此solution所示。但是如何同时设置列名呢？到目前为止，我在df.ColA.loc[df["ColA&

浏览 11提问于2021-10-25得票数 0

回答已采纳

1回答

应用ConvNets对运动/视频数据进行分类

deep-learning、image-classification、convolutional-neural-network

如何利用深度学习对手语手势进行分类？例如，假设我有许多不同手势的视频文件。对于任何给定的手势，我可能会有很多视频，每一个视频将由许多帧组成。在对图像中的MNIST数字进行分类时，输入的尺寸相对简单:高度、宽度和RGB通道。手势(随着时间的推移多帧)将如何计算？时间会是第四维度吗？为了不过分适应，神经网络的架构应该是什么样的呢？我应该用一些东西来代替复杂的神经网络吗？编辑：我知道手语的手码预测器可能有一些聪明的方法，但我更感兴趣的是如何构建神经网络并利用数据的时间成分(视频帧随时间的转换有价值)。对手势进行分类是我试图解决的实际问题的简化，所以我正在寻找一种方法，它可以推广到其他类型的问题中

浏览 0提问于2016-05-18得票数 2

1回答

在pandas数据帧的平面文件中插入缺少的日期

python、pandas、dataframe

我有一个数据帧，没有日期。是否可以使用第一列中2月和3月的所有日期来更新此数据帧。我希望丢失日期的价格是0，产品是铅笔或钢笔，以形成一个完整的列表。数据帧的顺序并不总是正确的，所以不应该使用Ffill。 Price Product 1/Feb/2020 4400 Pencils 2/Feb/2020 0 Pencils 3/Feb/2020 0 Pencils 27/Feb/2020 0 Pencils 28/Feb/2020 0 Pencils 1/

浏览 11提问于2020-02-07得票数 1

回答已采纳

2回答

使用列名r转换数据帧

我有一个像这样的数据框架 beta1 beta2 beta3 4 67 89 33 7 78 6 99 33 etc 现在，我想将这个数据帧转换成一个不同的数据帧，它看起来像 col1 col2 4 beta1 33 beta1 6 beta1 67 beta2 etc 因此，这些列必须彼此粘贴在一起，第二列应该由第一个数据帧的名称组成。有人知道如何在没有循环的情况下完成这个任务吗？

浏览 0提问于2019-03-11得票数 0

回答已采纳

1回答

如何使用以下数据帧在R中创建三个相交的venn图

r、venn-diagram

我有四个数据帧df1，df2，df3，df4，每个都有两列属性，AVAILABLE属性包含各种属性的名称，AVAILABLE的值为0或1，表示该属性是否存在。所有数据帧都具有相同的属性名称集。我想要一个维恩图有4个圆圈与各自的交叉点表示共同的属性。如何做到这一点。

浏览 0提问于2017-03-20得票数 0

1回答

SAS到Python重塑数据帧脚本

pandas、sas

我正在尝试从SAS迁移到Python，我面临着一些挑战。具体地说，我有一个宽格式的数据集，其中包含301个观察值，我正在尝试将其重塑为长格式。宽格式数据帧如下所示：我想把它转换成像下面这样的长格式：我用来将数据集从宽转换为长的SAS代码是： data longformat; set wideformat; array arts(*) art1-art10; array cits(*) cit1-cit10; if jobtime =. then jobtime = 11; do year = 1 to dur; if year = dur then promo

浏览 1提问于2016-03-01得票数 1

6回答

如何检索大熊猫数据帧中k值的最高值？

python、pandas、numpy、dataframe、max

如何检索大熊猫数据帧中k值的最高值？例如，给定DataFrame： b d e Utah 1.624345 -0.611756 -0.528172 Ohio -1.072969 0.865408 -2.301539 Texas 1.744812 -0.761207 0.319039 Oregon -0.249370 1.462108 -2.060141 产生于： import numpy as np import pandas as pd np.random.seed(1) frame = pd.DataFra

浏览 2提问于2017-08-16得票数 6

回答已采纳

3回答

熊猫所有长度<2的细胞

python、pandas、dataframe

我想获得所有的数据行，在那里，如果任何云的长度小于2。例如： df = pd.DataFrame({"col1":["a","ab",""],"col2":["bc","abc", "a"]}) col1 col2 0 a bc 1 ab abc 2 a 如何获得此输出： col1 col2 0 a bc 2 a

浏览 0提问于2020-10-18得票数 2

回答已采纳

1回答

复制数据框行并添加ID；ID存储在列表中，列数可变

r、tidyverse、data-cleaning

我有一个整数向量列表，我想用它来扩展我的数据帧。该列表中的每个向量按顺序对应于我的数据帧的每一行。对于列表中的每个向量，我希望在数据帧中复制相应的行，创建与向量中的项一样多的行。然后，我想向这些重复的行中添加一列，其中包含向量持有的年份。(示例代码/数据如下) 我该如何使用dplyr或最简单/清晰的方式来完成这项工作呢？ evlist <- list("75931" = c(2018, 2018, 2017), "75932" = c(2003 # $`75931` # [1] 2018 2018 2017 # # $`75932` # [1] 2

浏览 1提问于2018-02-01得票数 1

回答已采纳

1回答

熊猫数据更新行

python、pandas

假设我有一个由0开始的数据，X和维数m。我在pandas.series，Y中有n个唯一值(1,2,3，…，n)，它的长度为m。我如何有效地设置X的第一行的I列(0到1)，而不使用循环。特别是对于大的m和n。 For example, for Y = [3,2,1] X row 1 2 3 0 0 0 0 1 0 0 0 2 0 0 0 to row 1 2 3 0 0 0 1 1 0

浏览 0提问于2020-02-19得票数 1

回答已采纳

3回答

基于索引将单列pandas数据帧转换为3列

pandas、reshape

我有： col1 0 1 1 2 2 3 3 4 4 5 5 6 ... 我希望原始数据帧中的每3行成为新数据帧中的一行： col1 col2 col3 0 1 2 3 1 4 5 6 ... 有什么建议吗？

浏览 24提问于2020-04-30得票数 0

回答已采纳

1回答

在R/dplyr中将dataframe转换为list by condition

r、dplyr、purrr

我有一个这样的数据帧： > df Person a b c d John 1 0 1 1 James 0 1 1 0 Keith 1 0 0 0 Boris 0 1 0 0 ... 我需要将它转换成一个向量列表，其中元素的名称对应于数据帧的列名，列表中的元素是列中有1的人的名称。对于上面的示例，列表应如下所示： > result_list $a [1] "John" "Keith" $b [1] "James&

浏览 9提问于2021-11-10得票数 1

回答已采纳

4回答

巨蟒熊猫DataFrames

python、pandas

我只想添加存储在字典中的数据帧。直觉上，我想要循环字典。但是，我没有零值的初始数据帧。要做到这一点，最好的方法是什么？目前，我正在做以下工作： dict = {'B' :df1, 'C':df2, 'D': df3} total = dict['B'] + dict['C'] + dict['D'] dfs是从csv文件读取时初始化的，可能有3个以上。如何在循环中完成此任务？

浏览 2提问于2015-06-30得票数 0