如何根据定义的大小将数据帧中的一列拆分为多列_根据内容将R中数据帧中的一列拆分为两列_如何根据一列中的条件从多索引数据帧中选择行 - 腾讯云开发者社区

r、dataframe、matrix、imputation

我正在尝试使用missForest包将丢失的数据计算到一个相当大的数据集中。 missForest以带有缺失值的数据矩阵的形式获取数据。列对应于变量，行对应于观察值。因此，我将我的数据帧转换为矩阵，这会无意中将我的所有分类变量转换为数字类型。有人知道如何将矩阵的一列作为因子分配吗？？非常感谢！

浏览 2提问于2017-11-30得票数 0

1回答

Statsmodels /Python: ValueError:约束矩阵中必须至少有一行

python、statsmodels、valueerror、anova

我有一个非常大的数据帧(12,000行x 95列)，我想遍历每一列并运行ANOVA，将结果附加到列表中。 results = [] for i in df.columns[1:]: mod = ols('var ~ C({})'.format(i), data = df).fit() aov = sm.stats.anova_lm(mod, typ = 2) results.append(aov) 我分别在几列上运行了相同的代码，并且在这个循环中也运行了前5列，这两个列都可以工作。但是，当我在整个数据集上运行时，我得到这个错误： ValueError

浏览 15提问于2021-02-19得票数 0

2回答

迭代数据帧并将列作为新的数据帧

python、pandas、dataframe

我正在尝试从一个大的数据帧创建一组数据帧。这些数据帧以这种方式由原始数据帧的列组成:第一个数据帧是原始数据帧的第一列，第二个数据帧是原始数据帧的第一列和第二列，依此类推。我使用下面的代码来迭代数据帧： for i, data in enumerate(x): data = x.iloc[:,:i] print(data) 这是可行的，但我在开始时也得到了一个空的数据帧和一个不需要的索引向量。对如何删除这两个有什么建议吗？谢谢

浏览 12提问于2021-09-13得票数 2

回答已采纳

1回答

R中子集的加权平均

我在R中有一个大的数据框，有5列。第一列包含从0到200的数字列表。第二列包含要加权的数字列表，第三列包含第二列中项目的权重。我的问题是，我想要将第一列划分为几个部分：(0,50]，(50,100]，(100,150]和(150,200)，然后找出每个间隔中数据的加权平均值。我可以首先将数据单独划分为这些间隔，然后创建一个新的数据帧，然后计算每个新数据帧中第二列和第三列向量的加权平均值，但这需要我对数据进行四次遍历，并且使用像我拥有的数据帧一样大的数据帧，效率太低。此外，对于将来的函数，我需要更多的时间间隔，因此需要更长的时间。有没有办法把它分成一次遍历？

浏览 2提问于2013-07-08得票数 0

回答已采纳

1回答

限制R中变量的小数位数

如何将R中数据帧中一个变量的小数位数限制为两个小数位？我将数据导入到R中，只有一列的小数位变得疯狂。我希望保持完全相同的数据帧，但将这一列中的小数位限制为两位。我的数据帧的名称是KoreanCorr，我想要编辑的列是SA。我知道我在朝鲜语领域做了一些事情，数字= 2？完整的代码是什么？谢谢!

浏览 4提问于2017-02-10得票数 0

回答已采纳

1回答

Python Pandas:将一列合并到另一个数据框不会返回相同数量的行

python、python-3.x、pandas

我有两个数据帧:第一个数据帧(假设df1)有389行5列，第二个数据帧(假设df2)有10025行10列。我想将其中一列(假设列名为'description')合并到第一个数据框中。我使用pd.merge()命令来合并列，如下所示： pd.merge(df1,df2[['ID','description']],on='ID',how='left') 但是，上面的命令返回22338行。当我在stackoverflow上搜索时，我发现有一个线程请求将drop_duplicates与第二个数据帧一起使用。因此，我更改了

浏览 12提问于2020-06-05得票数 0

回答已采纳

1回答

将列和数据框参数传递给lapply()中的函数？

r、dplyr、apply、lapply

我有一个函数，它接收一个数据帧和该数据帧中的一个列。我想使用lapply()将我的函数应用于dataframe中的每一列，但我不确定如何做到这一点。我认为它应该看起来像这样： #dataframe is called kstarter my_func(df, col) { ... } lapply(kstarter, arg1=kstarter, arg2=??) 但我似乎不能让它工作。arg2如何引用lapply迭代通过的每一列？非常感谢您的帮助！编辑：我希望apply使用的函数是： get_col_info <- function(col, df) { unique_val

浏览 3提问于2019-10-24得票数 1

1回答

使用每次查询限制的结果运行BLS API大数据，并将其保存为R中的数据

r、function、api、lapply、rbind

我试图使用BLS API提取大量数据(~500 K单个系列ID)，并将输出存储为数据。我遇到了两个问题： BLS API每天只允许50个结果/查询和2.5K个查询，将输出保存为编译后的数据我创建了一个只有一列“系列ID”( series ID )的数据帧，这是BLS API需要的信息，用于返回该特定ID上的数据。为了绕过结果/查询限制，我尝试将所有500 K系列ID的数据帧拆分为250个组(以保持每天的查询限制)，并使用一个函数分别在每个组中运行bls_api代码。我相信这是可行的，但我无法看到输出。为了尝试将输出保存在dataframe中，我创建了一个空白dataframe，并尝试用空

浏览 3提问于2019-09-25得票数 0

回答已采纳

1回答

将非常大的数据帧的列拆分成两个(或更多)新的数据帧

python、pandas、dataframe、large-data

问题嘿你好啊！我在尝试将数据帧中的一列拆分为两列(甚至更多)新列时遇到了一些问题。我认为这取决于这样一个事实:我使用的数据帧来自一个非常大的csv文件，几乎有10 of的空间。一旦它被加载到Pandas数据帧中，这将由大约60mil的行和5个cols表示。示例最初，数据帧看起来像这样： In [1]: df Out[1]: category other_col 0 animal.cat 5 1 animal.dog 3 2 clothes.shirt.sports

浏览 13提问于2020-11-01得票数 0

1回答

将DataFrame.groupby函数的结果拆分为两部分或更多部分

python、dataframe、pandas-groupby

我想将一个非常大的数据帧拆分成更小的块，但拆分必须完成，这样某些列的实例才不会被拆分。我知道我可以使用group by将值分组在一起，但之后如何拆分数据帧？下面的df示例 AID VID FID 1 A X 1 B Y 1 B Z 1 A W 1 A Y 2 C X 3 C Z 3 C W 我在两列AID和VID上对df进行分组，最后得到4个组： 1,A 1,B 2,C 3,C 我不想将数据帧一分为二，所以我在每个数据帧中

浏览 10提问于2017-08-07得票数 0

2回答

如何用来自另一个值的值填充整个列？

pentaho、kettle、pentaho-spoon、pentaho-data-integration

我已经用了一段时间了，但是我想不出怎么解决这个问题。我想创建一个用另一列的一个值填充的新列。输入源是一个结构类似于下图的文件。 [] 有了该输入，我想创建一个新列，该列只包含另一列中的一个rates。 [] 我尝试过使用UDJE步骤，但我不知道如何仅提取单个值。谢谢

浏览 0提问于2018-12-28得票数 0

1回答

PowerBI (DAX) - Countif包含列值(千行)

database、powerbi、dax、m

PBI相对较新，需要帮助计算单个列中的分隔值的总数。所以我的源列看起来像这样： ID Code 1 abc1|bcd2 2 def2|abc1|ghi3 3 bcd2 我基于同样的查询创建了一个新表，该查询只接受这一列，并使用竖线分隔符将其分割为单独的行： Individual Codes abc1 bcd2 def2 ghi3 现在，我想在原始代码列中绘制每个单独代码的出现次数。我原本打算使用计算列来实现这一点，但我不知道这是否是最好的方法。因此，拥有这样的东西： Individual Codes Counts abc1 2

浏览 73提问于2019-08-29得票数 0

回答已采纳

1回答

Pandas数据帧计算列中inexes=相同值的百分比

python、pandas、dataframe

我已经将一个大的.csv文件解析成一个主数据帧。然后，我根据其中一列中的参数将数据组织到4个不同的数据帧中。有没有一种方法可以使用分解来查找数据帧中所有列都具有相同值的索引的百分比。我可以看到原始数据，例如当我组织现在想要计算百分比时，有多少索引被剔除

浏览 22提问于2021-10-04得票数 0

1回答

Python堆栈行进入单个列

python、numpy、reshape

我正在处理一个数据框架，如下所示，并希望将它们重新组合成一个列，并使用原始索引创建另一个列：将每一行(按“年份”索引)叠加成单个列(名为"value")，将上述数据帧转换为另一列(命名为“value”)，并创建另一列，填充这些值的相应“年份”，以生成一个新的数据框架，其中包含两列(value，年份)，如下所示如何使用任何numpy命令快速实现这一点？谢谢。

浏览 0提问于2017-03-25得票数 0

回答已采纳

3回答

在pandas中从较大的数据帧中删除较小数据帧中的值

python、pandas、dataframe

我在pandas中有一个非常大的数据帧，其中一列被标记为"Col2“，该列的行值包含一个长字符串。我从这个数据框中解析出另一个较小的数据框，其中包含我想要从原始数据框中删除的列"Col2“值。基本上，我希望遍历原始数据帧，并根据与子集数据帧匹配的Col2值删除整行；最后根据Col2值从一个数据帧中减去另一个数据帧。我该怎么做呢？

浏览 0提问于2015-11-19得票数 0

1回答

在添加新的row.name列时将数组转换为数据格式

arrays、r、dataframe

我需要将数组转换为数据帧，使row.names成为数据帧的第一列。例如，我有一个由4个元素组成的数组： big small verybig verysmall 12 3 24 20 使用as.data.frame进行转换给我(大、小、非常大、非常小)为row.rames。我想要一个看起来像这样的data.frame： row column1 column2 1 big 12 2 small 3 3 verybig 24 4 verysmall 20 其中row.names是(1,2,3,4)和(大，小，非常

浏览 1提问于2015-03-31得票数 1

回答已采纳

1回答

按存储在不同列中的复合队列排序

pandas、combinatorics

假设我有一个数据框，其中3列包含参数。因此，所有可能的队列都是组合:假设这些列有“鸭子”、“猫”、“狗”，另一个是“白”、“灰”、“黑”，最后一列是“小”、“大”。因此，队列中有小灰鸭、大黑猫等。因此，如何通过存储在其中的所有可能的队列对数据帧进行分组？我需要这个来计算所有队列的特定值。谢谢。

浏览 0提问于2020-12-19得票数 2

6回答

在For循环内的R中创建子集数据帧

我尝试做的是根据较大数据帧中第一列的值将较大的数据帧过滤成78个唯一的数据帧。我能想到的唯一正确的方法是在for()循环中应用filter()函数： for (i in 1:nrow(plantline)) {x1 = filter(rawdta.df, Plant_Line == plantline$Plant_Line[i])} 问题是我不知道如何创建一个新的数据框，比如x2、x3、x4……每次循环运行的时候。有没有人能告诉我这是否可能，或者我是否应该尝试用其他方式来做这件事？

浏览 0提问于2018-07-25得票数 0

1回答

在将数据帧转换为矩阵时，有没有办法将每列的所有对象类型都保留在数据帧中？

r、dataframe、matrix

我想把数据帧转换成R中的矩阵。数据帧有30多个不同类型的变量，一些是数字的，一些是因子的，还有一些是字符的。在将其转换为矩阵时，我希望保持所有类型与数据帧中的类型完全相同。我尝试使用as.matrix()对其进行转换，请参见下面的代码(这只是一个只有两个变量的简单示例数据帧)。 test_df <- data.frame(a = c(1:10), b = c(letters[1:10])) test_df <- as.matrix(test_df) typeof(test_df[,1]) typeof(test_df[,2]) 示例中的列'a‘的类型为整型，而列'

浏览 15提问于2019-06-10得票数 0

回答已采纳

3回答

通过插入两个原始数据文件中每一个数据的列，将两个数据格式组合成一个

因此，我有两个数据格式，df1和df2，它们都有相同的列数(并且具有相同的名称)，但是行数不同。我想将它们合并成一个大的数据帧，其中第一列是df1的第一列，第二列是df2的第一列，第三列是df1的第二列，第四列是df2的第二列，等等。

浏览 9提问于2021-03-25得票数 2

回答已采纳

1回答

Python Pandas识别错误数据

python、pandas、csv

我有一个用逗号分隔的csv文件，每行有215列。文件非常大，我使用pandas dataframe pd.read_csv()和块来读取数据。文件中的一行有214列，而不是215列，但dataframe读取数据时将NaN应用于最后一列。有没有办法在pandas dataframe中标识此行，因为我更喜欢dataframe而不是csv_reader。注意:最后一列也可以为null，因此按等于null的最后一列过滤数据帧将不起作用

浏览 19提问于2020-09-30得票数 0

2回答

如何以安全的方式拆分位于同一列中的倍数值，

python

作为阅读熊猫数据框架的程序的一部分。其中一列包含多个值，这些值由:在同一列中分离。要知道这些值意味着什么，还有另一列说明每个值是什么。我想拆分这些值并将它们放入新的列中，问题是我的程序中的所有输入都接收完全相同类型的数据帧，并且可能出现顺序或新值。用一个例子更容易解释： df1 Column1 Column2 GT:AV:AD 0.1:123:23 GT:AV:AD 0.2:456:24 df2 Column1 Column2 GT:AD:AV 0.4:23:123 GT:AD:AV 0.5:12:323 在了解这个问题之前，我所做的将这些数

浏览 1提问于2021-10-07得票数 0

回答已采纳

1回答

如何找到R中产生最大colMeans的簇？

r、k-means

我有一个数据框架 V1 V2 V3 1 1 1 2 2 0 1 0 3 3 0 3 .... 并且我有一个与数据帧中的行数相同长度的向量(如果这很重要的话，它是kmeans中的cluster ) [1] 2 2 1... 从这些数据中，我可以获得每个集群的colMeans，如 cm1 <- colMeans(df[fit$cluster==1,]) cm2 <- colMeans(df[fit$cluster==2,]) (我不认为我应该明确地完成这个部分，但这就是我对这个问题的看法。) 我想要的是，对于数据帧的每一列，从colMeans为最大值的向量中获取值

浏览 0提问于2021-04-30得票数 1

回答已采纳

1回答

获取R中SVD的列名

r、plot、svd

我在R中对一个名为data的数据帧执行SVD svd1 <- svd(scale(data)) 我使用以下命令绘制结果： plot(svd1$d^2/sum(svd1$d^2),xlab="Column",ylab="Percent of variance explained",pch=19) 我发现在图中，列号并不与数据帧中的列号相对应(无论我在SVD中使用哪个列子集，第一列总是显示最高方差)。我的问题是，如何在图中获得列名(或“真实”索引)？

浏览 2提问于2013-02-10得票数 1

回答已采纳

1回答

用R绘制一幅图中的光谱数据

r、plot、spectral

我有多个数据帧，其中第一列(最后填充NA)是波数，其他列是用于多个观测的特定波数的变量。是否有可能用我的第一列包含x轴变量的方式绘制列，而另一列用它们各自的y值绘制成一个大图？我已经试过了"matplot“(结果是”数字“而不是点数)， matplot(df[,1],df[,3:5],xlab = "Wavelength [nm]", ylab = "Absorbance") 不同的“木偶图”(不可能给出一个以上的y值)，但似乎没有工作(在我对R的知识水平)。最终结果应该如下所示：谢谢你的帮助！

浏览 0提问于2019-04-10得票数 2

回答已采纳

1回答

通过值子集R中的距离矩阵

r、dataframe、subset、distance、symmetric

我有一个非常大的距离矩阵(3678x3678)，目前编码为数据帧。列被命名为"1“、"2”、"3“等等，行也是如此。因此，我需要做的是找到小于26且不同于0的值，并将结果放入包含两列的第二个数据帧中:第一列包含索引，第二列包含值。例如： value 318-516 22.70601 ... 其中318是行索引，516是列索引。

浏览 10提问于2021-01-27得票数 0

回答已采纳

2回答

如何在xaml中自动折叠网格列？

silverlight、xaml

基本上，我从服务中获取一些数据，并将结果显示在列表框中。项的模板正在使用网格。注意:如果有更好的方法，请让我知道。 <Grid> <Grid.ColumnDefinitions> <ColumnDefinition/> <ColumnDefinition/> </Grid.ColumnDefinitions> <Image Grid.Column="0"/> <TextBlock Grid.Column="1"/> </G

浏览 9提问于2011-10-11得票数 1

回答已采纳

2回答

更改列表中存储的数据帧

r、list、sna

我正在尝试编写某种循环函数，它允许我将相同的代码集应用于存储在一个列表中的数十个数据帧。每个数据帧具有相同的列数和每个列的相同的标题，尽管行数在数据帧之间不同。这些数据来自一项以自我为中心的社交网络研究，我从数十名不同的受访者那里收集了边缘格式的自我网络数据。我使用的数据收集软件将每次面试的数据存储在自己的.csv文件中。这是特定数据帧()的原始数据图像。出于我的目的，我只需要使用第四、第六和第七列中的数据。此外，我只需要最后一列的值为4的数据行，这样最后一列就可以完全删除。最终结果是一个两列的数据框架，表示成对的人之间的关系。在读取数据并将其存储为对象后，我运行了以下代码： x1002

浏览 7提问于2017-03-13得票数 0

回答已采纳

2回答

从一列到下一列的百分比变化

python、pandas

假设我有一个数据帧： df = pd.DataFrame([[3, 2, 1], [5, 4, 2]]) 3 2 1 5 4 2 我想返回一个数据帧，其中包含从一列到下一列的百分比变化。因此，上面的数据集将返回： .666 .5 .8 .5 我该如何在熊猫中做到这一点呢？

浏览 18提问于2020-07-02得票数 0

回答已采纳

1回答

将单元格值从更改的源复制到另一个工作表

excel、vba

这与我之前问过的问题有点类似，但我还没有想出解决这个问题的诀窍。我目前有两个工作表，在第一个工作表上，我有两列的集合，它们下面有几百行。我对其进行了设置，以便用户可以根据需要添加更多这些列的集合，并根据需要传输公式/格式。这些列集可以有任意数量，尽管它们将始终从列"D“开始，并且最终的列集始终位于工作表的最后一列之前的10列。现在，我正在考虑将这些新列的标题(总是在第2行)转移到另一个工作表中。另外，我带来了在这些列的每一组中的4行中找到的值(所有这些列都被合并了)，所以每组两列又有4个值。下面代码背后的想法是，我将标题值放在顶部，查找在另一个工作表的一列中包含它的行，如果找不到它

浏览 16提问于2019-02-12得票数 0

回答已采纳

2回答

在Pandas中追加数据帧

python、pandas

我有一个'for‘循环，它在每次迭代中调用一个函数(y)。该函数返回一个名为phstab的5列x 10行的数据帧。 for j in cycles phstab=y(j) 数据帧中的最后一列是唯一更改的列。最后一列中的值是周期的值。其他列中的所有其他值在每次迭代中都保持不变。因此，例如，如果循环迭代时间，它将生成四个单独的phstab实例；每个实例都有不同的cycles值。我想在每次迭代中附加phstab，这样输出就是一个很长的数据帧，而不是四个实例。我尝试在循环中插入以下语句，但不起作用 phstab=phstab.append(phstab) 如何获得一个单独的数据帧而不

浏览 4提问于2014-06-09得票数 0

1回答

根据R中的第一列绘制数据帧的列

r、dataframe

在R中，如何能够将数据帧的所有列与该数据帧的第一列相对应？如果数据帧有4列，则需要一幅3条覆盖线的单幅图。 plot(df)生成一个散点图矩阵，而 for(i in 1:ncol(df)) { plot(df$length, df[,i], type='l') } 只绘制最后一列相对于第一列。

浏览 0提问于2015-10-31得票数 2

回答已采纳

1回答

根据列的子集删除重复项，保留列E中具有最高值的行&如果E中的值等于列B中具有最高值的行

python、pandas、dataframe、duplicates

假设我有以下数据帧： <code>A0</code> 我想删除基于A、B和C列的重复项，保留E列最高的行。如果E列中的值相同，则保留D列最高的行。因此，上面的数据帧将变成： <code>A1</code> 我看到了答案的开头：<code>C2</code>，但不幸的是，我找不到如何处理如果E列中的值相同，则保留D列中的最高值:/ (我在一个相当大的数据集上运行这段代码) 感谢任何人的帮助！

浏览 7提问于2021-06-11得票数 1

回答已采纳

1回答

如何在spark中使用pandas split-apply-combine风格策略和scala api？

pandas、scala、apache-spark、split-apply-combine

我有一个scala函数，它接受一个spark dataframe并返回一个单值，也就是说两个值。这个函数很复杂，使用在DataFrame类中定义的聚合，调用其他java库，并且不能用SQL表达。它需要整个数据帧的内容来进行计算，它不能一次添加一行并建立一个结果。我有一个大的dataframe，其中包含一个列，我想用它将dataframe分成小块，并对每个小块执行上述计算。然后，我想返回一个新的数据帧，其中包含每个组的一行和两列，一列包含groupby值，另一列包含结果。使用PandasUDF这将是一个相对简单的任务，但是我不知道如何在Scala中做到这一点。我尝试使用group by列对

浏览 28提问于2020-04-22得票数 0

1回答

将粘贴问题从ssms 2012复制到Excel

sql-server、excel、ssms

我面临着从ssms 2012复制和粘贴数据到excel的问题。在复制粘贴时，某些行会被分解到excel中。例如:下面这行在excel中被拆分成多列。 (310) 277 4657 Lori Parkes called adv not auth on the account, provided general info re LEASE EXTENSION: 1 2 mo. as courtesy. 4 more with Prod# or POD. Max 6 mo Same mo pymt, credit reporting remains active. Prorated

浏览 3提问于2019-08-29得票数 0

1回答

根据值填充Dataframe列

python、pandas、numpy

我有一个有几列的数据帧，每一列都有二进制值。对于每一列，我都有一个numpy数组，其中一些值与该列的长度相同。我需要用numpy数组填充列，但有一个条件:仅当dataframe列中的值为0时才填充，如果它不是1，则不从numpy数组填充。使用for循环，我会得到如下结果： for col in df.columns: for i in df[col]: if df.loc[i,col] == 0: df.at[i,col] = arr[i,col] else: continue 然而，这很慢，而且我的数据帧有点大(10k行* 180列)，我正

浏览 7提问于2020-07-06得票数 0

3回答

有条件地删除每列的值，但使用循环将每列保留为新的数据帧

r、dataframe、subset

我有以下简化的数据框架。 test <- data.frame( ice = c(1, 0.8, 0.5, 0.4), eonia = c(0.5, 0, 0, -0.4), euribor = c(1, -0.8, 1, -0.2), cp = c(-0.7, -0.6, -0.4, -0.5) ) row.names(test) <- colnames(test) 我想为每一列应用一个条件，它只保留那些满足条件的值： test[(test$ice>= 0.8 & test$ice< 1) | (test$ice<= -0.8 &am

浏览 44提问于2021-11-10得票数 2

回答已采纳

2回答

拆分列数据、添加数据、重新合并在一起

r、dataframe、merge、split

我有一个有两列的文本文件(也许只是制表符？)。其中一列的数据如下所示: TC012950_CDS_3428_4122 第一个数字是TC#，第二个CDS，第三个起始位置，第四个结束位置。另一列有一个值，如下所示: 11.93631 我有另一个文本文件，其中包含按制表符拆分的染色体信息： ChLG10 protein_coding mRNA 3428 5582。-。TC012950 我的总体目标是最终将染色体名称(ChLG10)合并到第一个文件的列中，这样它看起来就像: TC012950_ChLG10_3428_4122 而第二列仍然包含其原始值。我曾尝试将数据放入数组或数据帧中，但随后很难拆分

浏览 6提问于2016-09-25得票数 1

1回答

scala udf中的空比较

scala、apache-spark、isnull

我有一个spark数据帧，其中列A、B、C、D都是双精度类型的。我需要添加一个新的列'ratio‘，它的计算方法如下： if(A IS NULL && B IS NULL) then 0 if(A IS NOT NULL && B IS NULL) then A/D if(A IS NULL && B IS NOT NULL) then C/B if(A IS NOT NULL && B IS NOT NULL) then A/B 在scala中如何做到这一点，因为双精度不能与NULL进行比较？

浏览 13提问于2017-02-16得票数 0

1回答

在iOS中创建PDF时自动分页(Swift)

ios、swift、pdfkit、tppdf

我必须创建一个PDF，其中包含的数据，如报价文件(文本，表格，图像等)。数据从1页到3至4页不等。表格单元格可以具有文本和图像的组合。此外，我有自定义图形要呈现在PDF显示不同的形状。示例格式：我试过苹果提供的PDFKit。我能画出不同的部分。但我不知道如何实现自动分页模式(当页面中没有更多可用空间时，这种模式会将数据转移到新页面)。实现这一目标的一种方法是，我必须计算单个高度，并根据可用的页面大小将数据划分为页面。有什么更好的方法可以用PDFKit来做吗？我也知道如何使用UIGraphicsBeginPDFContextToData()创建PDF。它也不支持自动分页。我们必须为

浏览 0提问于2019-09-01得票数 0

3回答

删除函数中R中的最后一列数据帧

r、loops、drop

我需要删除10个数据帧的最后一列，所以我决定将它放在lapply()中。我写了一个函数来删除列，如下所示： remove_col <- function(mydata){ mydata = subset(mydata, select=-c(24)) } 并创建一个mylist <- (data1, data2.... data10)，然后我将lapply作为 lapply(mylist, FUN = remove_col) 它确实给了我一个已删除数据帧的列表，但是，当我检查原始数据帧时，最后一列仍然在那里。如何更改代码以更改原始数据集？

浏览 203提问于2020-11-03得票数 0

1回答

Python/Pandas:根据列名对dataframe列进行排序

python、pandas

我有一个数据帧，其中包含几个标记为x1、x2、x3和x4的列。根据分析，当从左到右对数据帧中的四列进行排序时，我需要将四列中的一列指定为第一列。例如，如果我想让'x2‘列是第一列，我就把它赋给'sorter’。 sorter = x2 现在我的问题是:如何对列中的数据帧进行排序，以便分配给'sorter‘的列位于第一列中？编辑:其余列的顺序应保持不变。

浏览 10提问于2021-03-02得票数 0

回答已采纳

1回答

如何通过匹配df1中匹配df2索引和列名的列值，用df1中的数据填充df2

python、dataframe

我有一个包含许多数据列的大型数据帧df1，其中两个是dates和colNum。我已经构建了跨越df1的日期范围和colNum的第二个数据帧df2。现在，我想用df1的第三列(任何其他数据列)填充df2，这些列满足df1的dates和colNum标准，并且与df2的dateIndex和colNum匹配。我尝试过MERGE的各种版本，但都没有成功。我可以遍历这些组合，但是df1非常大(270k，2k)，所以从df1的某一列填充一个df2需要花费很长时间，更不用说填充所有列了。慢循环版本 dataList = ['revt'] for i in dataList: go

浏览 0提问于2019-10-16得票数 0

1回答

向dataframe中添加一个新列，其中的每一行都根据它所来自的dataframe的标题采用不同的值

python、pandas

因此，我有一个多个数据帧的列表，并将它们连接在一个大的数据帧中。现在，我想要向最后一个大型数据帧添加一列，但我希望该列的值根据每行首先所属的数据帧的名称而改变。这是一个示例： list_of_df = [march_01, march_02, march_03] big_df = pd.concat([march_01, march_02, march_03], ignore_index=True) big_df['new_column'] = # i want this column to adopt the value '01' for those ro

浏览 26提问于2021-03-17得票数 1

1回答

如何基于列生成多个子集

我正在处理一个非常大的数据集，我需要从数据集中生成多个子集，而不必为每个子集单独编写代码。我想为第一列中的每个船名创建子集。我知道怎么乘船做这艘船，但我想一次做多个子集。我包括了我正在工作的数据框架的一个小样本。我想从这个样本数据中得到3个子集，分别是黎明玛丽、克莱格K和莱克女士。谢谢你的帮助。 Boat Net Targeted Species Yellow Perch Dawn Marie 37 Yellow Perch 500 Kraig K 35 Yellow Perch 400 Da

浏览 4提问于2017-02-28得票数 0

回答已采纳

1回答

按一列分组并查找两列中的第一列熊猫

python、pandas、group-by

我有一个dataframe geomerge，我需要按一列grpno.进行分组，并选择第一列MaxOfcount percent和第一列state code并显示grpno.。我已将它们重命名为FirstOfMaxOfState count percent和FirstOfstate code 我的输入数据帧： count percent grpno. state code MaxOfcount percent 0 14.78 1 CA 14.78 1 0.00 2

浏览 1提问于2016-01-28得票数 0

1回答

如何找到列的值，使另一列中的值不大于3

python、pandas

我希望找到与某一列对应的值，使另一列中的任何值都不大于3。例如，在下面的数据文件中 df = pd.DataFrame({'a':[1,2,3,1,2,3,1,2,3], 'b':[4,5,6,4,5,6,4,5,6], 'c':[4,3,5,4,3,5,4,3,3]}) 我想要列'a‘的值，其中'c’的所有值都大于3。我认为群比是正确的方法。下面的代码更接近它。 df.groupby('a')['c'].max()>3 a 1 True 2 False 3 True

浏览 5提问于2020-02-27得票数 0

回答已采纳

1回答

如何将从方法获得的结果列添加到现有的数据帧中？

python、pandas、dataframe

我得到交换令牌的数据帧，如下所示： Exchange=df[df["marketSegment"]=="Exchange"] Exchange 我想在上面的数据框中添加一列，以显示每个令牌的价格。通过下面的方法，我可以得到每个令牌的价格： san.get( "prices/huobi-token", from_date="2018-06-01", to_date="2018-06-05", interval="1d" ) 谁能告诉我如何定义一个函

浏览 20提问于2019-08-19得票数 1

回答已采纳

1回答

从带注释的文本中提取多词表达式

python、dataframe

我的数据帧中有两列，一列是文本，另一列是文本中每个mwe的注释，指示mwe的类型和包含该单词的字符范围。例如, 文本列： Barack Obama was president of the United States in 2008. 注释列： MWE_type 0 12 这表示从字符0到12，所以单词是巴拉克·奥巴马。和, MWE_type 34 47 所以，它是美国如何使用注释从文本中提取单词并将其保存在新列中(例如，文本将类似于美国的巴拉克·奥巴马)？谢谢您抽时间见我!如果您需要更具体的东西，我很乐意添加一些信息！

浏览 13提问于2021-08-09得票数 3

回答已采纳

1回答

使用python转换sparksql dataframe中的列

apache-spark、date、pyspark、apache-spark-sql

嗨，我有一个带有一大堆列的spark sql数据帧。其中一列(" date ")是日期字段。我想将以下转换应用于该列中的每一行。这就是如果它是一个熊猫数据帧，我会做什么。我似乎想不出火花的等价物 df["date"] = df["date"].map(lambda x: x.isoformat() + "Z") 该列的值形式为2020-12-07 01:01:48 我希望值的格式为: 2020-12-07T01:01:48Z

浏览 27提问于2021-06-16得票数 0