如何使用R中的apply函数对数据帧进行规范化？_如何对R中的数据进行规范化_使用apply对pyspark中的分组数据帧运行函数 - 腾讯云开发者社区

、、

我应该编写一个包含4个参数的函数: trData、teData、minV、maxV。并返回对列表、一维、二维数组和数据帧的规范化。如果你能帮助我如何开始和开始，我将非常感激。

浏览 2提问于2022-02-01得票数 -1

1回答

如何使用mapply在R中的两个列表的列上执行函数？

、、、、

我正在尝试计算R中两个列表的第n个元素上的群体遗传统计量(均值FST)。这个统计量需要计算群体方差，而R对此没有本机函数。我不知道如何将适用于数据帧(2行)的代码转换为适用于2个列表的代码。下面是一个适用于两行数据帧的代码示例： #Generate dataframe data popa <- abs(rnorm(10, mean = 0, sd = 0.5)) popb <- 1-abs(rnorm(10, mean = 0, sd = 0.5)) totalpop <- rbind(popa, popb) #Make population variance funct

浏览 5提问于2021-02-11得票数 0

2回答

从网络抓取中过滤和格式化数据帧

、、、

我是Python的新手，但对R很熟悉。我正在尝试从雅虎获取股票价格数据。我成功地检索到了价格数据，并且能够创建一个数据帧。然而，雅虎也包括何时派发股息。现在，我想忽略红利，但在红利支付时，我无法过滤要删除的数据帧。此外，我还想更改Date列的格式，例如，从Mar 14, 2000更改为%Y-%m-%d。来自网络抓取： Date Open Close Dec 23, 2019 0.611 Dividend None Dec 01, 2019 88.38 88.90 首先，我尝试在'None'上进行过滤，但

浏览 9提问于2020-01-11得票数 3

回答已采纳

2回答

如何一次计算多个数据帧的均值和标准差？

、、

我有几百个熊猫数据帧，所有数据帧中的行数并不完全相同，比如有些数据帧有600行，而另一些只有540行。所以我想要做的是，我有两个样本，它们的数据帧数量完全相同，我想从这两个样本中读取所有数据帧(大约2000个)。这就是数据的样子，我可以像这样读取文件： 5113.440 1 0.25846 0.10166 27.96867 0.94852 -0.25846 268.29305 5113.434129 5074.760 3 0.68155 0.16566 120.18771 3.02654 -0.68155

浏览 1提问于2018-08-30得票数 0

回答已采纳

1回答

在Python语言中使用PyMongo在MongoDB中插入文档

、、、、

我使用Python语言中的PyMongo库在MongoDB中插入文档。pandas数据帧有37个字段和60k条记录(数据集链接：)。数据帧中的所有字段都已转换为str类型。我收到以下错误： OverflowError: MongoDB can only handle up to 8-byte ints 当我使用for循环插入2500个文档的块时，错误仍然存在。代码片段： import pandas as pd import pymongo client = pymongo.MongoClient() db = client['patenting_in_psi'] colle

浏览 0提问于2018-02-16得票数 0

2回答

从R中的列表创建数据框

、、

我有一个函数readnorm，它返回一个由整数标识的文件中的相关数据列表： readnorm <- function(n) { a <- read.csv(paste("/tmp/diff-a-", n, ".txt", sep=""), col.names=c("raw"), header=FALSE) a <- list(n=n, raw=a$raw, median=median(a$raw), iqr=IQR(a$raw)) a$shifted <- a$raw

浏览 2提问于2012-06-15得票数 0

回答已采纳

1回答

使用正则表达式搜索和过滤pandas数据帧

、、

如果你能帮忙我会很感激的。我有一个熊猫数据框。我希望使用正则表达式搜索数据帧的3列，然后返回满足搜索条件的所有行，并按其中一列进行排序。我想把它写成一个函数，这样如果可能的话，我可以用其他标准来实现这个逻辑，但是我不太确定怎么做。例如，我知道如何拉取搜索结果(以col1作为列名)： idx1 = df.col1.str.contains(r'vhigh|high', flags=re.IGNORECASE, regex=True, na=False) print df[~idx1] 但是我不知道如何执行这种类型的操作，并使用多个列执行它，然后进行排序。有人有什么建议吗？

浏览 0提问于2015-09-17得票数 5

回答已采纳

3回答

是否有regex模式可以根据python中的不同匹配来更改不同的值？

、、、

我在数据帧列名= ' name‘中附加了一个列，它是一个由几个不同的列串联组成的字符串。现在，我想用某些值替换某些字符。让我们说 & ->和< ->小于 ->大于‘->这是撇号“->这是双引号现在，我如何有效地将这个正则表达式应用于整个专栏。此外，我可以把它放在某些功能中，因为我还需要在其他4列中应用相同的功能。我试过这个 df = pd.DataFrame({'A': ['bat<', 'foo>', 'bait&'],

浏览 12提问于2022-11-25得票数 0

回答已采纳

4回答

在Python中将Dataframe行值作为参数迭代(循环)传递

、、、

我有一个需要三个参数的函数： def R0(confirm, suspect,t): p = 0.695 si = 7.5 yt = suspect * p + confirm lamda = math.log(yt)/t R0 = 1 + lamda * si + p * (1 - p) * pow(lamda * si,2) return R0 和一个包含三列的数据帧： data = {'confirm': ['41', '41', '43', '44'

浏览 98提问于2020-02-08得票数 0

回答已采纳

1回答

如何在Python中为特定列的每个不同值选择一行并合并以形成新的数据帧？

、、

我使用的数据集如下所示。它是一个视频字幕数据集，其字幕位于“Description”列下。 Video_ID Description mv89psg6zh4 A bird is bathing in a sink. mv89psg6zh4 A faucet is running while a bird stands. mv89psg6zh4 A bird gets washed. mv89psg6zh4 A parakeet is taking a shower in a sink. mv89psg6zh4 The bird is taking a

浏览 11提问于2020-03-28得票数 3

回答已采纳

1回答

线性回归中的去归一化

、、、

我已经在7个自变量和1个目标的数据集上实现了一个线性回归模型，使用以下2种方法 1)不对数据进行归一化处理，平均误差为36530921.0123，R2值为0.7477。 2)对数据进行归一化处理，得到的均方误差为5.468490570335696e-10，R2值为0.92750882996584。但是在这种情况下，即使是Target变量也是规范化的。这是在第一种情况下增加新特性或考虑第二种情况的较好方法，它具有较好的R2和MSE值。如果我们正在考虑第二种情况，那么需要采取哪些步骤来去除目标变量。谢谢。

浏览 0提问于2018-04-24得票数 0

回答已采纳

2回答

从Pandas中的apply函数返回多个对象

、、

我正在练习将apply与Pandas数据帧一起使用。因此，我制作了一个简单的数据帧，其中包含日期和值： dates = pd.date_range('2013',periods=10) values = list(np.arange(1,11,1)) DF = DataFrame({'date':dates, 'value':values}) 我有第二个数据帧，它由原始数据帧的3行组成： DFa = DF.iloc[[1,2,4]] 因此，我想使用第二个数据帧DFa，并从每一行获取日期(使用apply)，然后查找并汇总原始数据帧中之前出现的任何

浏览 0提问于2015-06-11得票数 1

2回答

Groupby在Pandas中的变异性能

、、、、

我经常尝试做groupby和mutate的R等效项，但正如许多人指出的那样，简单地使用groupby和apply会受到严重的性能问题的影响。所以我的问题是，在pandas中对数据帧进行分组的最佳(最高性能)方法是什么，然后根据该组中的一些条件，根据一些计算添加一个新列？ (我已经搜索了很久，但我没有找到任何关于如何使用numpy向量化pandas中的自定义函数的指南/步骤。所有类似问题的答案都是针对具体情况的，不能很好地概括。) 示例数据： df Out[17]: ID ID2 col1 col2 col3 valu

浏览 14提问于2017-07-31得票数 1

回答已采纳

4回答

如何查找具有一个或多个负值的pandas列

、

如果我想找出一个至少有一个零值的pandas数据帧中的所有特性，那么我可以使用以下命令。 df.isin([0]).sum() 这是简单而优雅的。找到具有负值的特征的等价物是什么？似乎没有简单的方法来找出pandas数据帧中至少有一个负值的所有列。你能帮帮忙吗？在此之前，非常感谢您。

浏览 0提问于2020-10-01得票数 0

2回答

在R个用户定义函数中传递数据参数

、、、

对于像R中的lm()这样的函数，您将"data“参数传递给函数，通常是一个数据帧，然后R通过名称知道所有列，而不是引用它们。所以区别在于x=column而不是在时尚的x=df$column中引用。那么如何在我自己用户定义函数中使用相同的方法呢？一个简单的例子： library(tidyverse) df <- tibble(x=1:100,y=x*(1+rnorm(n=100))) test_corr <- function(x,y) { cor(x,y) %>% return() } # Right now I would do this test_co

浏览 15提问于2020-02-10得票数 0

回答已采纳

1回答

使用wheen函数遍历dataframe python/pandas

、、

我有一个函数，它在一个数据帧中使用两列： def create_time(var, var1): if var == "Helår": y = var1+'Q4' else: if var == 'Halvår': y = var1+'Q2' else: y = var1+'Q'+str(var)[0:1] return y 现在我想遍历我的数据帧，使用函数创

浏览 0提问于2013-10-16得票数 1

2回答

将多列收集到逗号分隔的列表中

、

我想根据这个模式在R中转换一个数据帧：注意，对于IDy，以前热编码的属性Att_1是作为逗号分隔的列表收集在单个单元格中的。我如何在R中做到这一点(例如，使用tidyr函数)？ test <- data.frame(ID = c("IDx", "IDy"), Att_1_1 = c(0,0), Att_1_2 = c(1,1), Att_1_3 = c(0, 1), Att_2 = c(1,1), Att_3 = c(1,0))

浏览 11提问于2017-08-07得票数 0

回答已采纳

3回答

存储多个数据帧的有效方法？

、、、

我正在将几个文件一起读取到一个数据帧列表中，以便能够将函数应用到合并的数据中，但是当我有太多的数据帧时，我遇到内存分配问题(“错误:r不能分配内存”)。例如，读取的数据帧的可变数目，让我们现在假设3个数据帧： x = data.frame(A=rnorm(100), B=rnorm(200)) y = data.frame(A=rnorm(30), B=rnorm(300)) z = data.frame(A=rnorm(20), B=rnorm(600)) listDF <- list(x,y,z) 错误:r不能分配内存我想知道这里是否有人知道，例如，一个数组还是一个包含多列的单个

浏览 3提问于2016-08-29得票数 2

回答已采纳

1回答

对R中的两列求和，使之为NA+NA=NA，但NA+(a number)=0+(a number)

我在R中有一个数据帧，它由NA和数字组成。它看起来是这样的： a b 1 1 3 2 NA NA 3 3 2 4 NA 1 5 4 NA 我希望能够对此数据帧中的两列求和，这样NA+NA=NA就可以了，但是当NA与一个数字相加时，它应该被视为0。例如，上面数据帧中'a‘和'b’的总和应该如下所示： sum 1 4 2 NA 3 5 4 1 5 4 有人知道我会怎么做吗？

浏览 2提问于2020-05-17得票数 1

10回答

如何在R中找到数据帧中列的最高值？

、

我有以下数据框架，我称之为臭氧： Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 7 23 299 8.6

浏览 7提问于2014-06-13得票数 72

回答已采纳

3回答

如何测试一对元素是否在数据框架中？

假设我有这个数据框架A： A = data.frame(first=c("a", "b","c", "d"), second=c(1, 2, 3, 4)) first second 1 a 1 2 b 2 3 c 3 4 d 4 我有一个数据框架B： B = data.frame(first=c("x", "a", "c"), second=c(1, 4, 3)) first second 1

浏览 1提问于2014-05-02得票数 3

回答已采纳

2回答

如何在数据帧中使用应用函数

、

? 所以我有一个像这样的数据框，我正在尝试使用控制这些值的更大函数来检查列之间的相关性。 df = pd.read_csv('2020.csv') def isbigger(x): if x > 7: return True return False 当我传入单个列名时，它可以很好地工作，比如 df['Ladder score'].apply(isbigger) 但是，当我获得数据帧的相关性并尝试应用它时，它的工作方式不是这样的 df.drop(axis=1,columns = ['Country name','

浏览 33提问于2020-09-14得票数 0

2回答

用每一行的均值和sd模拟R中的许多观测值

、、

我试图将rnorm函数应用于R中数据帧的许多行(214)，我想使用数据帧的每一行的预定义行均值和sd值来完成所有观测的模拟和n=10,000。我想使用apply函数来完成这个任务，但是，我不清楚如何在apply函数中编写rnorm调用来一次完成所有行的这一任务。可复制的例子： set.seed(1) Data <- data.frame( Hazard = LETTERS[1:10], mean = sample(1:10), sd = c(0.14,0.23,0.21,0.27,0.12,0.19,0.21,0.18, 0.29,0.22) ) 我试过

浏览 5提问于2020-07-07得票数 1

回答已采纳

1回答

取平均值

、

我有一个包含三个数据帧的列表，每个数据帧都有n列(本例中为6列)和r行(本例中为3列)。我想要创建一个矩阵，其维度(n*r)与列表中三个数据帧的平均值相同。例如，输出矩阵的1,1应该是0.2470748，0.2558439和0.2439057的平均值。对怎么做有什么想法吗？

浏览 4提问于2016-02-27得票数 0

回答已采纳

3回答

pandas /numpy的轴与R的边距相反吗？

、、、

将这两件事认为是相反的，这是正确的吗？这一直是我困惑的一个主要原因。下面是我在R和Python中找到数据帧的列总和的示例。请注意MARGIN和axis的相反值。在R中(使用MARGIN=2，即列边距)： m <- matrix(1:6, nrow=2) apply(m, MARGIN=2, mean) [1] 1.5 3.5 5.5 在Python中(使用axis=0，即行轴)： In [25]: m = pd.DataFrame(np.array([[1, 3, 5], [2, 4, 6]])) In [26]: m.apply(np.mean, axis=0) Out[26]:

浏览 2提问于2017-11-13得票数 2

2回答

忽略xsl:sort中的特殊符号

、、

我有个问题。有一些项目，包含术语，如： <term>Emploee's earnings...</term> <term>Emploee Withholdings...</term> <term>...value of an...</term> <term>...value of a...</term> 按照逻辑，"an“冠词应该在"a”之后。另外，"Emploee's“应该在"Emploee”之后。问题是如何使用xsl:sort来做这件事？非常感谢!

浏览 2提问于2013-06-10得票数 0

2回答

从R中的数据帧计算每分钟计数和

、、、

我已经想了很长一段时间了，但一直没能做到。我发现了很多类似的问题，根本帮不上忙。我在R中有大约43000条数据帧记录，日期列采用“2011-11-1502:00:01”格式，另一列是计数。数据框架的结构： str(results) 'data.frame': 43070 obs. of 2 variables: $ dates: Factor w/ 43070 levels "2011-11-15 02:00:01",..: 1 2 3 4 5 6 7 8 9 10 ... $ count: num 1 2 1 1 1 1 2 3 1 2 ...

浏览 3提问于2014-10-08得票数 0

回答已采纳

2回答

如何使用R包purrr中的函数重现循环

、

我经常在代码中使用循环。我被告知，与其使用循环，不如使用函数，并且可以使用R包purr中的函数重写循环。作为示例，代码仅显示虹膜数据集中不同物种的计数，其中Sepal.Width <3 library(dplyr) #dataframe to put the output in sepaltable <- data.frame(Species=character(), Total=numeric(), stringsAsFactors=FALSE) #list of species

浏览 1提问于2019-11-08得票数 3

2回答

在具有整数和字符变量的数据帧上应用有趣的逐行方法

、、、、

一个完全基本的问题--如果是重复的话，请原谅我。 set.seed(1) df <- data.frame(id=c('a', 'a', 'b', 'b', 'a'), a=sample(1:10, size=5, replace=T), b=sample(1:10, size=5, replace=T), c=sample(1:10, size=5, replace=T)) 然后, > df id a b c

浏览 2提问于2017-06-16得票数 1

回答已采纳

2回答

在分析来自两列超大型数据帧的数据时，忽略特定行中的NA

、、

我对R非常陌生，我正在努力理解如何以一种特定的方式忽略NA值。我有一个包含多个列(最多40列)和多行(最多200行)的大型数据帧。我想使用其中一列中的数据进行简单的统计(wilcox.test、boxplot等)：一列将有一个连续变量(V1)，而另一列有一个二元变量(V2；0或1)，它分为两组。我想使用不同的V2二进制变量对连续变量执行此操作，这些变量是无关的。我在Excel中组织了这些数据，将其保存为CSV，并使用R Studio。所有这些列都有散布的NA值，当我使用omit.na时，它只删除存在NA值的每一行，这就删除了大量的数据。有什么简单的解决方案可以做到这一点吗？我看过一些类似主

浏览 2提问于2015-01-07得票数 1

1回答

删除大熊猫数据框架中句子列表中的标点符号

、、

我在熊猫的数据框架里有电子邮件。在应用sent_tokenize，之前，我可以这样删除标点符号。 def removePunctuation(fullCorpus): punctuationRemoved = fullCorpus['text'].str.replace(r'[^\w\s]+', '') return punctuationRemoved 在应用sent_tokenize之后，数据框架如下所示。如何删除标点符号，同时将句子标记在列表中？ sent_tokenize def tokenizeSentences(fullCo

浏览 0提问于2018-08-04得票数 1

回答已采纳

1回答

删除具有某个值的列%0

、、

我是R的新手，我有一个名为pedM的数据帧，有203行和19列，我想编写一行代码来删除数据帧中主要返回值为0的列(也就是说，98%的列是0)。我正在使用数据帧输出一个热图，该热图返回基于基因表达的图像，并且我希望去掉那些具有对数据没有真正贡献的异常值的行。我想我要找的这行代码是相当简单的，但是我不能理解正确的方法。只是重申一下，寻找一行基本上可以从包含98%0或2%非零值的数据帧中删除列的行，无论哪种方法更容易。提前谢谢。 Vivek

浏览 0提问于2012-07-26得票数 0

回答已采纳

1回答

选择要在Pycaret中规范化的特定列

、、

如何在Pycaret函数中选择特定的列进行规范化？我不想将规范化函数应用于我的整个数据帧，只有几列。

浏览 7提问于2021-03-17得票数 0

1回答

数据帧字典中的舍入列

、

我有一个数据帧字典，我试图在循环中对每个数据帧中的各个列进行舍入，但似乎没有得到正确的结果。 taps = list(range(1,13)) cols_r2 = ['A','B,'C'] cols_r0 = ['D','E'] for tap in taps: df_dic[str(tap)+'_A'][cols_r2] = df_dic[str(tap)+'_A'][cols_r2].round(2) df_dic[str(tap)+'_A'][col

浏览 22提问于2020-03-19得票数 0

回答已采纳

2回答

所有熊猫细胞的Lemmatization

、

我有一个熊猫数据帧。有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。如何使用nltk库有效地计算所有这些单词的引理？ import nltk nltk.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。我的数据看起来类似于： import pandas as pd data = [[['walked','am','stressed',

浏览 1提问于2017-11-30得票数 11

回答已采纳

2回答

使用*apply函数访问dataframe的列名

、、、

我需要使用R *apply函数为初学者制作教程(第一次不使用reshape或plyr包) 我尝试对这个数据帧使用lapply (因为我知道apply不适合数据帧)一个简单的函数，并且我想使用命名列来访问数据： fDist <- function(x1,x2,y1,y2) { return (0.1*((x1 - x2)^2 + (y1-y2)^2)^0.5) } data <- read.table(textConnection("X1 Y1 X2 Y2 1 3.5 2.1 4.1 2.9 2 3.1 1.2 0.8 4.3 ")) data$di

浏览 0提问于2012-03-09得票数 3

回答已采纳

2回答

面板(横截面)时间序列上的上一次结转观测值(na.locf)

有没有一种方法可以使用na.locf函数来填充横截面(面板)时间序列数据中的NA值。我有一个面板数据集，其设置类似于多年数据，设置类似于以下内容： library(zoo) #actual [r] code and data! library(plm) data(Produc) a<-data.frame(Produc) b<-subset(a,state=="WYOMING"|state=="WISCONSIN",select = state:hwy) #limit to an easy subset) 数据有抑制(即未由政府数据机构发布的缺失

浏览 1提问于2011-03-15得票数 1

回答已采纳

1回答

并行计算15行(通过矢量化)并使用它们创建df

、

我在一个数据帧中创建了15行，如下所示。我不能展示我的真实代码，但是create row函数涉及可以放在函数中的复杂计算。关于如何使用lapply、apply等并行创建所有15行，然后将所有行连接到一个数据帧中，您有什么想法吗？我认为使用lapply是可行的(例如，将所有行放在一个列表中，然后取消列表并连接，但不确定如何操作)。 for( i in 1:15 ) { row <- create_row() # row is essentially a dataframe with 1 row rbind(my_df,row) }

浏览 19提问于2019-05-12得票数 2

回答已采纳

2回答

熊猫数据字典在列中，在列中循环，在列中排序，最好的方法是？

、

我的数据就像 languages = ['en','cs','es'] counties = ['us','ch','sp'] count = [32, 432,43] a = {('p', 0.25937605905953339), ('q', 0.2001602214732502)} b = {('r', 0.5937605905953339), ('4', 0.12001602214732502)} c = {('l

浏览 3提问于2020-01-09得票数 3

回答已采纳

3回答

fuzzywuzzy对pandas列中的字符串进行规范化

、、、、

我有一个这样的数据帧现在，我想要规范化'comments‘列中的字符串，用于单词'election’。我尝试使用fuzzywuzzy，但无法在熊猫数据帧上实现它，以部分匹配“选举”一词。输出数据框的'comments‘列中应该有单词'election’，如下所示假设我有大约100k行，“选举”这个词的可能组合可能有很多种。请在这方面给我指点。

浏览 1提问于2018-04-26得票数 0

2回答

矩阵乘法使用数据帧中的列作为输入？

、、

# Function to apply a rigid transformation matrix to a pair of coordinates transformation <- function(r1, r2, r3, r4, x, y, z = 0, t = 1) { transformation_matrix <- matrix(c(r1, r2, r3, r4), nrow=1, ncol=4) coordinate_matrix <- matrix(c(x, y, z, t), nrow=4, ncol=1) transformed_coordi

浏览 2提问于2020-05-09得票数 1

回答已采纳

3回答

R:在特定列上应用函数，保留数据帧的其余部分

、、

我想了解如何在不从df中“排除”其他列的情况下，对数据帧的特定列应用函数。例如，我想将一些特定的列乘以1000，而让其他列保持原样。例如，像这样使用sapply函数： a<-as.data.frame(sapply(table.xy[,1], function(x){x*1000})) 我得到了新的数据帧，其中第一列乘以1000，但没有在操作中使用的其他列。所以我尝试这样做： a<-as.data.frame(sapply(table.xy, function(x) if (colnames=="columnA") {x/1000} else {x

浏览 0提问于2012-11-15得票数 14

回答已采纳

2回答

正态分布计算错误-数学函数的非数值参数

、、、

我有两个数据帧，我在数据帧上应用了pnorm()和qnorm()，但我在计算时得到了错误。 n <- c(0.3,0.5,0.1,0.2) m <- c(0.1,0.4,0.5,0.3) o <- c(0.2,0.2,0.2,0.4) p <- c(0.3,0.1,0.3,0.3) df1 = data.frame(n,m,o,p) df1 n m o p 1 0.3 0.1 0.2 0.3 2 0.5 0.4 0.2 0.1 3 0.1 0.5 0.2 0.3 4 0.2 0.3 0.4 0.3 r <- c(0.2,0.4,0.1,0.3)

浏览 33提问于2017-12-28得票数 1

回答已采纳

2回答

计算每个变量中每个值的数量，并将其汇总到R中的新数据框中

、

我对R比较陌生，正在尝试计算我整个数据帧中每个变量的每个值的数量，这些都将汇总到一个新的数据帧中。例如，我的数据如下所示： cluster <- data.frame(sex = c(1,1,1,1,0), mut = c(0,0,0,0,0), ht = c(1,1,0,1,0), wt = c(0,1,1,0,1), group = c(1,0,0,0,0)) cluster sex mut ht wt gr

浏览 0提问于2018-05-19得票数 1

1回答

按数据框中的因子应用近似乐趣

、

我想通过因子将approxfun应用于数据帧，以插值原始数据帧中未包含的浓度，然后将结果绑定到原始数据。虽然我知道如何在basic R中做到这一点，但我在数据中遇到了grouping_by因子。以下是R语言中的一个示例： library(dplyr) #generate example data frame time <- c(0,2,4,6,8,10) conc <- c(0,5,10,15,20,40) df1 <- as.data.frame(cbind(time,conc)) df2 <- expand.grid(pH=1:2,form=1:2, time

浏览 25提问于2019-09-04得票数 0

回答已采纳

1回答

如果值大于或小于值，则替换数据框中的值

我在R中处理数据帧时遇到了问题，这是R中最基本的事情，但我找不到最好的命令来做这类事情。虚拟示例 Var1 20 300 39 Var2 49 23 91 Var3 0 239 210 如果value小于10，如何将第二列中的value替换为10；或者，如果数据帧中的所有值大于200，如何将它们替换为100

浏览 0提问于2014-05-24得票数 5

回答已采纳

1回答

在R中的多个数据帧上应用一组操作

我一直在为我的项目学习R，但一直无法在谷歌上搜索到我当前问题的解决方案。我有大约100个csv文件，需要对它们执行一组精确的操作。我已经将它们作为单独的对象读取(我认为这可能是不恰当的r风格)，但我无法编写一个可以循环的函数。每个csv都是一个包含信息的数据帧，其中包括一个以十进制年份格式表示日期的列。我需要创建2个包含年份和日期的新列。我已经想好了如何手动完成这项工作，我想找到一种自动化的方法。这是我一直在做的事情： #setup library(lubridate) #Used to check for leap years df.00 <- data.frame( site =

浏览 0提问于2013-04-20得票数 4

回答已采纳

1回答

函数在熊猫DataFrame的每一行上运行，但不生成新列。

、、

我有一个熊猫的数据框架如下： A B C D 3 4 3 1 5 2 2 2 2 1 4 3 我的最终目标是使用这个数据帧的每一行中的信息为优化问题产生一些约束，所以我不想生成一个输出并将它添加到数据帧中。我这样做的方式如下： def Computation(row): App = pd.Series(row['A']) App = App.tolist() PT = [row['B']] * len(App) CS = [row[&#

浏览 3提问于2016-09-24得票数 0

回答已采纳

1回答

基于R中具有切换值的两列消除一次重复观测？

我知道网上有很多关于删除R中重复项的问题/答案，但我还没有找到一个与我的问题相似的问题。这是我所拥有的一个例子： df<-data.frame("col1"=c("a","b","c","d","f","k"),"col2"=c("k","l","m","n","o","a"),stringsAsFactors=FALSE) 我的目标是消除此数据帧中的第一行或最后一

浏览 0提问于2017-03-11得票数 1

1回答

当使用apply在数据帧的每一行上重复函数时，r返回错误。

、、、

I有一个名为“Output”的数据框架： head(Output) X.110a. X.110b. X.110c. X.11a. X.11b. X.11c. X.127a. X.127b. X.129a. X.129b. iNOS 0 4.945371 0.000000 0 0.00000 0.00000 0.000000 0 0 0.000000 TNF 0 0.000000 0.000000 0 4.38255 0.00000 2.780874 0 0 4.727186 IL6

浏览 5提问于2022-09-23得票数 0