创建新变量，直到另一个变量的第一个非NA值为0，然后为1(在一个组内) - 腾讯云开发者社区

、、

我试图使用glmmTMB运行零膨胀负二项式GLMM；但是，我在模型摘要输出的z和p值中获得了NAs。我不知道原因是什么；我一直在关注微缩和在线帮助，但我认为我的数据和我试图使用的技术肯定有问题。我的数据类似于支持文档中使用的Salamanders示例:负二项分布，零膨胀，具有相同的数据结构。问题在哪里？这个数据适合使用family = nbinom2吗？数据： > head(abun_data) depl_ID Keyword_1 depl_dur logging n AmbientTemperature ElNino 1 B1-1-14_1

浏览 3提问于2020-06-06得票数 1

回答已采纳

4回答

在R中使用正则表达式进行字符串拆分和截断

、、、、

浏览 58提问于2016-12-20得票数 1

回答已采纳

1回答

按倒排顺序计算data.frame中列的连续NA

、

我需要在调查数据中确认离校者的身份。为此，我想在我的数据中添加另一列，它对连续的NA进行计数，从一个特定的列开始，然后向后计数。我已经计算了整个NA的解释，虽然高计数的NA是一个很好的指标，我想确保人们没有跳过调查问卷的一部分，而不是直接离开。下面是一些示例数据： df <- structure(list(f1 = c(3, 3, 1, 2, 3, 2, 2, NA, 2, 3), f2num = c(170, NA, 182, 173, 169, NA, NA, NA, 153, 178), f3num = c(105, NA, 77, 80, 58, NA, NA, NA,

浏览 2提问于2017-06-22得票数 1

回答已采纳

2回答

为不同变量的第一个非NA变量创建一个0的变量，然后将其他值从0向上/向下计数按第三个变量分组。

、、、

我有以下df： df <- tibble(country = c("US", "US", "US", "US", "US", "US", "US", "US", "US", "Mex", "Mex"), year = c(1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2000, 2001), score = c(NA,

浏览 0提问于2019-03-12得票数 1

回答已采纳

1回答

用线性回归对R中分组数据的预测值填充NA值

、、、

我想在那些深度(depth_round)的prop_below5变量中填充NAs，在这里我没有使用线性插值的测量值，并且在可用时保持实际的测量值。我想对每个Cruise/Cast数据组进行线性回归。当我对选择第一个Cruise和强制转换以及应用lm()和predict()的数据进行子集时，我得到了正确的值： OS2017 <- data[data$Cruise=="OS1701" & data$Cast==1,] OS2017$prop_below5_interp <- ifelse(is.na(OS2017$prop_below5), predict(l

浏览 1提问于2022-05-27得票数 -1

回答已采纳

1回答

多用户web应用程序

、、、、

我知道这个问题被问了很多次，但我没有找到任何可以帮助我的东西。我正在使用Java，JSF，EJB，JPA，GlassFish，MySQL。我使用这些技术开发了具有自动化功能的网站，但只使用一个位置(每次一个会话)，如果另一个用户从另一个位置登录，他可以看到第一个用户会话的状态。现在，我需要开发一个多用户web应用程序，其中包含一个commom主页和一些commom特性，但其余部分需要依赖于用户--对web应用程序和数据库的多线程访问。我需要：限制用户从一个位置、一台计算机启动会话的能力。让他们在网站上注册一段有限的时间(概要文件应该活跃一年，比如说) 给他们一个小时后的

浏览 1提问于2012-11-06得票数 1

回答已采纳

1回答

用于模型选择的循环glm模型(model.sel)

、、

我正试图通过AIC来选择最好的型号。有人告诉我这是让glm模型自动组合的代码，但我真的不明白它是如何工作的。有没有人能用简单的语言来解释它是如何工作的，以及如何让它运行，因为我不能。 library(MuMIn) as.list(rep(NA, 44)) ->models for (i in 1:44) { glm(log(Tbra+1)~bats[,i],data=bats)-> models[[i]] } names(models)<-names(bats)[7:50] model.sel(models) 编辑1 关于这段代码我还有更多问题要问。 as.

浏览 1提问于2019-02-05得票数 0

回答已采纳

2回答

按组过滤NAs

、、

我有这个df df <- data.frame( id = c(1L,1L,1L,2L,2L,3L), keyword = c("car","hospital",NA,"cat",NA,NA)) 我想要这个 df <- data.frame( id = c(1L,1L,2L,3L), keyword = c("car","hospital","cat",NA)) 如果有一个关键字，我想保留它，如果没有，保持NA 试着像 df %>% group_by

浏览 0提问于2021-10-08得票数 0

回答已采纳

1回答

使用RegEx对Html中的值进行匹配

我只需要使用Regex提取以下输出：匹配1：(第1组:包装数量)(第2组: 1) 第2组：(第1组:宽度)(第2组: 14.7厘米) 鉴于以下投入： <li> <div class="col-3"> Packaged Quantity </div> <div class="col-5"> 1 </div> </li> <li> <div class="col-3"> Width </div> <div

浏览 0提问于2019-01-23得票数 0

回答已采纳

2回答

如何折叠R中跨不同列的分组信息

、、、

我有一个问题，应该有一个非常直截了当的解决办法，但我似乎找不到。基本上，我有嵌套在地区*县内的观察，但是他们的候选人值是错误的，单个候选人的信息通过多个列传播。原始数据集也有相同的问题，但它不是只有四个non.grouping变量，而是有500+。但现在看起来是这样的： current_df county district candidate name votes party 1 E100 1 1 john NA <NA> 2 E100 1 2 <NA> 100 <

浏览 6提问于2022-11-13得票数 1

1回答

在TTR包中，当向量长度= n时，EMA =均值而不考虑平滑比(这变得无关紧要)？

我很困惑为什么会这样。 > x <- c(1,2,3) > EMA <- EMA(x, n=3) > EMA [1] NA NA 2 > EMA <- EMA(x, n=3, ratio= .3) > EMA [1] NA NA 2 > EMA <- EMA(x, n=2, ratio= .3) > EMA [1] NA 1.50 1.95 > EMA <- EMA(x, n=2) > EMA [1] NA 1.5 2.5 那么，当n等于向量的长度时，EMA = mean，而平滑率是不相关的？完全不明

浏览 1提问于2015-03-21得票数 0

2回答

java中的正则表达式匹配模式

、

我很难理解一个简单的regex。我搜索了一下。不知怎么的，我一点也不感兴趣。以下是一种方法： public static void testMethod(){ String line = "This order was placed for QT3000! OK?"; String pattern = "(.*)(\\d+)(.*)"; // Create a Pattern object Pattern r = Pattern.compile(pattern); // Now

浏览 3提问于2015-09-11得票数 2

回答已采纳

1回答

将函数参数传递给mle()以获取对数似然

、、、

我在R中使用mle()方法手工估计具有多个预测变量的logit回归。我在传递下面的函数calcLogLikelihood中计算对数似然率所需的额外参数时遇到了问题。这是我的计算负对数概率的函数。 calcLogLikelihood <- function(betas, x, y) { # Computes the negative log-likelihood # # Args: # x: a matrix of the predictor variables in the logit model # y: a vector of the outcome vari

浏览 2提问于2014-11-06得票数 4

1回答

将环境变量分隔为列的Regex

我有一些环境变量我希望将其拆分为列(只使用regex，仅使用)，因此对于任何正常的env，我可以只使用=，但在我的示例中，我有一个名为LS_COLORS的变量(参见下面)，那么在这种情况下，如何使用regex将env拆分成单独的列？ USER=idptest1 GROUP=support HOST=beetle LS_COLORS=no=00:fi=00:di=00;34:ln=00;36:pi=40;33:so=00;35:bd=40;33;01:cd=40;33;01:or=01;05;37;41:mi=01;05;37;41:ex=00;32:*.cmd=00;32:*.exe=00;

浏览 2提问于2011-12-09得票数 0

回答已采纳

1回答

理解.groupby().first()在压缩Pandas DataFrame时的含义？

、、

因为我不确定确切的术语--比方说，我有这个文件： dataA.csv： event,car,bike,bus 63175,,18, 65641,45,9, 65805,,,54 68388,,65, 68388,,,39 73041,7,,18 79336,,44, 79423,,,5 与dataA = pd.read_csv("dataA.csv", dtype='Int64')一起阅读这篇文章，我们得到了一只熊猫DataFrame： dataA: event car bike bus 0 63175 <NA> 18 &

浏览 1提问于2020-04-11得票数 1

回答已采纳

1回答

选择列集，以便每行至少有一个非NA项。

、、、

我有大量的变量(列)，但是每个变量都缺少一些观测值(行)。如何获得一组(或所有的)列，使每一行至少有一个非NA值？示例： > df <- data.frame(a=c(1,NA,NA,1,NA), b=c(NA,1,NA,1,NA), c=c(1,NA,NA,NA,1), d=c(1,1,1,1,NA)) > df a b c d 1 1 NA 1 1 2 NA 1 NA 1 3 NA NA NA 1 4 1 1 NA 1 5 NA NA 1 NA 在这里，我想获得列c和d，因为它们结合在一起至少会为每一行生成一个非NA观察。我曾想过强迫所有

浏览 4提问于2022-04-29得票数 0

回答已采纳

1回答

为数据帧中的后续N/As创建索引/数字序列

、

我在一个数据框架中有一个列(这里称为"a")，其中序列的开始用1标记，而属于同一序列的后续事件用N/A标记。现在，我想创建一个新的列("b")来索引属于同一序列(1:n)的所有事件，然后创建第三列("c")，其中指示哪些事件属于同一序列。我确信一旦我看到它，这个解决方案就会非常简单和引人注目，然而，目前我只是想不出如何最好地解决这个问题的办法。据我所见，其他问题也没有涉及我的问题。通常我使用的是dplyr (我还需要对我的数据执行一些group_by，这实际上比我在这里描述的要复杂)，所以如果可能的话，我会非常乐意使用dplyr解决方案！示

浏览 0提问于2019-04-18得票数 3

回答已采纳

2回答

R tidyr::pivot_longer()多列

我有一个包含几个列的数据集，如下所示：我希望将数据转换为更长的格式，并包含名称:交易价值、位置、球员名称和趋势值。这是我试过的..。但是代码试图将趋势列和播放器名列组合起来。如何指定这些列应该是由同一位置表示的两个单独列？ Data_trend <- data %>% tidyr::pivot_longer( cols = !`Trade Value`, names_to = c("Position", "Player Name"), names_pattern = c("

浏览 6提问于2021-08-08得票数 1

回答已采纳

1回答

如何在通过两列连接两个数据帧时忽略NA？

、

我有两个数据帧，我想通过id和date连接，忽略第二个数据帧中的NA。 dataset_A id date e1234 2018-01-19 e1234 2018-01-14 e1234 2018-02-13 e2345 2018-07-18 e2345 2018-09-29 e2345 2018-10-10 e3456 2018-11-12 dataset_B id date item_id item_name e1234 2018-01-19 NA

浏览 0提问于2019-01-21得票数 0

1回答

按开始/停止间隔组将列拆分为多个段

、、

我有一个非常简单的数据帧，其中ID是一个数字序列，有多个组，其中开始/结束用start/stop表示： ID = c(1:20) group = c(NA,1,NA,NA,NA,1,NA,NA,NA,2,NA,NA,NA,NA,NA,2,NA,NA,NA,NA) %>% as.factor() type = c(NA,"start",NA,NA,NA,"stop",NA,NA,NA,"start",NA,NA,NA,NA,NA,"stop",NA,NA,NA,NA) %>% as.factor() df = dat

浏览 12提问于2019-04-06得票数 1

回答已采纳

2回答

使用R根据公共变量组合数据帧中的行

、

我正在处理一些调查回复，而返回的数据已经被笨拙地格式化了。下面是数据外观的一个示例： df <- data_frame(Person = c("Person1", "Person1","Person2", "Person2","Person3", "Person3"), Q1 = c(NA, 1, NA, 2, NA, 1), Q2 = c(NA, 3, NA, 2, NA, 4), Q3 = c(2, NA, 4, NA, 1, NA), Q4 = c(5, NA,

浏览 3提问于2019-05-22得票数 0

回答已采纳

1回答

选择我输出到S4模式的任何单个元素

对于计算ml估计，我应用包mle2{bbmle}.my输出具有S4模式。我不能选择用于'$‘和'@’参数估计。我要求选择例如landa Estimate= 0.31148。感谢您的回复。输出：‘最大似然估计。 Call: mle2(minuslogl = nsdlo, start = list(landa = 0.01, teta = 1.001, alpha = 1.001, beta = 1.002), data = list(x1 = dataset1, x2 = dataset2)) Coefficients: Estimate Std. E

浏览 3提问于2018-11-24得票数 0

2回答

在每一组中消除NAs

、

我最后得到了与被删除的列对应的NAs行，我想去掉这些NAs。这将将下面的示例df从三行转到一行，并为每个组留给我一组变量。 df <- data.frame(group = c("a", "a", "a"), var1 = c(1, NA, NA), var2 = c(NA, 4, NA), var3 = c(NA, NA, 2), var4 = c(1, NA, NA), var5 = c(NA, 4, NA), var6 = c(NA, NA, 2), var7 = c(1, NA, NA), var8 = c(NA, 4, NA)

浏览 1提问于2019-10-24得票数 2

回答已采纳

2回答

动物园包装中的限制na.locf

、、、

我想对一个变量做最后一次观察，但只有2次观察。也就是说，对于3或更多NA的数据缺口，我只会为接下来的2次观测进行最后的观察，而将其余的作为NA。如果我在zoo::na.locf中这样做，maxgap参数意味着，如果间隙大于2，则不替换NA。就连最后两个也没有。还有别的选择吗？ x <- c(NA,3,4,5,6,NA,NA,NA,7,8) zoo::na.locf(x, maxgap = 2) # Doesn't replace the first 2 NAs of after the 6 as the gap of NA is 3. Desired_output <-

浏览 2提问于2018-09-13得票数 5

回答已采纳

2回答

按组和，但不包括指定id以下的值

我试着从这开始： #Starting df name = c("tom", "tom", "tom", "chris", "chris", "chris", "jen", "jen", "jen") value = c(2,10,"end",45,"end",13,6,"end",13) df = data.frame(name,value) 或者这个(它使用NA作为截止点) #Starting d

浏览 5提问于2017-11-09得票数 4

回答已采纳

3回答

有人能解释一下这个“同时”循环吗？(重复和变量)

、

我正在学习循环，我试着理解这个循环： var contador = 2; var na = "na"; while(contador) { na += na; contador -= 1; } console.log(na + " Freddy ") 我知道结果是"nananana Freddy"，但我不明白为什么。在第一次迭代之后，"na“将有另一个"na"，因此它将是"nana”。在第一次迭代之后，"contador“将是1，对吗？(contador = 2-1)。那么，为什么还要继续

浏览 5提问于2021-06-20得票数 0

回答已采纳

4回答

基于其他列值复制列中的值

、

我正在尝试用同一列中同一月份的行中出现的另一个值填充所有NA，有没有简单的方法？我已经找到了几乎所有的函数，但并不完全是这样。 data.frame看起来像这样 id month price1 price2 1 1 NA 2 2 1 4 NA 3 1 NA NA 1 2 6 NA 2 2 NA NA 3 2 NA 4 输出应如下所示： id month price1 price2 1 1

浏览 2提问于2016-05-23得票数 0

1回答

R中分组日期内的Pad

、、、、

library(tidyverse) library(lubridate) library(padr) df <- tibble(`Action Item ID` = c("ABC", "DEF", "GHI", "JKL", "MNO", "PQR"), `Date Created` = as.Date(c("2019-01-01", "2019-01-01",

浏览 6提问于2020-01-14得票数 2

回答已采纳

1回答

更改值结转次数的最大间隔

、、、

我有一个类似于以下内容的数据框架： library(data.table) test <- data.table(data.frame("value" = c(5,NA,8,NA,NA,8,6,NA,NA,10), "locf_N" = c(1,NA,1,NA,NA,1,2,NA,NA,2)) ) 在这个数据框架中，我有一个变量，它指示我可以继续进行最后一次观察(locf_N)的时间。这并不是所有观察的固定数目。为此，我尝试使用na.locf函数中的maxgap参数，但这并不是我想要的。 requ

浏览 0提问于2018-05-23得票数 2

回答已采纳

2回答

允许字母数字，最大一个空格等的正则表达式

、、

我正在打开一个与另一个线程非常相似的线程，但我找不出一个问题:我有一个输入字段，允许一个字母数字字符串以一个可选的唯一空格作为分隔符，然后是一个可选的其他字母数字字符串等等。我发现这个大梁： ^([0-9a-zA-z]+ ?)*$ 起作用了！但是，当我在一个长句子中有两个连续的空格，而这两个空格位于句子的很远的时候，我的表现真的很糟糕。在下面的例子中，如果我将两个空格放在句子的开头，结果在半秒内就可以了。但如果距离很远，它会持续10秒或更长时间。 dzdff5464zdiophjazdioj ttttt zoddzdfff ttttt zoddzdfff ttttt zo999 ddzdff

浏览 7提问于2013-06-20得票数 1

回答已采纳

1回答

如何用先例平均值和以下数值替换NA值(R)

、、、

我目前有一个数据集，它或多或少具有以下特征： Country <- rep(c("Honduras", "Belize"),each=6) Year <- rep(c(2010,2011,2012,2014,2015,2016),2) Observation <- c(2, 5,NA, NA,2,3,NA, NA,2,3,1,NA) df <- data.frame(Country, Year, Observation) 我想要做的是找到一个命令/编写一个函数，该函数仅用填充每个国家的NAs 如果NA观测为第一年(2010年)，则将用下一

浏览 2提问于2022-03-10得票数 0

回答已采纳

1回答

如果只有第一个观察符合标准，那么是否有一种方法可以对一个组进行子集？

、、、

我有这样一个数据框架： ID = c(1,1,1,2,2,2,3,3,3,4,4,4,4) VAR_1 = c(2,4,6,1,7,9,4,4,3,1,7,4,0) VAR_2 = c(NA,NA,NA,NA,NA,20190101,20190101,20190101,NA,20190101,NA,NA,NA) df2 = data.frame(ID,VAR_1,VAR_2) 我想从这个数据框架中子集每个组(ID) 的所有行()，如果VAR_2中的第一个观察组有一个值，那么在这个简单的例子中，新子集应该是ID的3和4中的所有行为了更好地代表这一点： df

浏览 0提问于2019-05-14得票数 1

回答已采纳

2回答

Python用char替换所有换行符，后面是char。

、、、

示例字符串： str = "test sdf sfwe \n \na dssdf 我想取代： \na 使用 a “a”可以是任何字符。我试过： str = "test \n \na" res = re.sub('[\n.]','a',str) 但是，我如何将字符存储在\n后面，并使用它作为替换呢？

浏览 0提问于2019-09-08得票数 0

回答已采纳

2回答

如何使用C#正则表达式解析以下内容

、

我有这个文本："((FIELD1_NAME like 'Product%') And (Instr(FIELD1_NAME, 'Product_typ') = 1))"; 我想从字符串的Instr部分解析FIELD1_NAME和Product_typ。这不起作用：@"Instr((?<column>[A-Z0-9_]+), '(?<value>([^']|(''))+)'"

浏览 2提问于2014-09-17得票数 0

1回答

根据多个标准r删除组中的行

、

我有一个数据集，其中包含一些日期变量上的重复值，因此我希望根据几个条件筛选此行。例如，dataframe如下所示： df <- read.table(text = "Date column_A column_B column_C Column_D 1 2020-01-01 10 15 15 20 2 2020-01-02 10 15 15 20 3 2020-01-03

浏览 5提问于2020-11-12得票数 2

回答已采纳

1回答

字符串替换powershell中的添加

、

大家好，我是powershell的初学者，我在一个脚本中创建了一个输出文件，用于检查netapp (na0maa-euc01) level3文件夹中的所有卷数据(datax)，该文件夹拥有每个人的权限，并且没有活动目录安全组(必须位于level3文件夹上)，所以outpout文件是这样的。 \\na0maa-euc01\data1\Nissan Production Engineering\TC Facility\X11M \\na0maa-euc01\data1\Powertrain_DIP-A entry\IQMS\Data \\na0maa-euc01\data1\Powertrain

浏览 0提问于2020-01-25得票数 0

回答已采纳

1回答

statsmodel分数logit模型

、、

谁能告诉我在python的statsmodel包中估计分数logit模型的参数的方法是什么？有没有人能给我介绍一下分数logit模型源代码的具体部分？

浏览 14提问于2017-07-15得票数 0

1回答

MLE函数: optim(start，f，method = method，hessian = TRUE，...)中的错误:非有限差值[1]

、

我在试着拿到MLE。 loglike <- function(theta) { ll <- 14 * log(1 - theta) + 12216 * log(theta) ll } neg.loglike <- function(theta) -loglike(theta) mle(neg.loglike, start = list(theta = 0.5)) 我得到了一个错误 Error in optim(start, f, method = method, hessian = TRUE, ...) : non-finite finite-differe

浏览 0提问于2020-10-22得票数 0

2回答

正则表达式以匹配除模式之外的所有内容

、

我来自。现在我想要的恰恰相反。我想要匹配除此模式之外的所有字符： yearid="[0-9]+" 我为什么要这么做呢？我尝试过(?!yearid="[0-9]+")，但它拒绝匹配match。

浏览 4提问于2016-06-28得票数 1

3回答

使用R选择第一个非NA值

df<-data.frame(ID = c(1,1,1,2,3,3,3), test = c(NA, 5.5, 6.4, NA, 7.3, NA, 10.9)) 我想要创建一个名为" value“的变量，它是每个独立ID的测试的第一个非NA值。对于只有NA的个人ID 2，值是NA。预期产出如下： df<-data.frame(ID = c(1,1,1,2,3,3,3), test = c(NA, 5.5, 6.4, NA, 7.3, NA, 10.9), value = c(5.5, 5.5, 5.5, NA

浏览 2提问于2021-01-12得票数 2

回答已采纳

1回答

零膨胀负二项分布函数NaN警告

、、

我试图将我的数据拟合成一个零膨胀负二项分布模型，但是当SE在摘要函数中被计算时，我的3个自变量(暴露)中的一个似乎导致了NaNs的产生(参见零信息调用的末尾)。我也尝试过运行一个负面的二项式障碍模型，并且遇到了类似的问题。 str(eggTreat) 'data.frame': 455 obs. of 4 variables: $ Exposure : Factor w/ 2 levels "C","E": 2 2 2 2 2 2 2 2 2 2 ... $ hi_lo : Factor w/ 2 levels "hi&#

浏览 4提问于2020-06-16得票数 2

回答已采纳

3回答

用R向量中先前数的改进型替换NA

、、、

我有一个带有NAs的向量，我想用前面的非NA值减去0.1替换其中的一些NAs。如果NAs的字符串超过一定长度(例如，2)，我也不想替换NAs。下面是一个例子 x <- c(1:3, NA, 4, NA, NA, 5, NA, NA, NA, 6, NA) 我想要做一个看上去像 x_prime <- c(1:3, 2.9, 4, 3.9, 3.8, 5, NA, NA, NA, 6, 5.9) 打印出来的内容如下： > x_prime [1] 1.0 2.0 3.0 2.9 4.0 3.9 3.8 5.0 NA NA NA 6.0 5.9 更复杂的是，我希望跟踪我修改

浏览 5提问于2021-03-05得票数 0

回答已采纳

1回答

使用python提取复杂链接

、

我有一个RegEx，它应该可以找到方括号中的所有字母数字字符或文本，就像上面的链接中的例子。这些文本实际上是带有描述的链接(例如，[[Toto|there's a link here]]是到页面Toto的链接) 但问题是，我可能在方括号之间有其他文本，所以就像你在链接中看到的那样，它不能识别结尾的括号(]])。在这些链接中还有另一个重要的模式，它有管道(|)，它将我的文本分成两到三部分。在这种情况下，有两个部分，我只想得到左边的文本，在这个例子中，有三个部分，我想要得到右边的文本。示例： [[File:Euclid flowchart 1.png|vignette|[[Flowc

浏览 16提问于2019-03-07得票数 2

1回答

regex (使用tidyr收集多组列)

、、、

在的启发下，我尝试将的gather()和spread()与正则表达式regex结合使用，但我似乎在regex上错了。我确实研究了几个regex问题：，，还有。我试图通过使用受regex启发的starts_with()、ends_with()和matches()来绕过，但没有运气。我在这里要求，希望有人能告诉我哪里错了，我可以解决它，最好是使用，从的选择帮助。我需要选择两个regex-groups，一个到最后一个.，另一个由最后一个.之后的内容组成，我在下面做了下面的两个例子，一个是我的代码工作的地方，另一个是我被卡住的地方。首先是起作用的例子， # install.packages(c

浏览 0提问于2018-02-18得票数 2

回答已采纳

1回答

创建新变量作为另一个变量的第一个值，按第三个变量排序

、

我有一个数据库如下所示： score_df <- tibble(country = c("US", "US", "US", "US", "Mex", "Mex"), year = c(2001, 2000, 1997, 2003, 1998, 2006), perc = c(5, 6,8, 8, NA, 10), score = c(NA, 400, NA, 423, 12, 18)) 我想要创建一个新的

浏览 0提问于2019-03-10得票数 0

回答已采纳

4回答

匹配两个条件中的第一个

我的问题很简单，但我一直在努力解决这个问题。我有两种类型的字符串:一种有分号，另一种没有，都有冒号。 Reason: A chosen reason Delete: Other: testing Reason for action: Other; testing Blah: Other; testing;testing 如果字符串有分号，我希望在第一次1之后匹配任何内容。如果它没有分号，我想在第一个冒号之后匹配所有内容。对于上面的行我应该得到： A chosen reason Other: testing testing testing;testing 我可以使用;(.*)使分号匹配，也可以通

浏览 0提问于2019-08-16得票数 2

回答已采纳

1回答

对于区间删失数据由survfit()生成的难以置信的宽置信区间

、、

我有一些数据是通过间歇性访谈得出的，在这些访谈中，一个人被问到他们是否有某种症状。最后一次每个人都知道没有这个特殊的症状，被称为tstart。如果适用的话，观察到患者出现症状的时间是tstop。使用R中的survival包，使用Surv函数创建一个生存对象，指定这是间隔删失数据。我想要一个生存函数的非参数极大似然估计。这可以使用survfit函数来实现，它似乎是通过调用内部函数survfitTurnbull来实现的。由此产生的置信区间大得难以置信。我不明白为什么会这样。 # A random sample of the data using dput() structure(list(tsta

浏览 1提问于2020-05-04得票数 1

回答已采纳

1回答

具有特征变量的群的SAS proc转置

、

我有三个变量的数据。第一个是id，第二个是那个id的观察计数，第三个是观察值。我想把数据从长转到宽。问题是，我收到一个错误，说我的by组没有按升序排序(即使是这样)。另一个问题是，并不是所有的值都有相同的观察结果，请参阅下面的示例和我正在寻找的数据结构。 data have; input id observation value; cards; 1 1 '4.8.9' 1 2 '4.5.7' 2 1 '5.0.5' 3 1 '4.2.0' 3 2 '4.1.0' 3 3 '5

浏览 1提问于2021-08-18得票数 0

回答已采纳

2回答

获取一个向量的多重求和，该向量包含由NA除以的多个因子级别

、、

希望有人能帮我解决以下问题：我有一个非常大的向量(105264)，形式如下。一组值，然后是一组NA，然后又是一组值(以此类推)。 c(123, 4525, 4365, 234, 674, NA, NA, NA, NA, NA, NA, NA, 24, 347, 457, 3246, 234, 5, 346, NA, NA, NA, NA, NA, NA, [... and so on]) 有没有办法让我得到我的每个价值包的总和，由我的NA分开？值和NA在向量上的长度是分开的，这就是我看到的问题所在。非常感谢您的回复！致以最好的问候，麦克斯

浏览 0提问于2018-08-09得票数 1

1回答

迭代填充datatable列

、、、

使用初始值，我希望根据存储在单独列中的增长率(按id )迭代填充data.table列中的NAs。以以下data.table为例： library(data.table) DT <- data.table(id = c("A","A","A","A","B","B","B","B"), date=1:4, growth=1L+runif(8), index= c(NA,250,NA,NA,NA,300,NA,NA)) > DT id date

浏览 1提问于2018-03-15得票数 2

回答已采纳