我正在尝试构建一个闪亮的应用程序,这样用户就可以与我在dataframe中的一组句子进行“交互”。dataframe如下所示:
# id: each sentence has a unique number
# file: name of the file the sentence comes from
# sentence: the actual sentence
# group: group the writer belongs to
# gender: writer's gender
id file sentence group g
非常绿色的R用户在这里。对不起,如果有人问这个问题,并在别的地方回答,我自己也找不到任何东西。
我不明白为什么我不能让一个for循环工作,定义多个新的数据文件,但是循环遍历一个预定义的列表。
“我的列表”是从现有的dataframe的变量名称的子集定义的:
varnames <- colnames(dplyr::select(df_response, -1:-4))
然后,我想循环遍历列表,为包含汇总函数结果的列表中的每个变量名称创建一个新的数据格式:
for (i in varnames){
paste0("df_",i) <- summary(past
使用python和pandas,我可以很容易地从字典对象列表中构造一个稀疏的DataFrame。下面的代码片段展示了如何在pandas中做到这一点: In [1]: import pandas as pd; (pd.DataFrame([{'a':1, 'b':10},
{'d':99, 'c':1},
{'b':1, 'd
我试图使用count()计算类别中的观察数,导致以下错误:
计数(数据$条件,c(“低”))
在乐趣中出错(X[i],.):找不到对象'Low‘
但是,当我请求返回本列中的所有值时,将得到以下响应:
Data$Condition
[1] Medium Low Low Medium High Zero High Low High Zero Medium Zero High Low Medium
[16] Medium Zero Low High Medium Zero High Low Medium H
这是R编程的新手,我有一个dataframe,我试图从其中创建一个更简洁的表,方法是仅当" name“列中包含特定名称时才拉出整个行。这些名称都在一个单独的文本文档中。有什么建议吗?
我试过了:
refGenestable <- dbGetQuery(con, "select row_names, name, chrom, strand, txStart, txEnd from refGene where name in c_Gene")
其中c_Gene是我需要测试的名称列表,我已经将其转换为数据帧。我也尝试过将其转换为字符串列表并对其进行迭代,但也遇到了问题
我来自Python,我不知道如何在R中实现这一点。我想编写一个包含两个参数的函数。A dataframe和a list of column names.我希望遍历dataframe来转换与列表中的列名相匹配的列名。
要转换的列名列表,类型为character
col.names<-c('Ri','Na','Mg')
我编写了这个函数,但它没有返回所需的输出。
function.convert<- function(df,col.names){
for (i in colnames(df)) {
if (i %in%
我是R的新手,我希望从我的dataframe中获得一个新的数据集,其中包括一个新列,该列表示dataframe现有列(称为Total )中值的median。后者包括大约5,000项个人意见。我有点困惑如何继续这项工作,因为中位数需要根据以下标准计算:房产、月份、年份和市场
目前,我的dataframe (让我们称之为mydata1)如下(前5行所示):
Property Date Month Year Market TotalExtras
ZIL 1-Jan-15 1 2015 UK 450.00
ZI
所以我有一个很大的数据帧列表,其中一些有匹配的列,而另一些没有。我希望重新绑定具有匹配列的变量,并合并其他没有匹配列的变量(基于变量Year、Country)。但是,我不想手动遍历所有数据帧来查看哪些有匹配的列,哪些没有匹配的列。
现在我在想,它应该看起来像这样:
myfiles = list.files(pattern="*.dta")
dflist <- lapply(myfiles, read.dta13)
for (i in 1:length(dflist)){
if colnames match
put them in list and rbin
我是R的新手,正在尝试执行简单的if/then语句。使用dataframe DFnew,我想执行: if "location2" is not missing then "Location" = "location2" 我的代码: library(dplyr)
test %>% DFnew %>%
if(location2 != NA){
Location <- location2
}
我是一个R newby,想知道人们是否可以给我一点建议,关于我如何处理我拥有的一些数据。
我有一个数据框,其中包含观察到基因变化的样本列表(示例如下)
Dataframe1:
Sample Gene Alteration
1 A -1
1 B -1
1 C -1
1 D 1
2 B 1
2 E -1 ...
我还有一个数据框,其中包含我感兴趣的基因列表(示例如下)
Dataframe2:
Gene
B
D
E
我想计算dataframe2中每个基因有多少个-1改变的样
如果同一两个第一列位于另一个dataframe中,那么在r中删除dataframe中的行的最快函数是什么。例如,如果数据框架A如下所示(包含更多的信息列):
NAME SURENAME
John Beer
Rose Pitt
Bob Kin
Charile Kind
Smith Red
Brad Tea
Kale Joe
Ana Bread
Lauren Old
Mike Karl
B如下:
NAME SURENAME
Rose Pit
问题:
如何使用R快速有效地从数据文件中删除所有特殊字符?
进度:
因此,详细介绍了如何删除特殊字符。我可以将gsub函数应用于单个列(图1和2),但不能应用整个dataframe。
问题:
我的dataframe由整数、字符串等组成的100+列组成。当我尝试在dataframe上运行gsub时,它不会返回我想要的输出。相反,我得到了如图3所示的内容。
df <- read.csv("C:/test.csv")
dfa <- gsub("[[:punct:]]", "", df$a) #this works on a single c
示例:
dataframe1有以下行和列。
+---------+---------+---------+---------+---------+
| Column1 | Column2 | Column3 | Column4 | Column5 |
+---------+---------+---------+---------+---------+
| A | B | C | D | E |
| P | Q | R | S | T |
| J | K
我知道我们可以使用apply或lapply来执行在R中for循环可以做的事情,如果您有一个dataframe,您可以使用apply (dataframe,2,mean)来计算列的平均值,但是,如果我们有数据列表,那么我需要通过删除第一列并将数据转换为数字来进行以下调整。让我们说,数据的列表是列表,其中LIST[1]是第一个数据。
如何使用列表立即执行上述操作。如何使用lapply对列表中的数据进行操作?
lapply(LIST, function (x) some function)
将该操作应用于“不对数据文件进行列表”。以下是没有任何意义的:
lapply(LIST[], function
我有一个需要转换的数据框架。我需要根据列的值将行更改为唯一的列。
例:
输入DataFrame
| column_1 | column_2 |
-----------------------
| A | B |
| A | C |
| B | E |
| B | C |
| C | F |
| C | G |
输出DataFrame
| column_1 | column_2 | column_3 |
-------------
我试图自动为给定的数据文件列表中的所有数据文件创建一个列(名为FXN),以便生成列的名称:
我尝试了lapply方法,但不确定如何从每个列出的dataframe中检索相应的文件名。
#read in list of dataframe (ldf)
ldf <- lapply("directory", read.delim)
#function to generate column FXN with respective df name
lapply(ldf, function(x) {
mutate(x,
FXN = deparse(substit
我在包含两列的data.frame中有信息,例如:
name age
a 10
b 20
c 30
我有一个名字列表,c b d。现在,我想按列表的顺序获得原始数据帧属性的data.frame (或list或任何东西)。对于上面的例子,这将是
name age
c 30
b 20
d NA
我觉得这不应该太困难(即使是排队),但我无法在R中找到一种方法。
背景:
我有一个从边缘列表创建的“网络”对象。我有另一个顶点属性,但是对于这些属性最初是如何排序的,我没有权力。现在,我要分配这些属性的网络顶点。
但是为了使用
network %v%
我有一个R DataFrame,我想用它再做一个DF,但是只有在一个确定列中出现超过X次的值。
>DataFrame
Value Column
1 a
4 a
2 b
6 c
3 c
4 c
9 a
1 d
例如,只有列中的值出现超过2次的新DataFrame才能得到如下内容:
>NewDataFrame
Value Column
1 a
4 a
6
我有两个问题。Q1:如何通过从主数据帧中提取一些列来子集数据。例如,我使用dfac作为数据格式。
ac<-c("a","b","c","d")
dc<-c(1,4,4,3)
bc<-c(1,1,0,0)
dfac<-data.frame(ac,dc,bc)
我需要一个名为subdf的子集df,方法是从主dataframe "dfac"中提取列"ac", and "bc"。我怎么能在R里做到这一点?输出应
subdf ac bc
a 1