我有一个基于列表创建类似数据帧的循环,如下所示 Name = ['A','B,'C','D']
for name in Name:
my_dfs[name] = pd.read_csv(r"C:\Hs\OB\O\%s.csv" % name, delimiter=';')
my_dfs[name].columns = ['Time','s1', 's2','s3','s4','s5','s6']
所以我有1,000个数据帧要使用R中的FOR循环来处理,假设它们被命名为DF1 to DF1000。我需要将数据帧中的所有0值替换为1。我试着这样写。
for (i in 1:1000){
eval(as.symbol(paste0("DF","i")))[eval(as.symbol(paste0("DF","i")))==0]<-1
}
这会导致一个错误(“找不到eval<-")。如何解决此问题?我尝试使用“赋值”,但得到了一个不同的错误(“赋值的目标扩展到非语言对象”)。
先谢谢你,阿尔沃
我是来自Stata的R的初学者,我的第一个头痛是弄清楚如何遍历一个名称列表,对所有名称执行相同的操作。名称是来自数据框的变量。我尝试以这种方式定义一个列表:mylist<- c("df$name1", "df$name2"),然后尝试:for (i in mylist) { i },我希望它等同于编写df$name1,然后编写df$name2,让R打印数据帧df中名为name1和name2的变量的内容。我尝试了其他命令,比如在for命令中删除变量i=NULL,但也不起作用。如果有人能告诉我我做错了什么,我将不胜感激。我想知道这是否与我写i的方式有关,也许R
我正在尝试使用我自己的函数从数据帧中计算多个值。该函数当前仅返回数据帧中的一个值。我的for循环似乎不能正常工作。我也试着把结果放在一个新的列表中...
我的数据帧:
A B C D E
ES -0.03 -0.08 -0.07 -0.03 -0.11
我的函数:
w <- function(x){
for(i in 1:length(x))
{
return( (1/x[i]) / (sum(1/x)) )
}
是否可以将多个数据帧存储到一个数据结构中,然后由每个数据帧对其进行处理?例如,示例
df1 <- data.frame(c(1,2,3), c(4,5,6))
df2 <- data.frame(c(11,22,33), c(44,55,66))
。。然后我想将它们添加到一个数据结构中,这样我就可以遍历该数据结构,一次检索一个数据帧并处理它,如下所示
for ( iterate through the data structure) # this gives df1, then df2
{
write data frame to a file
}
我在R中找不到任何这样
我使用python处理熊猫数据帧已经有一段时间了。我想将我正在使用的相同代码切换到R。然而,我没有太多使用R的经验,我也不确定我有什么选择来做同样的事情。我有一个包含许多csv文件的文件夹,并且我有一个文件名列表,我希望遍历这些文件并对这些文件进行完整的外连接。 在pandas中,我会运行以下命令, import pandas as pd
filelist = pd.read_excel("/Users/XXX/Documents/test/data/list.xlsx") #contains a list of filenames in the File column ar
使用apply系列中的函数可以很容易地加速R中的循环。如何在下面的代码中使用apply函数来加快速度?注意,在循环内,在每次迭代中,一列被置换,并且函数被应用于新数据帧(即,具有一列置换的初始数据帧)。我似乎不能让apply工作,因为新的数据帧必须在循环中构建。
#x <- data.frame(a=1:10,b=11:20,c=21:30) #small example
x <- data.frame(matrix(runif(50*100),nrow=50,ncol=100)) #larger example
y <- rowMeans(x)
start <- S
我有一个数据框架,在这里我想使用group函数,因为column.It在我正在做的数据帧中工作得很好。
import pandas as pd
#df=pd.read_csv(r'C:\Users\mobeen\Downloads\pminus.csv')
df=pd.read_csv(r'C:\Users\final.csv')
print(df)
df1=[v for k, v in df.groupby('region')]
df1
df1.to_csv('filename2',na_rep='Nan',in
我有一个嵌套的JSON结构,我将其解码为以下类:
case class Player(name: Option[String], age: Option[Int])
case class Team(name: Option[String], players: Option[Seq[Player]])
// create dataframe from JSON structure
val teamDF = spark.read
.option("multiline", true)
.schema(teamSchema)
.json("./test.json&
我有两个像这样的数据帧
df1
name ID abb
0 foo 251803 I
1 bar 376811 R
2 baz 174254 Q
3 foofoo 337144 IRQ
4 barbar 306521 IQ
df2
abb comment
0 I fine
1 R repeat
2 Q o
我正在从一个网站上抓取数据,所以我创建了一个for循环来从多个网页收集数据并生成单独的数据帧。但是,我不知道如何用不同的名称保存它们。
我首先创建了数据帧名称列表:
dataframe_names=[]
for i in range(0,50):
text='item'+str(i)
dataframe_names.append(text)
然后,我在创建数据帧的循环中包含了以下代码:
df=[name for name in dataframe_names]
预期的输出是从for循环创建的数据帧,并分别保存,如df1、df2、df3、.....df50。
然而
我有一个数据帧,它的列如下所示:
MultiIndex([('Longitude', 'Field1'),
('Latitude', 'Field1'),
('Name with Name Text', 'Field1'),
('Name with Name Text', 'Field2'),
('IsPresent', 'Field1')]
我有一个函数,它在一个数据帧中使用两列:
def create_time(var, var1):
if var == "Helår":
y = var1+'Q4'
else:
if var == 'Halvår':
y = var1+'Q2'
else:
y = var1+'Q'+str(var)[0:1]
return y
现在我想遍历我的数据帧,使用函数创