我试图将数据帧列表中的NA字符串替换为-99.99,以便在RCLIMDEX中运行我的数据。
这是我的一个数据帧的结构,它们都有相同数量的列和行头。
year month day Pr Tx2m Tn2m
1 1987 12 31 NA NA NA
2 1988 1 1 0 NA NA
3 1988 1 2 0 NA NA
4 1988 1 3 0 NA NA
5 1988 1 4 0 NA NA
6 1988 1 5 0 NA NA
我曾尝试使用以下方法:
e
def calcScore(p):
if p[0] > p[1]:
x = 3
y = 0
elif p[0] == p[1]:
x = 1
y = 1
else:
x = 0
y = 3
return x,y 如何将此函数应用于数据帧的第一行?我知道如何将其应用于整个数据帧,但似乎不能仅将其应用于第一行?下面是我对整个数据帧所做的工作。我是python的新手,所以请原谅我犯的愚蠢的错误。谢谢。:) result =(prem[['FTHG','FTAG']].apply(ca
我刚接触pandas,对此感到相当困惑,特别是与列表和使用列表理解相比。
我有一个有4列的数据帧。我想在第四列"m“的基础上创建第五列"c”。我可以通过对"m“列中的每一行应用我的函数来获得"c”的值。
如果"m“是一个列表,并且使用列表理解,那么它将是
c = [myfunction(x) for x in m]
如何将此“逻辑”应用于数据帧?
在将函数应用于数据帧列表时,我遇到了一个棘手的问题。最终,我想为药物使用数据的大型数据集绘制单独的时间序列图表。
我的数据集包括30种不同的抗生素,其使用率是在5年内每月收集的。它有3列和1692行。
到目前为止,我已经为每个抗生素类制作了一个单独的数据帧列表。(列表的名称是药品,drug.class是原始数据框中药品名称的字符向量)
drugList <- list()
n<-length(drug.class)
for (i in 1:n){
drugList[[i]] <-AB[Drug==(drug.class[i]),]
}
例如,我在列表中有30个数据帧,列如
我知道“如何在数据帧列表中更改名称”的答案已经被多次回答了。但是,我试图生成一个函数,该函数可以将任何列表作为参数,并更改列表中所有数据帧的所有列名。我正在处理大量的.csv文件,所有这些文件都有相同的3个列名。我将分组导入文件,如下所示:
# Get a group of drying data data files, remove 1st column
files <- list.files('Mang_Run1', pattern = '*.csv', full = TRUE)
mr1 <- lapply(files, read.csv, sk
我有3个文本文件,每个文本文件有14个类似的列。我想先读取这3个文件(数据帧),然后将它们合并成一个数据框架。以下是我在R邮件列表中找到一些帮助后所做的尝试:
file_name <- list.files(pattern='sEMA*') # CREATING A LIST OF FILE NAMES OF FILES HAVING 'sEMA' IN THEIR NAMES
NGSim <- lapply (file_name, read.csv, sep=' ', header=F, strip.white=T) # READ
我正在尝试使用我自己的函数从数据帧中计算多个值。该函数当前仅返回数据帧中的一个值。我的for循环似乎不能正常工作。我也试着把结果放在一个新的列表中...
我的数据帧:
A B C D E
ES -0.03 -0.08 -0.07 -0.03 -0.11
我的函数:
w <- function(x){
for(i in 1:length(x))
{
return( (1/x[i]) / (sum(1/x)) )
}
我有一个函数,它在一个数据帧中使用两列:
def create_time(var, var1):
if var == "Helår":
y = var1+'Q4'
else:
if var == 'Halvår':
y = var1+'Q2'
else:
y = var1+'Q'+str(var)[0:1]
return y
现在我想遍历我的数据帧,使用函数创
我有个问题来自Purrr包的map函数。
我可以使用map成功地将数据帧列表传递给函数。
输出仍然是一个列表,这就是我的问题;我需要将修改后的数据帧作为R对象
例如,mtcar数据集:
#I create a second df
mtcars2 <- mtcars
#change one variable just to distinguish them
mtcars2$mpg <- mtcars2$mpg / 2
#create the list
dflist <- list(mtcars,mtcars2)
#then, a simple func
我很难理解plyr包的用法。我尝试使用它来拆分存储在列表中的数据帧,应用一个函数,将结果存储为数据帧,然后将数据帧重新组合为列表。因此,给出以下数据:
#create test dfs
df1<-data.frame(a=sample(1:50,10),b=sample(1:50,10),c=sample(1:50,10),d=(c("a","b","c","a","a","b","b","a","c","d"))
我在R中有一个数据帧,它有大约100k个ID。我希望将这些ID放在使用R包RODBC、MySQL和redshift将R连接到Oracle、MYSQL和redshift表的查询中。
例如,
output <- dbGetQuery(conn,paste("select * from redshift_table
where ID in (select ID from df"))
当你只有几个I时,我已经看到了一些使用粘贴功能的解决方案,但我的I列表非常大,我认为粘贴功能不起作用。
如何将我的R数据帧与R中的这些外部数据库连接起来?我不喜欢在我的外部数据库中创建临时表。
提
我正在尝试从一个网页列表中抓取一个HTML表格(每个页面上只有一个表格)。 下面是我的代码的第一部分: for i in range(len(urls)):
r = requests.get(urls[i], header)
data = pd.read_html(r.text,index_col=0, header=0)
appended_list.append(data) ' urls‘是一个urls列表(每个urls都有一个静态表),这个代码是有效的--我得到了一个数据帧列表(appended_list)。 现在,我想把这个数据帧列表写到一个excel表中。这是我