我正在使用这段代码遍历一个dataframe:
for r in zip(df['Name']):
#statements
如何识别数据文件中的特定行?例如,我希望在遍历时为Name列的每一行分配一个新值。我该怎么做?我试过这个:
for r in zip(df['Name']):
df['Name']= time.time()
问题是每一行都得到相同的值,而不是不同的值。
我正在使用R's stats包,并希望在all the rows of a dataframe中遍历column[x],使用函数对列中的each cell中的数据进行操作,并将结果传递给一个新列( new column中的calculated result与column[x]中的数据对齐)。
我有两个问题:
--我无法让它开始工作--在我读过的R articles中,循环似乎是不鼓励的。是否有其他方法可供选择,如果没有,是否有关于如何执行循环的示例?
我在dataframe中有一个名为test的列:
Name Client
A P
B Q
C R
D S
E T
我需要在相同的dataframe中创建一个新的列clienttype,条件是,如果Client =P或= first。如果客户端类型=R或S,客户端类型=秒,依此类推。有人能告诉我们在kdb里怎么做吗?谢谢
我想在dataframe中遍历列,对于每一列,如果NAs的数量大于所有条目的50%,我想从dataframe中删除该列。到目前为止,我有这样的事情,但它不起作用:
for (i in names(df_r)) {
if (sum(is.na(df_r[,i]))/length(df_r) > 0.5) {
df_r <- df_r[, -i]
}
}
我更像个蟒蛇,我正在学习R,所以我可能会在这里混合语法。
我在让Jags中的'rank‘函数工作时遇到问题。下面是改编自Winbugs的代码、模型和数据。不起作用的一点是: myorder[i] <- rank(aux.u[],i) ,这将抛出以下错误: RUNTIME ERROR:
Incorrect number of parameters in function rank 我知道Jags中的函数等级是不同的。所以,当我尝试重新编码的时候,就像这样: myorderx <- rank(aux.u[]);myorder[i]<-myorderx[i]; 我得到了错误: Attempt to red
for i in dataframe_list:
i=eval(i)
for num in range(1,len(dataframe_list)):
for column in [column for column in eval(i).columns if column not in eval(dataframe[num]):
eval(i)= eval(i).withcolumn(column, lit=none)
for column in [column for column in datafram
要将多个变量传递给一个普通的python函数,您只需编写如下代码:
def a_function(date,string,float):
do something....
convert string to int,
date = date + (float * int) days
return date
在使用Pandas DataFrames时,我知道您可以基于一个列的内容创建一个新列,如下所示:
df['new_col']) = df['column_A'].map(a_function)
# This m
我有一个有n列的dataframe,我正在尝试创建一个递归遍历这些列的函数。 例如,假设我有以下数据帧: | left | center | right |
|:---- |:------:| -----:|
| One | Two | Three | 我想运行一个函数,它使用左列,然后是左列和中列,然后是左列、中列和右列。所以基本上,在每一步,我使用前面的列+ 1。在pandas中有一个有效的方法来做到这一点吗?
假设我有一个具有以下结构的dataframe:
dt dtPr id val
99 98 a 10
98 97 a 9
97 96 a 8
99 98 b 20
98 97 b 19
97 96 b 18
根据这两个日期创建另一个显示“先验值”的数据帧列的最有效方法是什么?先验值应该等于给定的val的dtPr = dt。我可以很容易地在SQL中做到这一点,但我不确定在R中最有效的方法是什么。
示例输出:
dt dtPr id val
Problem I目前正在处理大约1800万个点数据集,这些数据集运行在不同的进程中。在配置文件查看器上,我发现我的瓶颈之一是代码的这一部分,因此我想知道是否可以向量化多个if -语句。
码
WA=zeros(size(NB_list_z,1),3);
for i=1:size(NB_list_z,1);
if (NB_list_z(i,2)==0||NB_list_z(i,3)==0);
WA(i,1)=BMLS(NB_list_z(i,1),5);
else
if (BMLS(NB_list_z(i,3),5)>=COG);
我试图在一个包含文本文件的dataframe中循环几个列。
我想检查第7栏到第16栏的每一个条目,看看是否有任何文本文件包含特定的短语。
每次检测到该短语时,我都希望将其出现的次数增加1。
这看起来很简单。我认为我应该遍历列和行,但我似乎无法确切地知道如何做到这一点。
有什么建议吗?预先感谢您的任何见解。
fc_count <- 0
for (col in profiles[7:16]){
for (row in 1:nrow(profiles)){
if(isTRUE(grepl("my name is jeff", row)) == TRUE){