我想在另外两列的基础上将一个新列添加到我的dataframe中。数据如下:
df
job honorary
yes yes
yes no
no yes
yes yes
yes NA
NA no
现在,我想要第三栏,如果职务和荣誉两者都是是的,则为“荣誉”,如果该栏的名誉是肯定的,则为“职务”,如果该栏的职务是肯定的,则为“职务”;如果两者都包含NA或一栏,则为NA或另一栏,则为NA。第三列应该如下所示:
result
both
job
honorary
both
job
NA
我尝试了如果和变异的代码,但是我对R很陌生,我的代码根本不起作用
我有一个像面板一样的数据集,它有多个相同观察的实例。我有一个变量,用于计算每个年特定公司的外观(例如,公司A在XXXX年有10台活动机器),我还想创建一个变量来统计特定用户拥有的机器数量(即所有时间计数)。
下面是我编写的代码行的一个示例:
### Creates a column that counts the number of unique machines by company name all time
df_panel <- df_panel %>% group_by(Company_name, Machine_name) %>% summarise(Machin
我有一个包含几个列的表,我希望通过将'R1、R2和R3‘列组合到一个表中来创建一个列。
DF:
ID R1 T1 R2 T2 R3 T3
rs1 A 1 NA . NA 0
rs21 NA 0 C 1 C 1
rs32 A 1 A 1 A 0
rs25 NA 2 NA 0 A 0
期望产出:
ID R1 T1 R2 T2 R3 T3 New_R
rs1 A 1 NA . NA 0 A
rs21 NA
with open("test.txt", "r") as test:
reader = csv.reader(test, delimiter="\t")
writer = csv.writer(table, delimiter="\t")
for row in reader:
for field in row:
if field not in keywords:
writer.writerow(row)
假设我有以下数据集(数据集有2000多个观察数据)。我想得到的比例(数目)的男性是左手,脉搏大于或等于80,并与那里的右手拍手。
我怎样才能在R中做到这一点?
X Sex WrHnd NWHnd WHnd Fold Pulse Clap Exer
1 1 Female 18.5 18.0 Right R on L 92 Left Some
2 2 Male 19.5 20.5 Left R on L 104 Left None
3 3 Male 18.0 13.3 Right L on R 87 Neit
我有一个包含8列的数据库表。第一列是客户名称,其他列是分数,但它们存储在nvarchar列中(不幸的是)。将小数存储在nvarchar列中的原因是,如果客户没有得分,就会使用逗号(‘,')。这个例子只适用于G列,逗号给我带来了很多麻烦,因为我正在尝试做下面的选择
SELECT
GKOD ,
AVG(CAST(CSI as decimal)),
AVG(CAST(A as decimal)),
AVG(CAST(B as decimal)),
AVG(CAST(C as decimal)),
AVG(CAST(D as decimal)),
AVG(CAST(E as decimal))
我希望用同一行中其他列的串联值更新一列。我正在更新的列是唯一的,这样做的性质,我有时会结束与重复键错误。我希望忽略这些错误,简单地更新其中一条记录,忽略其他记录。
我的查询如下所示:
update [Table] set Coolname = lower(Fname) + lower(Lname)
where Coolname like '%s'
and staticID=1995
and Fname is not null
and Lname is not null
现在,在Fname和Lname在两行中匹配的情况下,我只希望更新第一个记录Coolname。
谢谢。(MS
在R中,我在dataframe中有一列,其中包含城市名称。如下图所示。 enter image description here 这包含一些错误的数据,例如,数据N,Z,X需要替换为“Other”,一些城市代码需要替换为其原始名称,例如 OC, Okl City --> Oklahoma City
LA --> Los Angles
NW --> New York 当我尝试通过在FOR循环中使用IF和ELSE IF语句来执行此操作时。我非常不成功。 如果有人能在这方面帮助我,那将是非常有帮助的。 提前谢谢。
不确定这是否可能,但我试图告诉R,如果B列中有两个不同的可能值用于A列中的唯一值,而其中一个列B值为“未知”,则将“未知”替换为与同一列A值相关联的另一列B值。
例如,在这个简单的数据集中,我希望将2,2中的“未知”替换为“红色”,因为还有另一个组"A“的实例,即颜色"Red”。但是,4,2中的“未知”不会被替换,因为组"C“没有其他颜色值。
group <- c("A","A","B","C","B")
color <- c("Red", "Unknow