我的工作是挖掘调查数据。我能够标记某些关键字的行: survey['Rude'] = survey['Comment Text'].str.contains('rude', na=False, regex=True).astype(int) 现在,我想标记所有包含名称的行。我有另一个数据帧,其中包含常见的美国名称。下面是我认为可行的方法,但是它没有标记任何行,并且我已经验证了名称确实存在于“评论文本”中。 for row in survey:
for word in survey['Comment Text']:
这是我拥有的数据帧的一个片段:
Title | Age
------+--------
Mr. | 30
Mr. | NaN
Mr. | 32
Mrs. | 28
Mrs. | 16
Mr. | 34
Mrs. | NaN
编辑:我添加了最后一行,以澄清问题
我想推算NaNs (第二行和最后一行),对于第二行,它应该使用另一个“先生”的平均值。在数据帧中,因此在本例中,应该是32,在最后一行中它应该使用另一个“夫人”的平均值,所以应该是22
计算平均值和计算平均值一样简单
value = df.loc[df["Title"] == "Mr
我有一个200k行的数据帧,其中有一个名为"departament_name“的字符列,该列中的一些值包含一个特定的字符:"?”。例如:"GENERAL SAN MART?N“、”UNI?N“等。我想使用另一个750k行的数据帧替换这些值,该数据帧包含一个也名为"departament_name”的列,但此列中的值是正确的。按照这个例子,它将是:"GENERAL SAN MARTIN","UNION",等等。
我是否可以使用模式识别自动完成此操作,而无需创建字典(此问题有几个值)。我的目标是拥有一个统一的数据集,其中包含两个数据帧
我是R的新手,但是我想用它来做一些收集数据的统计工具。我正在尝试从仪器输出中导入原始数据,但要做到这一点,我需要删除机器显示中留下的无用注释,然后将多个样本分离到各自的数据帧中。数据如下所示:
////this is some preamble
////for sample 1 that would graph
////data on the machines display
1 10
2 20
3 30
///This is the preamble
////for the second sample
1 11
2 19
3 32
4 41
5 50
////this is clos
我是一个R用户,我有一个纯文本文件,如下所示:
t # 0 * 3
v 0 4
v 1 7
e 0 1 1
x 0 1 2
t # 1 * 2
v 0 4
v 1 7
v 2 10
e 0 1 1
e 1 2 1
x 0 1
t # 2 * 2
v 0 7
v 1 10
e 0 1 1
x 0 2
我需要将它转换成三个数据帧,如下所示:
# First data frame
object id number
0 0 4
0 1 7
1 0 4
1 1 7
1 2 10
2 0 7
2 1 10
# Second data frame
object from to numb
我有一个数据帧,它有100多列和10000行.如果该列中的所有行都相同,则手动检查每列中的数据,然后删除它将变得更加困难。
因此,我正在寻找一个函数,它将以我的数据帧作为输入,并输出另一个数据帧,其中只有不相同的列。
输入数据帧将类似于:
data<- read.table(text = "
A B C D
1 1 3 4
1 2 2 4", header = TRUE)
我希望输出数据帧是:
B C
1 3
2 2
谢谢。
我知道在R中合并数据帧的问题很常见,但经过艰苦的搜索,我还没有找到解决问题的方法。 我在R中有两个数据帧:一个包含关于人口的信息(这里是组织、n=~4200),包括他们的地区、州、县、项目名称等;另一个只包含509个独特的县-州组合的县和州信息。 我需要将较大的数据帧与较小的数据帧进行匹配,以便最终得到一个合并的数据帧,其中N行等于较小的数据帧。 例如,大型数据帧(n=~4200行)如下所示: County State Court Program Court.Type ... ... ...
String1 CT Court1
我有一个合并到DT表中的数据帧。但是句子很长。所以我们能不能打破句子,把第二行 这是包含2行的数据帧 df
COlA
Sentence is too long to be written here
Sentence is too long to be written here 预期输出 df
COlA
Sentence is too long
-to be written here
Sentence is too long
-to be written here