我有以下数据:
Jack Joe Mary
1 I O O
2 I O I
3 I I I
4 O I I
5 O I O
6 I O O
7 I O I
8 I O I
9 O I I
10 O I O
....
我的列有“I I I”和“of”的模式,分布在各处。
我要计算每一列中出现的'I I‘和'O O’的次
我有一个数据框架,每组1200例,一式两份,一列一份,共计2400个。例如,A1.1234567_10,A1.1234567_20,有多个列,我想比较一下,这样每个重复对在每一列中都有相同的或有差异的结果。列包含因素,我如何使它,以便它可以给我的因素一个逻辑。我希望通过与_10和_20匹配的ID (即A1.1234567)来选择每一种情况:
示例(一行数据帧)
A1.1234567_10 NORMAL NORMAL NORMAL NORMAL NORMAL NORMAL NORMAL NORMAL
A1.1234567_20 NORMAL NORMAL NORMAL NORMAL NORMA
我有一个数据框,有两列
'V1' 'V2'
joe hi, my names is *joe*
anne i was talking to *jake* the other day...
steve *anne* should have the answer
steve *joe* and I will talk later
我想获取第一列中的姓名列表,并使用它在第二列中搜索它们。
(星号只是用来表示名称在长字符串中。)
我真正想说的是,对于第一列中的每一项,如果您也可以在第二列中找到它,那么打印该行。
我试过了
for (
我是一个使用jupyter笔记本的新程序员。我有一个包含23列的数据帧,这些列具有不同数量的值(最多23列,至少2列)。我创建了一个函数来规范化下面一列的内容。 def normalize(column):
y = DFref[column].values[()]
y = x.astype(int)
KGF= list()
for element in y:
element_norm = element / x.sum()
KGF.append(element_norm)
return KGF 我现在正在尝试创建一个遍
在我的公司里,我们为我们出版的每一份报告和文件订序号。这些是通过在一列(A)中输入您的姓名,然后在另一列(B,格式化的dd/mm/yyyy)中添加它的日期来预订的。也就是说,如下所示:
(A) (B) Initials Date A. Mustermann 16.03.2016 B. Mustermann 17.03.2016
根据所使用的类型,有各种各样的数字,并且每月需要对谁取出哪种类型的序列号以及其中的多少进行完整的细分。这个我已经嫁接到一张桌子上,在另一张纸上,并且只需要一种读取纸张和打印相应的数字的方法。就像这样;
(A)
我有一个包含5列的文本文件,每列中有9个整数。看起来像这样:1 2 3 4 5 6 7 8 9我使用File将纺织品导入到我的java程序中
fileName = new File("Example1.txt");
Scanner inFile = new Scanner(fileName);
我想计算每一列的平均值,我该怎么做呢?我在想
int index;
index = 0;
if (inFile.hasNext()) {
do {
Ex
我有一个由1-9整数填充的30 *9数据帧。每个整数都可以在列中多次使用,或者根本没有。
我基本上想要计算一个数字出现的次数,以便为原始数据帧的每个元素生成一个9行(计数的)列,最后得到一个9*9的计数数据帧。我还希望在特定列中不显示数字的位置为0。
到目前为止,我尝试了多种使用for循环、tapply、functions等的方法,但我似乎无法得到一个可以直接存储到一个循环中的新数据帧中的结果。
for (i in seq_along(columnHeaderQuosureList)) {
original_data_frame %>%
grou
我有两个来自excels的数据帧,如下所示。第一个数据帧有一个多索引头。 我试图根据货币(即KRW,THB,USD,INR)查找数据帧中的每一列与相应数据帧之间的相关性。目前,我正在执行一个循环来遍历每一列,在找到相关性之前按索引和相应的头进行匹配。 for stock_name in index_data.columns.get_level_values(0):
stock_prices = index_data.xs(stock_name, level=0, axis=1)
stock_prices = stock_prices.dropna()
fx
我有一个通过使用full_join获得的数据帧: col1 col2
11 11
12 NA
14 14
NA 17
NA 18
NA NA
NA NA 我想计算每一列中与另一列不匹配的值的比例。例如,这里对于col1,它将是1/3。因为它只是值12,这不匹配并且不是NA。对于col2,它将是2/4,因为有17和18个与col1中的值最匹配,而不是NA。如何做到这一点?
我需要计数一个数字(而不是0)出现在不同长度的数字(正整数)中的次数。最明显的解决方案是将数字转换为字符串,将数字转换为字符,并对字符串进行迭代以计算字符在字符串中出现的次数。
static int CountDigitInString(string searchString, char digit)
{
int sum = 0;
for (int i = 0; i < searchString.Length; i++)
{
if (searchString[i] == digit)
sum++;
}
r
如何在给定多列数据帧的R中优雅地生成秩相关矩阵?我找不到内置的函数,所以我试了一下
> test=data.frame(x=c(1,2,3,4,5), y=c(5,4,3,2,1))
> cor(rank(test))
(为了简单起见,只有2列,实际数据只有5列)
> Error in cor(rank(test)) : supply both 'x' and 'y' or a matrix-like 'x'
我想这是因为rank只带了一个向量。所以我试着
> cor(lapply(test,rank))
若要对数据帧中的
我想根据某一列的内容重新排序数据帧中的行。但是,当我这样做时,该列中的值将被重新排序,但是相应的值保持在相同的位置。举一个例子:
df<- InsectSprays
df2 <- aggregate(df$count,
by = list(df$spray),
FUN = mean)
Group.1 x
A 14.500000
B 15.333333
C 2.083333
D 4.916667
E 3.500000
F
我在dplyr-语法上有点困难。我有一个包含不同变量和一个分组变量的数据框。现在,我想使用R中的dplyr计算每组中每列的平均值。
df <- data.frame(
a = sample(1:5, n, replace = TRUE),
b = sample(1:5, n, replace = TRUE),
c = sample(1:5, n, replace = TRUE),
d = sample(1:5, n, replace = TRUE),
grp = sample(1:3, n, replace = TRUE)
)
df %&g