请参考下面的示例。
字符串数据(Tweet)列如下所示:
A
1 An example string with @username in it
2 RT @AwesomeUser says @username is awesome
带有“子字符串”(Twitter屏幕名称)的列如下所示:
B
1 username
2 AwesomeUser
我想使用一个公式来计算来自B1、B2等的子字符串在A列的字符串中出现的次数。例如:搜索B1的公式将返回"2“,搜索B2将返回"1”。
我不能这样做:
=COUNTIF(A:A, "username")
因为COUNTIF只查找字符串,而不查找子字符串。此公式将始终返回"0“。
这是一个我认为可以做到的formula:
=SUMPRODUCT((LEN(A:A)-(LEN(SUBSTITUTE(A:A,"username",""))))/LEN("username"))
不幸的是,我在B列中有16,000个条目,在A列中有数万个条目,所以即使在高性能的PC上也不能计算字符(而且,函数返回的结果也是可疑的)。
我考虑过使用:
=COUNTIF(A:A, "*username*")
我的问题是:有没有人知道如何使用公式来解决这个问题?如果使用COUNTIF,如何在语句的条件部分中获得单元格引用(或使用函数替换COUNTIF语句的条件部分中引用的单元格中的字符串)?
https://stackoverflow.com/questions/12948338
复制相似问题