我想使用python计算一个文件中所有二元语法(相邻单词对)出现的次数。在这里,我正在处理非常大的文件,所以我正在寻找一种有效的方法。我尝试在文件内容上使用count方法和正则表达式"\w+\s\w+“,但它没有被证明是有效的。例如,假设我想要计算文件a.txt中的二元模型的数量,该文件包含以下内容:
"the quick person did not realize his speed and the quick person它还使用正则表达式方法。除了计数器对象或正则表达式之外的任
我有一个字符串,需要使用正则表达式。matche's roll over matche's or the expression for details PCRE flavors of regex are supported here"hello COMMAthe matche's我已经写了这个正则表达式来做这件事,但是它没有抓住重叠的结果。