我很好奇什么是最有效的算法(或常用的)来计算字符串在文本块中出现的次数。
从我的来看,Boyer-Moore字符串搜索算法是字符串搜索的标准算法,但我不确定以一种有效的方式计算出现次数是否与搜索字符串相同。
在Python中,这是我想要的:
text_chunck = "one two three four one five six one"
occurance_count(text_chunck, "one") # gives 3.
编辑:似乎python str.count就是这样一种方法;但是,我找不到它使用的是什么算法。
请注意:这个问题的一个更精练的版本,有一个适当的答案可以找到。
我想使用Selenium Python绑定来查找网页上带有给定文本的元素。例如,假设我有以下HTML:
<html>
<head>...</head>
<body>
<someElement>This can be found</someElement>
<someOtherElement>This can <em>not</em> be found</someOther
我有一个用不同缩进格式化的文件,它有几百行长,我尝试过各种方法将它作为文件和变量加载到python中,但没有成功。加载文件的有效方法是什么。我的最终目标是加载文件,并在其中搜索特定的文本行。
with open('''C:\Users\Samuel\Desktop\raw.txt''') as f:
for line in f:
if line == 'media_url':
print line
else:
print "void"
Erro
我有网页的消息来源。它只是大量的随机数字、字母和函数名,在python3中保存为字符串。我想在这个字符串的源代码中找到显示\"followerCount\":的文本,但我也想找到它后面的一些文本(n个字符)。希望能找到我要找的那条短信。我是否可以搜索字符串的一个特定部分,并在中搜索 n 字符,以及在python3中的?
我想逐行读取文本文件。我找到了如何通过搜索逐行读取,但没有找到如何调用文本文件中的特定行。基本上,我想用特定的行(比如第一行、第二行、第三行等)来做一些事情:
if particular_line is something:
....
还有,我怎么能做这样的事:
if return_from_another_function in file:
....
基本上,我想要一个例子,如果可能的话,我可以怎样做。
我需要将记录存储在键值存储中,我已经考虑过XML、JSON或YAML,并几乎决定使用YAML。
然而,我想知道当搜索数百万条记录时,由于需要大量的文本处理,这将如何执行。对不同的列使用单独的键还是使用YAML更好?例如,在YAML中我可以这样做:
- record
id: 34
type: person
name: John
age: 50
在键/值存储中,我可以使用:
person_34_name: john
person_34_age: 50