示例:
我有一句话“Face book is a social networking company”,我想把“Face”和“book”连接成“Facebook”来清理。我想为许多句子检查和执行这一点。对如何做到这一点有什么建议吗?
我想到了这样的事情:首先标记句子,然后循环每个单词,检查'face‘后面的标记(单词)是否是'book’,然后删除这两个元素和所有的'Facebook‘。
发布于 2018-06-16 06:15:23
一个简单的基于正则表达式的方法还不够吗?
>>> import re
>>> s='Face book is a social networking company'
>>> re.sub(r'[Ff]ace [Bb]ook', 'Facebook', s)
'Facebook is a social networking company'
发布于 2018-06-16 06:20:00
在Python中,这可能看起来像这样:(请记住,这只是一个粗略的想法,并不是在所有情况下都是完美的)
string = “I use Face book”
tokenized = string.split(“ “)
for i in range(0,len(tokenized)-1):
if tokenized[i].lower()==“face” and tokenized[i+1].lower()==“book”:
del tokenized[i+1]
tokenized[i] = “Facebook”
if i > len(tokenized):
break
https://stackoverflow.com/questions/50883259
复制相似问题