我有一个任务是将像Python is good. C++ good as well.这样的句子标记化为Python is good.和C++ good as well.我的算法是这样做的,但是当它是Python is good.C++ good as well. (点后没有空格)时,它就不起作用了。顺便说一句,我需要考虑U.S.A.是一句话。所以我要考虑的是,只有当它是little character.BIG CHARACER的时候才
我正在尝试用python解析句子--对于我得到的任何句子,我应该只接受出现在单词'say‘或'ask’之后的单词(如果单词没有出现,我应该使用整个句子)我只是使用正则表达式:
sen = re.search问题是,如果我得到一个句子,像逗号,冒号(,:)后面的单词‘说’,它也采取了标点符号。有人建议我使用nltk标记化来定义它,但我是python的新手,不知道如