我正在尝试使用C++正则表达式从段落中获得正确的句子。
"You are welcome, most noble Sorceress, to the land of the Munchkins."这就是我正在处理的段落。我想让句子只以大写字母开头,而不是用引号括起来。但我得到的是'Munchkins." Dorothy listened to this speech "carefully" w
C++ good as well.这样的句子标记化为Python is good.和C++ good as well.我的算法是这样做的,但是当它是Python is good.C++ good as well. (点后没有空格)时,它就不起作用了。顺便说一句,我需要考虑U.S.A.是一句话。所以我要考虑的是,只有当它是little character.BIG CHARACER的时候才会进行标记化。re.sub(r