我正在尝试修复一些排版,其中一个常见的例子是缺少一个介于句子之间的空格:"This is a sentence.Here is another sentence."=[A-Z]|\()/g;这包括压缩在一起的句子,以及另一个涉及括号的错误,这对这个问题并不重要。问题是,出现了一些缩略语,它们也被匹配并(错误地)替换。将“美国是一个国家”改为“美国是一个国
我正在捕获自然语言用户输入,我需要检查它与预定义的“正确”版本。这是微不足道的事情,但我不知道如何处理英语中缩略语的变体。假设我期待的句子I'm positive you don't know what you're doing.匹配需要准确,但我不想把用户锁在一个变化,因为这会很快令人沮丧。那么,我是否应该手动输入该句子的每一个可能的变体作为有效的匹配?就像这样:
"I