我目前正在使用。
我的字串/词句中既有英文也有中文。
以下是问题所在:
如果句子在英语中是ALL,那么它在LUIS中工作得很好。原因很可能是因为一个句子是由不同的词组成的,这些词被一个“空格”分隔开来。
然而,在中文(繁体和简体)中,句子是由拼凑在一起,很难分开的词组成的。
例如,我可以用英语写:
I love you so much:这里有5个单词。在LUIS中,我可以选择I love you并将其转换为一个实体。稍后,当更多像I love you这样的词出现在LUIS中时,它可以很容易地识别出相关的意图。
然而,如果我用中文写:
我很喜歡你:它的意思和上面的英语一样。根据路易斯,它将被计算
我正在生成一个区域设置列表,并使用java.util.Locale打印出它们的本地显示语言(例如,将ja_JP打印为日本語)。我注意到zh_CN (简体中文)和zh_TW (繁体中文)都本地化为中文,而不是简体中文和繁体中文。有没有办法让这些地区包含简体和繁体的前缀字符,而不硬编码zh_CN应该是简体中文,zh_TW应该是繁体中文?我知道我可以打印出语言+国家(即中文(中国),但这并不完全相同。
下面是一个java代码片段,演示了它们是一样的:
import java.util.Locale;
public final class test {
public static void ma
我有以下表达式:[^(\r\n)]*来识别任何不包含\r\n的文本。但是,当文本包含(或)时,则无法识别。
示例:
"I have following expression to recognize any text."将被确认为OK。
"I have following expression (A) to recognize any text."将不被识别。
因此,我想要全文:"I have following expression (A) to recognize any text."