使用Java拆分日语文本的最佳方法是什么?例如,对于以下文本:
こんにちは。私の名前はオバマです。私はアメリカに行く。
我需要以下输出:
こんにちは
私の名前はオバマです
私はアメリカに行く
可以使用黑魔机吗?
发布于 2018-09-04 08:47:19
您可以使用java.text.BreakIterator。
String TEXT = "こんにちは。私の名前はオバマです。私はアメリカに行く。";
BreakIterator boundary = BreakIterator.getSentenceInstance(Locale.JAPAN);
boundary.setText(TEXT);
int start = boundary.first();
for (int end = boundary.next();
end != BreakIterator.DONE;
start = end, end = boundary.next()) {
System.out.println(TEXT.substring(start, end));
}
此程序的输出为:
こんにちは。
私の名前はオバマです。
私はアメリカに行く。
您不能使用Kuromoji查找日语句子边界。它可以把一个句子分成几个词。
https://stackoverflow.com/questions/52145954
复制相似问题