版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/chengyuqiang/article/details/102792839
废话不多说,直接上代码。
<dependency>
<groupId>com.janeluo</groupId>
<artifactId>ikanalyzer</artifactId>
<version>2012_u6</version>
</dependency>
IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">local.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典 -->
<entry key="ext_stopwords">stop.dic;</entry>
</properties>
local.dic
中国太平
中国太平洋
stop.dic
的
好
了
package com.example.ik;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;
import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.List;
public class IKAnalyzerUtil {
public static List<String> cut(String msg) throws IOException {
StringReader sr=new StringReader(msg);
IKSegmenter ik=new IKSegmenter(sr, true);
Lexeme lex=null;
List<String> list=new ArrayList<>();
while((lex=ik.next())!=null){
list.add(lex.getLexemeText());
}
return list;
}
public static void main(String[] args) throws IOException {
String text="中国太平成立九十周年了!";
List<String> list=IKAnalyzerUtil.cut(text);
System.out.println(list);
}
}
执行结果
加载扩展词典:local.dic
加载扩展停止词典:stop.dic
[中国太平, 成立, 九十周年]