基于 BiLSTM 模型训练而成
包含分词,词性标注,实体识别, 都有比较高的准确率
用户自定义词典
在中文信息处理中,分词(word segmentation)是一项基本技术,因为中文的词汇是彼此相连的...首先顾名思义,双向 LSTM 结合了从序列起点开始移动的 LSTM 和另一个从序列末端开始移动的 LSTM。其中正向和逆向的循环网络都由一个个 LSTM 单元组成。...使用这种 BiLSTM 的好处是模型的观察范围比较广,因为当我们只采用单向循环网络时,在时间步 t+1 只能观察到 x_t 以及之前的输入数据,而不能观察到 x_t+2 及之后的情况。...而当我们使用双向循环网络,模型在每一个时间步都会观察全部的输入序列,从而决定最后的输出。..., '在', '学术', '研究', '领域', ',', '指', '能够', '感知', '周围', '环境', '并', '采取', '行动', '以', '实现', '最', '优', '可能'