前言:由于主要是涉及一些NLP的东西,所以将本文放到NLP里面。 前期学习的资料:
安装pyltp 1 用pip 报错的话就把版本修改一下 2 下载版本对应的模型http://ltp.ai/download.html
bootstrapping算法实现了半监督远程关系抽取, 算法通过种子模板抽取特征词,利用最近邻原则自动生成更多的抽取模板 但是在扩展的过程 中会加入很多不正确的抽取模板并且使得错误不 断积累影响最终的效果
过程: 先分词 词性标注 命名实体识别(只能识别人名 地名 机构名)若其他实体需要标记 依存分析 基本如下: