首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >NLP使用POS标签创建模型

NLP使用POS标签创建模型
EN

Stack Overflow用户
提问于 2014-06-11 02:12:13
回答 1查看 94关注 0票数 1

我正在尝试创建一个基于文本挖掘的知识库。我使用Genia语料库根据单词的词性对单词进行标记。给定文本中的两个术语,我如何创建一个模型来找出它们之间的关系?

例如文本:

HIF1A基因参与了缺氧的调节。缺氧还上调BRCA1基因的表达,这主要与乳腺癌有关。

我把POS标出来了。

代码语言:javascript
运行
复制
Word     Base Form  Part-Of-Speech   
HIF1A    HIF1A          NN  
gene     gene           NN  
is           be         VBZ 
involved     involve    VBN 
in           in         IN  
Hypoxic  Hypoxic    JJ  
regulation   regulation NN  
.            .          .   
Hypoxia  Hypoxia        NN  
also     also           RB  
regulates    regulate   VBZ 
BRCA1    BRCA1          NN  
gene     gene           NN  
which    which          WDT 
is           be         VBZ 
mainly   mainly         RB  
associated   associate  VBN 
in           in         IN  
breast   breast         NN  
cancer   cancer         NN

我正在编写一个web界面,当查询BRCA1和缺氧时,应该会告诉您它们之间存在正向调节。当查询HIF1A和缺氧时,应该根据这些句子告诉我们有一个积极的调节。

现在我已经标记了POS,我不知道如何继续创建一个模型来识别它们之间的关系。这只是一个例子。我想为一般的生物医学术语和文本做这件事。

谁有什么建议?

EN

回答 1

Stack Overflow用户

发布于 2014-06-11 04:23:48

仅依靠POS标记器的输出,您必须定义本地语法规则(模式)。

就我个人而言,我建议您使用(语法)解析器来获得像regulate(Hypoxia,BRCA1)这样的参数结构……

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24148089

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档