我最近开始和UIMA RUTA合作。我有几个问题。1:我们如何使用RUTA中现有的taggers(DBpedia tagger,MunPx Tagger)?2:我们如何使用注释写入器来格式化输出? 3: RUTA是否将除.txt之外的其他文件格式作为输入?
发布于 2018-11-30 14:39:15
1:我们如何使用RUTA中现有的taggers(DBpedia tagger,MunPx Tagger)?
UIMA Ruta不依赖于特定类型的系统。如果您有一个具有不同taggers的管道,并且这些tagger创建某种类型系统的注释,那么您可以在Ruta脚本中使用这些注释编写规则,并在该管道的分析引擎中使用这些规则。根据配置,您可能需要在Ruta脚本中导入类型系统。
2:我们如何使用注释写入器格式化输出?
如果您引用ruta中的AnnoationWriter,那么答案是:不能格式化输出。你需要使用不同的分析引擎。
3: RUTA是否采用除.txt之外的其他文件格式作为输入?
通常,Ruta处理给定的CAS对象,该对象由任意读取器填充任何文件格式。在中,启动配置支持".txt“、".csv”、"html“、"xhtml”作为纯文本文件格式,以及使用CasIOUtils的SerialFormat检测来支持".xmi“、".xcas”、".bcas“、".scas”。
免责声明:我是UIMA Ruta的开发人员
https://stackoverflow.com/questions/53362502
复制相似问题