基于这个问题,我需要以XMI格式导出,并使用DKPro核心将其转换为Brat格式:
https://github.com/webanno/webanno/issues/328
我试过这段代码,但没有成功。
public void convert() throws Exception {
SimplePipeline.runPipeline(CollectionReaderFactory
.createReaderDescription(XmiReader.class, XmiReader.PARAM_SOURCE_LOCATION, "/tmp", XmiReader.PARAM_PATTERNS,
XmiReader.INCLUDE_PREFIX + "*.xmi"), AnalysisEngineFactory
.createEngineDescription(BratWriter.class, BratWriter.PARAM_TARGET_LOCATION, "/tmp"));
}发布于 2017-09-22 07:38:38
brat格式的方言在DKPro核心BratWriter生成的和OpenNLP所期望的之间可能有所不同-- brat文件格式非常灵活。
如果您正在使用WebAnno中内置的命名实体层,那么我将提出另一种路由:
OpenNlpNamedEntityRecognizerTrainer组件这应避免需要额外的转换步骤。
披露:我是一个WebAnno和DKPro核心开发人员。
不起作用的建议:
CoNLL 2002在WebAnno中的导出Conll02NameSampleStream只支持某些语言和命名实体类型.叹息https://stackoverflow.com/questions/46352847
复制相似问题