我的案文中有以下几行:
耳聋(线粒体)修饰物2基因的突变
在我的RegexNER映射文件中,我尝试过将耳聋(线粒体)修饰符2标记为基因,但它们都失败了
耳聋(线粒体)修饰基因2 耳聋(线粒体)修饰基因2
问题似乎是转义括号字符,因为当我从文本和映射文件中删除括号时,它是匹配的。在RegexNER映射文件中转义字符的正确方法是什么?
发布于 2017-04-16 03:34:57
标记器将括号转换为:
-LRB-
和-RRB-
所以你想要:-LRB- mitochondrial -RRB-
匹配(mitochondrial)
还请注意,令牌程序为每个括号创建一个令牌。
https://stackoverflow.com/questions/43429229
复制相似问题