我计划开发一个用于学术目的的原型。我有命名的id的列表和相应的医学术语。有些医生把医学术语写得很短,所以这些词自然没有标准的名称。我的工作是从那些免费文本中预测和建议接近标准的id医学术语。我现在正在试验门软件的安妮地名录。
我需要一些其他建议。
我是nlp和机器学习方面的新手。
发布于 2018-01-07 17:21:27
在Snomed社区中,有一种方法可以创建所有可能的三、四、五等字母组合的索引,这样您就可以快速找到合适的索引。例如:“紧急阑尾切除术”会导致一个索引,包括eme,mer,erg,rge,gen,enc,ncy,cy,y,ap,ppe等。因此,当有人开始打字时,无论是从开始还是在中间的某个地方,在三个字符之后,你都可以给出一个术语列表。但该指数将是巨大的,并将花费时间来创建。
https://stackoverflow.com/questions/47844059
复制相似问题