首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >返回n个最佳标签序列的NLTK (或其他)词性标记器

返回n个最佳标签序列的NLTK (或其他)词性标记器
EN

Stack Overflow用户
提问于 2017-08-28 18:00:24
回答 1查看 159关注 0票数 1

我需要一个词性标记器,它不仅返回给定句子的最佳标记序列,而且还返回n个最佳标记序列。因此,对于‘时间如箭’,它可以返回NN VBZ IN DT NN和NN NNS VBP DT NN,例如,根据它们的概率排序。我需要使用我自己的标签集和句子示例来训练标记器,我想要一个标记器,允许句子的不同功能被设计。如果其中一个nltk标记器具有此功能,那就太好了,但我可以与Python代码交互的任何标记器都可以。提前感谢您的任何建议。

EN

回答 1

Stack Overflow用户

发布于 2018-05-31 17:40:55

我建议你去看看spaCy。据我所知,它在默认情况下不允许返回top-n标签,但它支持creating custom pipeline components

在Github上也有一个issue,其中确切地讨论了这一点,并且有一些关于如何相对快速地实现它的建议。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45916393

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档