首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Gensim短语找不到一些二元语法

Gensim短语找不到一些二元语法
EN

Stack Overflow用户
提问于 2019-04-29 00:04:50
回答 1查看 1.8K关注 0票数 0

我想得到符号(单词的字母)的二元模型。例如,对于单词"done“和"dog”,我希望能够找到二元语法"do“。

我试着用gensim.Phrases写,但对我不起作用。

下面是我的代码:

代码语言:javascript
运行
复制
from gensim.models import Phrases

documents = ["God", "Good","happy","hangry","pypi"]
documents_proc = [list(doc) for doc in documents]

bigram = Phrases(documents_proc, min_count=1)
trigram = Phrases(bigram[documents_proc], min_count=1)

for sent in documents_proc:
    print(sent, bigram[sent])
    bigrams_ = [b for b in bigram[sent] if b.count('_') == 1]
    trigrams_ = [t for t in trigram[bigram[sent]] if t.count('_') == 2]
    print(bigrams_)
    print(trigrams_)
    print()

我期望得到['Go', 'od', 'ha', 'py']的输出,但是输出中没有任何内容。我做错了什么?

谢谢。

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55892073

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档