当我向word2vec提供文本文档作为输入时。它从课文的词汇表中向少数几个单词分配向量。这一切为什么要发生?如何克服这个问题?
发布于 2016-02-17 14:24:26
我认为你看到很少的向量被创建的原因是你的语料库太小。Word2vec将从词汇表中删除很少出现的单词。这是由t分钟计数命令行开关控制的.原始源代码的默认设置为5。任何在您的语料库中发生次数少于此次数的单词都将被删除。
https://stackoverflow.com/questions/34923360
相似问题