从文本文件加载单词矢量- GENSIM PYTHON

、、

我已经从网上下载了预先训练过的手套矢量文件。它是一个.txt文件。我无法加载和访问它。使用gensim加载和访问单词向量二进制文件很容易，但当它是文本文件格式时，我不知道该如何做。提前感谢

浏览 12提问于2016-06-13得票数 49

回答已采纳

1回答

、、

你好，我有一个这种形式的txt文件，第一列是单词，第二列是它的向量。 word 0.256 0.2659 0.326595 word1 0.528 0.6589 0.62326 ...我试图将其加载为keyedvector，因为我想计算单词之间的余弦相似度，并找到最相似的单词，但我总是得到一个错误。

浏览 3提问于2021-05-01得票数 0

1回答

使用GloVe获取最相似的单词

、、

在运行演示之后，我得到了一些文件，如vocab、vectors等，但是它们没有任何文档或任何东西来描述我们需要使用哪些文件，以及如何使用这些文件来查找最相似的单词。因此，请帮助我找到GloVe中给出的最相似的单词(使用余弦相似度)？(例如，类似于Gensim word2vec中的word2vec) 请帮帮我!

浏览 4提问于2017-11-18得票数 1

回答已采纳

1回答

基于gensim的快速文本库中预训练词嵌入的有效存储

、、、、

我想用gensim从快速文本库加载经过预先训练的多语种单词嵌入；在这里，链接到嵌入： cc.de.300.vec (4.4 GB) cc.de.300.bin (7 GB)gensim.models.fasttext.load_facebook_model(path, encoding='utf-8') - _LoadIts

浏览 7提问于2019-12-11得票数 3

回答已采纳

1回答

文件GoogleNews-vectors-negative300.bin包含3亿字向量.我认为(不确定)在写入以下行时加载了该文件：我想在一个名为words的列表中下载外部给出的单词的向量。是因为在搜索words中的单词之前，它正在加载整个二进制文件吗？如果是的话，我该如何解决这个问题呢？当我收到以下警告时，我会想到这一点，这就是为什么我使用warning包来抑制它的原因： c:\Python<

浏览 6提问于2017-06-22得票数 2

回答已采纳

2回答

word2vec模型由字符而不是单词组成

、

我试图通过Gensim在波斯语上建立一个word2vec模型，该语言以“空格”作为字符分隔符，我使用python3.5。我遇到的问题是，我给出了一个文本文件作为输入，它返回一个模型，该模型只由每个字符单独组成，而不是单词。我还把输入作为建议的单词清单：将多个空白空间折叠为单个空白空间删除小于3个字符的单词--长--删除停止词我把文本给了word

浏览 0提问于2017-07-18得票数 3

回答已采纳

1回答

有没有一种方法可以在训练doc2vec模型之前加载预先训练好的词向量？

、

我已经使用我拥有的语料库(10k个句子)训练了一个gensim doc2vec模型。这个模型可以在一定程度上告诉我一个新句子是否与语料库中的一些句子相似。但是，有一个问题:新句子中可能存在语料库中不存在的单词，这意味着它们没有单词嵌入。如果发生这种情况，预测结果将不会很好。据我所知，经过训练的doc2vec模型确实有一个文档向量矩阵和一个单词向量矩阵。因此，我的想法是加载一组预先训练的词向量，其中包含大量的单词，然后训练模型以获得文档向量。这有意义吗？是否可以使用gensim</

浏览 1提问于2019-07-12得票数 0

1回答

如何在python中使用gensim获取相关的匹配词？

、、

在通过处理语料库(文本文件A)创建gensim模型之后，我正在尝试查找相关的单词。接下来，我想传递我自己的单词列表(存储的文本文件B)，以从gensim模型中获取与文本文件B中的单词最相似的单词。model = gensim.models.Word2Vec(documents, window=5, min_count=1, workers=10) model.train(documents, tot

浏览 20提问于2021-04-03得票数 2

4回答

、、、

我正在尝试将这些文件导入gensim，这样我就可以像使用word2vec矢量一样使用它们。我尝试过同时使用二进制格式和文本文件格式进行加载，但最终只得到了一个酸洗错误：我尝试忽略unicode错误，但这不起作用：import gensim from gensim.models impor

浏览 3提问于2019-10-29得票数 0

1回答

将经过DL4J训练的Word2Vec模型加载到gensim中

、、、

我可以使用以下命令在DL4j中成功加载和使用模型现在，我正在尝试使用gensim在python中读取该模型但我得到以下错误：如果我解压缩DL4J生成的模型，我会得到以下文件：有没有办法在python</e

浏览 2提问于2018-10-11得票数 0

1回答

导出R text2vec矢量以在Python中的Gensim中使用

、、、

有没有什么简单的方法可以将它们导出到Python中使用，在Python中我有脚本可以与Gensim创建的单词矢量进行比较/比较？

浏览 13提问于2020-08-18得票数 1

3回答

如何使用深入集的字嵌入预训练模型使用gensim？

、、、、

我原以为只有一个文件，但是有"“和"”文本文件。如何使用这些文件来使用gensim (或任何其他工具)加载经过预先培训的模型？testtt.py", line 11, in <module> File "/home/bugra/word2vec_imp/project_envv/lib/python3.7=datatype) File "/home&

浏览 3提问于2020-12-03得票数 2

3回答

Gensim: doc2vec是一个模型还是一个操作？与R执行的差异

、、、、

我们的途径之一是用Python重新创建代码和模型。离线然后，在这些较小的文本身体上对各种模型进行培训。--我为Gensim</

浏览 45提问于2021-06-17得票数 1

回答已采纳

1回答

从gensim模型中提取令牌频率

、

像和这样的问题给出了从gensim word2vec模型中检索词汇频率的答案。出于某种原因，他们实际上只是给出了一个从n(vocab的大小)到0的反推荐计数器，以及最常见的有序标记。给出一个词，我如何从模型中提取术语频率？

浏览 1提问于2020-10-01得票数 0

回答已采纳

1回答

在word2vec gensim模型中添加词嵌入

、、

我正在寻找一种方法，在word2vec gensim模型中添加预先训练过的单词向量。为了避免加载整个词汇表的需要，我只想加载在语料库中找到的预先训练过的模型单词的子集。但是，如果新文档中的单词不在语料库中，而是存在于原始模型词汇表中，则将它们添加到模型中，以便在计算中考虑它们。我想要的是保存RAM，所以有可能对我有帮助：是否有从矩阵或其他对象加载到gensim

浏览 3提问于2017-04-24得票数 6

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

python中的预训练手套向量