如何使用预先训练好的word2vec模型(谷歌)将单词列表转换为向量列表？

文章/答案/技术大牛

发布

1回答

python-3.x、gensim、word2vec

我正在努力学习word2vec。我正在使用下面的代码在Python3中加载谷歌预先训练好的word2vec模型，但我不确定如何将诸如“i”、"ate“、"apple”之类的列表转换为向量列表(即如何从该模型中获取向量？)import nltk import

浏览 17提问于2019-07-29得票数 0

回答已采纳

1回答

来自网络研讨会的培训word2vec字幕

nlp、word2vec、doc2vec

我正在构建一个模型，根据上下文从时间帧开始播放视频。比如播放电影的高潮，从59分钟开始播放。我正在使用视频的字幕，并匹配特定序列中的文本，并确定时间帧。我正在尝试寻找具有真实表达式的精确单词，$$not so effective$$。我偶然发现了word2vec，它可以找到余弦相似的相似单词。

浏览 2提问于2019-05-10得票数 0

1回答

如何在GoogleNews- vectors negative3000.bin预训练模型中添加缺失的单词向量？

python、nlp、gensim、word2vec、word-embedding

我在python中使用gensim word2vec库，并使用预先训练好的GoogleNews-word2vec-negative300.bin模型。但,print "model

浏览 159提问于2015-11-29得票数 2

4回答

如何计算WordNet中没有出现的英语单词的相似度？

python、nltk、similarity

一种特殊的自然语言实践是使用WordNet计算两个单词之间的相似度。我从下面的python代码开始我的问题：sport = wordnet.synsets("sport")[0]lol = wordnet.synsets("lol")print(lol)[]那么我

浏览 0提问于2016-07-09得票数 6

1回答

如何制作其他语言的预训练向量(word2vec)？

c、python-2.7、gensim、word2vec

我想尝试实现word2vec到越南语，但我对预训练的向量感到困惑，当我尝试在英语中使用时，我使用谷歌新闻矢量-负向量300.bin.gz(大约3.4‘m)作为预训练的向量，它工作得很好。如果我使用越南语，我应该自己制作数据预训练向量吗?？如何制作一个预先训练好的向量，比如Google News- vectors

浏览 1提问于2016-05-26得票数 0

2回答

文本分类，如何将文本字符串转换为向量表示

java、machine-learning、classification、svm、text-classification

我的训练数据是700+文本类别，每个类别包含1-350个文本短语。16k+短语总数。需要分类的数据是文本短语。我想对数据进行分类，这样它就可以给我5个最相似的类别。训练数据共享了大量的常用词。我的第一次尝试是在github上使用这个库来使用朴素贝叶斯定理，因为这个库非常容易使用，并且允许我以字符串的形式加载我的训练数据。但是其他用户报告了问题，当我试图对我的数据进行分类时，我的输入要么分类错误，要么

浏览 0提问于2019-01-09得票数 0

1回答

word2vec对监督学习有意义吗？

machine-learning、nlp、word2vec、supervised-learning、unsupervised-learning

我有一个句子/标签对列表来训练模型，我应该如何将句子编码为输入，比如SVM？

浏览 1提问于2016-06-27得票数 1

1回答

在训练CNN时，输入word2vec是如何微调的？

nlp、svm、deep-learning

当我读到“用于句子分类的卷积神经网络”时，我注意到该论文实现了“CNN-非静态”模型--一个使用来自word2vec的预训练向量的模型，所有的单词--包括随机初始化的未知单词，和预训练向量对每个任务都进行了微调所以我只是不明白预先训练好的向量是如何对每个任务进行微调的。因为据

浏览 4提问于2016-10-18得票数 1

1回答

处理大量使用ML模型的请求

django、memory-management、machine-learning、word2vec、gensim

我正在建立一个聊天机器人，其中每个用户发送的消息需要转换为一个向量(为其他ML相关的工作)。我正在使用一个预先训练好的Word2Vec模型来做这件事。Word2Vec模型是使用Gensim库创建的，并作为600MB文件保存到磁盘上，并在Django/Python web应用程序中使用。每次接收到作为API请求的

浏览 0提问于2017-11-20得票数 0

1回答

如何找到上下文相关的单词并将其分类为自定义标记/标签？

machine-learning、neural-network、classification、nlp、text-mining

问题：现在主要的问题是基于上下文来找出两个单词之间的关系，但我无法决定找到它的参数是什么。我尝试过一种使用data

浏览 0提问于2017-11-06得票数 1

回答已采纳

1回答

如何使用word2vec生成句子向量？

python、nlp、word2vec

我想使用word2vec技术生成句子的向量。我已经开发了这段代码，但得到了一个错误。import pandas as pddf = pd.read_csv('after stopwords.csv')model = Word2Vec(sentences=vocab, size=100, window=10, min_count=3, wor

浏览 24提问于2021-10-07得票数 0

3回答

有没有可能从python的句子语料库中重新训练一个向量模型(例如GoogleNews- word2vec* -negative300.bin)？*

python、nlp、gensim、word2vec

我正在使用预先训练好的Google新闻数据集，通过使用python中的Gensim库来获取单词向量。model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) 加载模型后，我将训练评论句子转换为向量过程中，我的语料库中的

浏览 2提问于2016-02-01得票数 11

2回答

项名的字嵌入(整数，一次热编码)

python、nlp、word-embeddings、word

我正在寻找的方法，以获得两个项目名称之间的相似性使用整数编码或一热编码。我有10万个项目名称，由2~3个单词组成，如上所示。我想把(项目名称，大小，单位)作为向量。要做到这一点，我需要用某种方式将文本转换为数字。我所发现的只是word2vec的东西，但我的案件没有上下文。因此，我认为不可能从我的数据中了解到一些上下文。

浏览 0提问于2019-06-20得票数 1

3回答

查找单词之间的余弦相似度

python、scikit-learn、nlp、sklearn-pandas、cosine-similarity

有没有可能找到两个词之间的相似性？cosine_similarity('kamra', 'cameras')ValueError: could not convert string to float: 'kamra'('kamra').toarray() 我的目标是检查与字典中的两个值(列表)

浏览 4提问于2020-11-11得票数 0

1回答

如何获取word2vec词汇表中不存在的单词的向量？

python-3.x、pandas、word2vec、gensim、text-classification

我已经检查了之前的帖子，但它似乎不适用于我的情况：import gensim 现在我有了一个包含关键字的我想要在相应的列中为每个关键字添加向量，但是当我使用model['cambodia']时，它会抛出错误，因为它是KeyError: "word

浏览 0提问于2018-07-04得票数 6

2回答

从已清理的数据中使用代理语句

python、nlp、gensim、word2vec、word-embedding

Gensim的Word2Vec模型将包含单个标记/句子单词的内部列表的列表作为输入。据我所知，Word2Vec用于使用向量“量化”文本中单词的上下文。我目前正在处理一个文本语料库，这些文本已经被分割成单独的标记，并且不再包含明显的句子格式(标点符号已被删除)。我想知道如何将<

浏览 0提问于2018-07-10得票数 0

1回答

添加一个Word2Vec嵌入列表是否提供了一个有意义的表示？

nlp、word2vec、embedding、language-model

我使用了一个预先训练过的word2vec模型(Word2vec-google 300)来获取给定单词列表的嵌入信息。请注意，这不是标记句子后得到的单词列表，而是描述给定图像的单词列表。现在我想得到整个列表的一个向量表示。添加所有单独的单词嵌入是否有意义？还是

浏览 5提问于2021-06-01得票数 0

回答已采纳

2回答

从deeplearning4j和word2vec获得不同的结果

word2vec

我用谷歌的word2vec训练了一个单词嵌入模型。输出是一个包含单词及其向量的文件。 Collection<String> lst = vec.wordsNearest("someWord&

浏览 13提问于2015-09-23得票数 0

1回答

将向量加载到gensim Word2Vec模型--而不是KeyedVectors

machine-learning、nlp、word2vec、gensim、word-embedding

我正在尝试将一些预先训练好的向量加载到gensim Word2Vec模型中，这样它们就可以用新数据重新训练。我的理解是我可以和gensim.Word2Vec.train()一起做再培训。但是，我能找到的加载向量的唯一方法是使用gensim.models.KeyedVectors.load_word2vec_format('path/to/file.bi

浏览 3提问于2018-02-09得票数 4

1回答

word2vec语音对焦

python、word2vec

我使用word2vec将我的单词表示为向量。text = np.loadtxt("file.txt", dtype=str, delimiter=" ")print(len(word2vec.wv.vocab)) 文本是单词(字符串)的列表。这段代

浏览 0提问于2017-07-14得票数 0

回答已采纳

点击加载更多