腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
gensim
中
的
自定义字嵌入
、
、
我有一个词嵌入矩阵(例如M),得到
的
是V阶,其中V是
词汇表
的
大小,N是每个字
向量
的
大小。我希望
gensim
的
word2vec
模型在训练过程中用M初始化它
的
词嵌入矩阵。我可以使用
gensim
.models.keyedvectors.Word2VecKeyedVectors.load_word2vec_format(model_file)以
word2vec
格式加载M,但我不知道如何将M提供给
ge
浏览 16
提问于2022-05-04
得票数 0
1
回答
用
Gensim
4.0微调预训练
的
Word2Vec
模型
、
、
、
使用
Gensim
< 4.0,我们可以使用以下代码重新训练
word2vec
模型:model.train(my_corpus, total_examples=len(my_corpus), epochs=model.epochs) 然而,我理解
的
是
Gensim
4.0不再支持Word2Vec.load_word2vec_fo
浏览 0
提问于2021-07-07
得票数 2
1
回答
如何在显像板投影机
中
可视化
Gensim
Word2vec
嵌入
、
、
、
、
在之后,我训练了一个简单
的
word2vec
模型:from
gensim
.models import
Word2Vec
model =
Word2Vec
(sentences=common_texts, size=100, window=5, min_count=1, workers=4) model.save("/contentpython3 -m
gensim
.sc
浏览 20
提问于2021-09-18
得票数 5
回答已采纳
6
回答
更新
gensim
word2vec
模型
、
我有一个用
gensim
训练过
的
超过98892个文档
的
word2vec
模型。对于没有出现在句子数组
中
的
任何给定句子(即,我在其上训练模型
的
集合),我需要用该句子更新模型,以便下次查询它时会给出一些结果。model.most_similar(positive=['moscow', 'weather', 'cold']) File "/Library/Python/2.7
浏览 1
提问于2014-03-02
得票数 38
1
回答
用
gensim
4.0.0与预先训练过
的
字
向量
相交
的
过程
、
我试着从一个使用一个更老版本
的
gensim
的
例子中学习。特别是,我有一段代码,如:word_vectors.build_vocab,当可用时,这会用预先训练过
的
单词
向量
来填充单词
向量
词汇表
。当我
的
词汇表
中
的
单词不在预先训练
的
浏览 9
提问于2021-10-01
得票数 0
回答已采纳
4
回答
gensim
word2vec
访问输入/输出
向量
、
在
word2vec
模型
中
,有两个线性转换,将词汇空间中
的
单词转换到隐藏层( " In“
向量
),然后返回到词汇空间( "out”
向量
)。通常,这个输出
向量
在训练后被丢弃。我想知道在
gensim
python
中
是否有一种简单
的
方法来访问out
向量
?同样,我如何访问out矩阵?以下是更多细节。从上面的引用
中
,我们得到了以下<
浏览 107
提问于2016-11-07
得票数 17
回答已采纳
1
回答
用于单个字符而不是单词
的
Word2Vec
返回
向量
、
、
COMPETITION','prospects','2K15','gather','Mega','SENSOR','NCTT','NETWORKING','orgainsed','acts']from
gensim
.modelsimport
Word2Vec
vec_model=
Word2Vec
(words, min_count=1, si
浏览 2
提问于2022-02-12
得票数 1
回答已采纳
1
回答
在
word2vec
gensim
模型
中
添加词嵌入
、
、
我正在寻找一种方法,在
word2vec
gensim
模型
中
添加预先训练过
的
单词
向量
。我在txt中有一个经过预先训练
的
word2vec
模型(单词及其嵌入),我需要获取特定语料库
中
的
文档和新文档之间
的
Word Mover
的
距离(例如通过)。为了避免加载整个
词汇表
的
需要,我只想加载在语料库中找到
的
预先训练过
的
模型单词
的</em
浏览 3
提问于2017-04-24
得票数 6
1
回答
更新spaCy词汇
、
、
我想知道是否有可能更新空间
的
默认
词汇表
。我想做
的
是: 但是,由于我
的
语料库中有很多单词不在空间
的
默认
词汇表
中
,所以我无法使用导入
的
向量
。是否有一种(容
浏览 2
提问于2017-04-20
得票数 3
回答已采纳
2
回答
从不同
的
word2vec
模型
组合
/添加
向量
、
、
、
、
我正在使用
gensim
创建大型文本语料库培训
的
Word2Vec
模型。我有一些基于StackExchange数据转储
的
模型。我也有一个来自英语维基百科语料库
的
模型。假设两个模型中都有
词汇表
术语,并且模型
的
创建具有与
Word2Vec
相同
的
参数。有没有办法
组合
或添加两个独立模型
中
的
向量
,以创建一个具有相同单词
向量
的
单一新模型,如果我最
浏览 0
提问于2019-01-17
得票数 1
回答已采纳
4
回答
word2vec
-什么是最好
的
?添加、串联或平均字
向量
?
、
、
、
、
我正在研究一种反复出现
的
语言模式。为了学习可以用于初始化我
的
语言模型
的
单词嵌入,我使用
gensim
的
word2vec
模型。经过训练,
word2vec
模型对
词汇表
中
的
每个单词包含两个
向量
:单词嵌入(输入/隐藏矩阵行)和上下文嵌入(隐藏/输出矩阵列)。正如中所概述
的
,至少有三种共同
的
方法来
组合
这两个嵌入
向量
:
浏览 6
提问于2017-10-23
得票数 20
回答已采纳
1
回答
如何在
word2vec
的
训练模型中统计词频?
、
、
、
、
我需要计算
word2vec
训练模型
中
每个单词
的
频率。我如何从
word2vec
中
获取这些数据呢?
浏览 57
提问于2019-04-13
得票数 0
2
回答
如何使用来自另一个模型
的
词汇表
初始化
gensim
模型?
、
、
我从
gensim
的
文档中了解到,它在开始训练之前建立
词汇表
。在我
的
例子
中
,建立
词汇表
需要很多小时。我想通过重用第一个模型
中
的
词汇表
来节省时间。我该怎么做呢?.build_vocab方法不能从另一个模型
中
获取vocabulary对象。下面是一个虚拟
的
例子:sentences
浏览 0
提问于2019-12-19
得票数 0
3
回答
从多个词嵌入生成同义词或类似词
、
例如下面的两个例子:-> ->单词嵌入->生成两个单词
的
同义词->词嵌入词->在该上下文中生成" Word“
的
同义词 我想我会开始和伯特一起..。我该怎么开始?谢谢你
的
帮助!
浏览 0
提问于2020-03-05
得票数 5
3
回答
加载PreComputed矢量
Gensim
、
、
、
我正在使用
Gensim
Python包学习一个神经语言模型,我知道您可以提供一个训练语料库来学习该模型。然而,已经存在许多文本格式
的
预计算词
向量
(例如)。是否有某种方法可以初始化
Gensim
Word2Vec
模型,该模型只利用一些预先计算
的
向量
,而不必从头开始学习这些
向量
? 谢谢!
浏览 1
提问于2014-11-26
得票数 25
回答已采纳
3
回答
如何从
gensim
word2vec
中
获取词汇量?
、
我正在使用python
中
的
gensim
word2vec
包。我知道如何从经过训练
的
模型
中
获取
词汇表
。但是如何获得
词汇表
中
每个单词
的
词数呢?
浏览 0
提问于2016-05-12
得票数 12
回答已采纳
2
回答
根据您
的
词汇表
调整加载了
Gensim
的
谷歌
Word2Vec
,然后创建嵌入
向量
、
、
、
我想知道如何才能将谷歌
的
Word2Vec
限制在我
的
词汇表
中
。谷歌Word2视频链接:import
gensim
model =
gensim
.models.Word2Vec.load_word2vec_formatGoogleNews-vectors-negative300.bin', binary=True) embe
浏览 6
提问于2018-04-16
得票数 0
3
回答
gensim
word2vec
:查找
词汇表
中
的
单词数量
、
、
、
、
使用python 训练
word2vec
模型后,如何在模型
的
词汇表
中找到单词
的
数量?
浏览 1
提问于2016-02-24
得票数 48
回答已采纳
1
回答
如何从
word2vec
模型中计算句子嵌入?
、
、
、
我是NLP新手,我正在尝试执行集群问题
的
嵌入。我已经使用Python
的
word2vec
库创建了
gensim
模型,但我想知道以下几点:foo:
浏览 0
提问于2022-02-14
得票数 0
2
回答
将字符串标记转换为整数
、
、
、
、
我试图把句子
的
记号转换成整数。但它给我
的
是浮标。from nltk.tokenize import word_tokenizemodel =
Word2Vec
([tokens], min_count=1, size=1)print(model
浏览 1
提问于2019-06-18
得票数 1
回答已采纳
点击加载更多
相关
资讯
自然语言处理中的词表征
Gensim,一个主题建模与文档相似度的Python库!
用Python实现词嵌入的数值化:从文本到向量的转换方法解析
2017年末自然语言处理-Word2Vec视频教程附软件代码与数据 26课
基于word2vec训练词向量(二)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券