腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
gensim
word2vec
非常大
,
有
什么
方法
可以
让
文件
变小
?
python
、
gensim
、
word2vec
我
有
一个使用skipgram预先训练好的
word2vec
bin
文件
。这个
文件
非常大
(向量尺寸为200 ),超过2 2GB。我正在考虑一些
方法
来使
文件
更小。这个bin
文件
包含标点符号的向量,以及一些停用的单词。因此,我想知道
有
哪些选项
可以
减少此
word2vec
的
文件
大小。删除那些标点符号和停止字行是否安全?最有效的
方法
是
什么
?
浏览 53
提问于2019-09-24
得票数 0
回答已采纳
1
回答
用PathLineSentences在
gensim
word2vec
中嵌入多词ngram短语
python
、
gensim
、
word2vec
我
有
大约82个gzipped
文件
(每个
文件
大约180 82,总计14 82),其中每个
文件
包含新的行分隔语句。我正在考虑使用
gensim
Word2Vec
的来训练词汇表上的
word2vec
模型。现在我还想
让
嵌入包含多个单词的短语。但是从来看,我似乎需要一个已经训练过的短语检测器和我所有的句子。from
gensim
.models import Phrasesbigram_tran
浏览 2
提问于2021-01-05
得票数 0
回答已采纳
2
回答
未找到模块的Pickle
python
、
pickle
、
gensim
我没有Linux,所以不能安装代码使用的
word2vec
包,但它只用于加载预先训练好的
word2vec
模型,所以
Gensim
应该
可以
完成这项工作。当我试图打开这个
文件
时,我得到了ModuleNotFoundError No module named '
word2vec
'。我进入了pickle
文件
(在记事本中),并将开头的
word2vec
更改为
gensim
.models.word2vec,但随后我获得了ModuleN
浏览 1
提问于2020-12-03
得票数 0
1
回答
Gensim
库是否支持GPU加速?
optimization
、
gpu
、
gensim
、
deeplearning4j
使用
Gensim
提供的
Word2vec
和Doc2vec
方法
,他们
有
一个使用BLAS、ATLAS等来加速的分布式版本(details )。但是,它是否支持GPU模式?如果使用
Gensim
,
可以
让
GPU正常工作吗?
浏览 131
提问于2016-09-18
得票数 20
1
回答
加载在
Gensim
中创建的自定义受过训练的单词向量到Spacy
有
困难
python-3.x
、
spacy
、
gensim
我训练过一个模特:但是,有些地方出了问题,因为我不能在nlp上使用公共命令,而在model上
可以
。'most_similar' AttributeError: 'English' object has no attribute
浏览 0
提问于2020-03-26
得票数 0
回答已采纳
2
回答
Word2Vec
中每个单词的向量的理想“大小”是多少?
python
、
python-3.x
、
machine-learning
、
nlp
、
word2vec
我
有
一个100多万行的数据集。每行都有40个标记词。在此基础上,利用神经网络进行分类。词汇量是两万个独特的单词。这是一个二进制分类问题。我将
gensim
Word2Vec
中向量的大小(维度)设置为150,并将这些向量保存到json
文件
中的每个数据点。json
文件
的大小
非常大
: 250 GB。因为我的RAM只有128 GB,所以我不能在一勺中将这个
文件
加载到内存中。我试图通过把这些矢量缩小到合适的尺寸来减小它们的物理尺寸。我浏览了一些在这个网站上提出的建议,比如。以下是我
浏览 8
提问于2022-06-21
得票数 0
回答已采纳
5
回答
python
word2vec
未安装
python
、
pip
、
gnuwin32
、
word2vec
我一直试图使用Python2.7解释器在我的Windows7计算机上安装
word2vec
: Traceback (most recent call last):WindowsError: [Error 2] The system cannot find the
浏览 6
提问于2014-09-03
得票数 10
回答已采纳
14
回答
如何用python的
gensim
word2vec
模型计算句子相似度
python
、
gensim
、
word2vec
根据,我
可以
使用
gensim
软件包中的
word2vec
模型来计算两个词之间的相似度。例如:0.73723527 然而,
word2vec
模型无法预测句子的相似性。在
gensim
中,我发现了具有句子相似性的LSI模型,但这似乎不能与
word2vec
模型相结合。我的每句话的语料库都不长(短于10个字)。那么,
有
什么
简单的
方法<
浏览 13
提问于2014-03-02
得票数 144
回答已采纳
1
回答
如何在
gensim
的
word2vec
模型中嵌入用户名
python
、
gensim
、
word2vec
我
有
一些志愿者的论文,格式如下: volunteer_names, essaysentences = [['first', 'sentence'], ['second', 'sentence']] #
浏览 8
提问于2020-04-21
得票数 0
回答已采纳
1
回答
词性标注中的Word嵌入/Word 2vec
neural-network
、
nlp
、
deep-learning
、
rnn
、
word2vec
我正在构建一种基于深度学习的实体检测和关系分类
方法
,该
方法
需要对POS标签和实体标签进行矢量表示。我熟悉文字嵌入
方法
,但我不知道以下问题的答案:如何将词嵌入和pos嵌入结合起来构建分类器。 在交叉验证社区中也提出了类似的问题,但我找不到答案。
浏览 0
提问于2017-01-18
得票数 7
回答已采纳
1
回答
缺少
Gensim
4.2.0下载程序功能
python
、
nlp
、
gensim
、
word2vec
我用的是
Gensim
软件包。但是,当我想加载
word2vec
模型时,
gensim
.downloader函数似乎不存在。w2v =
gensim
.downloader.load('word2vec-google-news-300')AttributeError: module '
gensim
' hasno attribute 'downloader' 我使用dir()
方法
检查了
gensim
目录,
浏览 16
提问于2022-08-01
得票数 0
回答已采纳
1
回答
Gensim
word2vec
培训在批处理结束时不回调
python
、
machine-learning
、
gensim
、
word2vec
我感兴趣的是在
Gensim
word2vec
模型上放置一个回调,以便在每个批处理之后触发一些函数。根据documentation,
可以
在批处理结束或纪元结束时进行回调。要运行示例,请
让
corpus_filepath转到一个由不带标点符号的句子组成的以行分隔的
文件
(给定一行的句子中的单词应以空格分隔)。您可能还需要在
Word2Vec
实例化中更改workers。from
gensim
.models import
Word2Vec
from
gens
浏览 18
提问于2021-01-18
得票数 0
回答已采纳
1
回答
如何用
Word2Vec
进行预测?
python
、
gensim
、
word2vec
、
text-classification
, 'rb') as f: yield
gensim
.utils.simple_preprocess(line) logging.info ("Done reading data file") mode
浏览 0
提问于2019-05-29
得票数 1
2
回答
使用
Gensim
在Python中重新训练预训练的单词嵌入
python-3.x
、
gensim
、
word2vec
我想使用的预训练嵌入是Google的
Word2Vec
,它位于GoogleNews-vectors negative300.bin
文件
中。根据
Gensim
的
word2vec
教程,“不可能使用C工具load_word2vec_format()生成的模型恢复训练。您仍然
可以
使用它们进行查询/相似性,但训练所需的重要信息(词汇树)在那里缺失。”(more_sentences)但是,当我尝试这样做时: from
gensim
.models import
Word2Vec<
浏览 0
提问于2019-06-13
得票数 1
7
回答
如何使用
Word2Vec
获取单词列表的向量?
machine-learning
、
nlp
、
artificial-intelligence
、
word2vec
我想创建一个文本
文件
,它本质上是一个字典,每个单词都通过
word2vec
与其向量表示配对。我假设这个过程是首先训练
word2vec
,然后从我的列表中查找每个单词并找到它的表示形式(然后将其保存到一个新的文本
文件
中)? 我是
word2vec
的新手,我不知道该怎么做。
浏览 2
提问于2015-07-16
得票数 17
2
回答
什么
是映射相似ngram的最佳
方法
?
python
、
nlp
、
nltk
实现这一目标的最佳方式是
什么
?我一直在想,到目前为止,我只想出了一个强力的
方法
,检查每个单词的每个同步集,并试图找到一个类似的单词,或者将它们作为一个新的实体添加。我想知道是否
有
更好的
方法
来实现这一点?older_lemma): print(syn) 理想情况下,我想把它扩展到n-gram,并且我正在寻找一种更好的
方法
来做到这一点我想的是一种粗糙但快速的相似算法,它
可以
给我一个粗略的表示,说
浏览 0
提问于2018-08-17
得票数 1
1
回答
gensim
除了创建.bin
文件
外,还会创建扩展名为.bin.trainables.syn1neg.npy和.bin.wv.vectors.npy的
文件
python-2.7
、
gensim
、
word2vec
我正在使用python
gensim
为我的9300万个句子创建
word2vec
。然而,当我训练我的模型时,除了.bin之外,我还得到了三个
文件
作为输出,扩展名为.bin.trainables.syn1neg.npy和.bin.wv.vectors.npy。我看过了这里提供的答案:,它给出了为
什么
会发生这种情况的原因。然而,我想知道是否
有
一种
方法
可以
将这些
文件
转换为普通的单个bin
文件
?
浏览 2
提问于2018-10-23
得票数 0
1
回答
无法加载
word2vec
模型
python
、
gensim
我在本地机器上使用
gensim
训练了一个
word2vec
模型,并将所有
文件
上传到AWS。我能够在本地机器上加载模型,但是在AWS上加载# LOCAL MACHINE from
ge
浏览 11
提问于2022-03-03
得票数 0
回答已采纳
2
回答
基于预定义字典和词索引数据的
Gensim
word2vec
python
、
nlp
、
gensim
、
word2vec
我需要使用
gensim
在tweet上训练一个
word2vec
表示。与我在
gensim
上看到的大多数教程和代码不同,我的数据不是原始的,而是已经进行了预处理。一种简单的
方法
是将索引列表转换为字符串列表(即0、1、2、3、6 -> '0‘、'1’、'2‘、'3’、'6')。然而,这必须是低效的,因为
gensim
随后将试图查找用于例如“2”的内部索引。如何加载这些数据并使用
gensim
高效地创建
word2vec
浏览 0
提问于2016-03-01
得票数 11
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券