腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2163)
视频
沙龙
14
回答
python
中的预训练手套向量
、
、
我已经
从
网上下载了预先训练过的手套
矢量
文件。它是一个.txt文件。我无法
加载
和访问它。使用
gensim
加载
和访问
单词
向量二进制文件很容易,但当它是
文本文件
格式时,我不知道该如何做。 提前感谢
浏览 12
提问于2016-06-13
得票数 49
回答已采纳
1
回答
从
文本文件
加载
单词
矢量
-
GENSIM
PYTHON
、
、
你好,我有一个这种形式的txt文件,第一列是
单词
,第二列是它的向量。 word 0.256 0.2659 0.326595 word1 0.528 0.6589 0.62326 ...我试图将其
加载
为keyedvector,因为我想计算
单词
之间的余弦相似度,并找到最相似的
单词
,但我总是得到一个错误。
浏览 3
提问于2021-05-01
得票数 0
1
回答
使用GloVe获取最相似的
单词
、
、
在运行演示之后,我得到了一些文件,如vocab、vectors等,但是它们没有任何文档或任何东西来描述我们需要使用哪些文件,以及如何使用这些文件来查找最相似的
单词
。因此,请帮助我找到GloVe中给出的最相似的
单词
(使用余弦相似度)?(例如,类似于
Gensim
word2vec中的word2vec) 请帮帮我!
浏览 4
提问于2017-11-18
得票数 1
回答已采纳
1
回答
基于
gensim
的快速文本库中预训练词嵌入的有效存储
、
、
、
、
我想用
gensim
从快速文本库
加载
经过预先训练的多语种
单词
嵌入;在这里,链接到嵌入: cc.de.300.vec (4.4 GB) cc.de.300.bin (7 GB)
gensim
.models.fasttext.load_facebook_model(path, encoding='utf-8') - _LoadIts
浏览 7
提问于2019-12-11
得票数 3
回答已采纳
1
回答
如何
从
谷歌的word2vec预训练模型中提取
单词
向量?
、
、
、
文件GoogleNews-vectors-negative300.bin包含3亿字向量.我认为(不确定)在写入以下行时
加载
了该文件:我想在一个名为words的列表中下载外部给出的
单词
的向量。是因为在搜索words中的
单词
之前,它正在
加载
整个二进制文件吗?如果是的话,我该如何解决这个问题呢?当我收到以下警告时,我会想到这一点,这就是为什么我使用warning包来抑制它的原因: c:\
Python<
浏览 6
提问于2017-06-22
得票数 2
回答已采纳
2
回答
word2vec模型由字符而不是
单词
组成
、
我试图通过
Gensim
在波斯语上建立一个word2vec模型,该语言以“空格”作为字符分隔符,我使用
python
3.5。我遇到的问题是,我给出了一个
文本文件
作为输入,它返回一个模型,该模型只由每个字符单独组成,而不是
单词
。我还把输入作为建议的
单词
清单: 将多个空白空间折叠为单个空白空间删除小于3个字符的
单词
--长--删除停止词 我把文本给了word
浏览 0
提问于2017-07-18
得票数 3
回答已采纳
1
回答
有没有一种方法可以在训练doc2vec模型之前
加载
预先训练好的词向量?
、
我已经使用我拥有的语料库(10k个句子)训练了一个
gensim
doc2vec模型。这个模型可以在一定程度上告诉我一个新句子是否与语料库中的一些句子相似。但是,有一个问题:新句子中可能存在语料库中不存在的
单词
,这意味着它们没有
单词
嵌入。如果发生这种情况,预测结果将不会很好。据我所知,经过训练的doc2vec模型确实有一个文档向量矩阵和一个
单词
向量矩阵。因此,我的想法是
加载
一组预先训练的词向量,其中包含大量的
单词
,然后训练模型以获得文档向量。这有意义吗?是否可以使用
gensim</
浏览 1
提问于2019-07-12
得票数 0
1
回答
如何在
python
中使用
gensim
获取相关的匹配词?
、
、
在通过处理语料库(
文本文件
A)创建
gensim
模型之后,我正在尝试查找相关的
单词
。接下来,我想传递我自己的
单词
列表(存储的
文本文件
B),以
从
gensim
模型中获取与
文本文件
B中的
单词
最相似的
单词
。model =
gensim
.models.Word2Vec(documents, window=5, min_count=1, workers=10) model.train(documents, tot
浏览 20
提问于2021-04-03
得票数 2
4
回答
带中文的Word2Vec
、
、
、
我
从
各种渠道了解到,通过使用一些插件,它也可以在中文上工作。 所以请告诉我任何中文插件,以及它应该如何在word2vec中实现。
浏览 2
提问于2016-05-23
得票数 2
1
回答
如何使用Word2Vec获得单个
单词
的单个向量?
、
、
我试图解决一个深度学习文本分类问题,所以我必须用Word2Vec
矢量
化文本输入,以便将它输入到一个神经网络中。所以我下载了Google预先训练过的Word2Vec模型:import
gensim
当我试图打印一个特定的
单词
时: print(model['cat&
浏览 5
提问于2017-03-18
得票数 3
回答已采纳
1
回答
Gensim
:如何
从
文本文件
加载
预先计算的
单词
向量
、
、
、
我有一个
文本文件
,其中有一个预先计算的字向量,格式如下(示例):在每一行中,每一个
单词
我试图用
Gensim
作为KeyedVectors
加载
它们,因为我最终想要计算余弦相似度,找到最相似的
单词
等等。不幸的是,我以前没有使用过
Gensim
,而且
从
文档中我不太清楚如何做到这一点。word.vectors', binary=False) 但是,这
浏览 2
提问于2018-04-10
得票数 9
回答已采纳
1
回答
如何将numpy数组
加载
到
gensim
Keyedvector格式?
、
、
、
、
当我试图以KeyedVectors格式
加载
它时,它会出错。如何以
gensim
.KeyedVectors格式
加载
numpy数组?
浏览 3
提问于2019-02-23
得票数 0
回答已采纳
1
回答
如何使用代理后的
gensim
.downloader下载glove-wiki-gigaword-100或其他word向量包?
、
、
、
、
通常,我可以使用以下代码下载jupyter lab中的word vector包:word_vectors = api.load("glove-wiki-gigaword我也在上尝试了这种方法但是我不知道如何在这条线路上设置代理。如果我的代理是。那么我如何在防火墙后面下载
单词
矢量
呢?
浏览 295
提问于2020-11-18
得票数 1
回答已采纳
1
回答
将GloVe向量导入
gensim
。UnicodeDecodeError:'utf-8‘编解码器无法解码位置0中的字节0xe6 :无效的继续字节
、
、
、
我正在尝试将这些文件导入
gensim
,这样我就可以像使用word2vec
矢量
一样使用它们。我尝试过同时使用二进制格式和
文本文件
格式进行
加载
,但最终只得到了一个酸洗错误:我尝试忽略unicode错误,但这不起作用:import
gensim
from
gensim
.models impor
浏览 3
提问于2019-10-29
得票数 0
1
回答
将经过DL4J训练的Word2Vec模型
加载
到
gensim
中
、
、
、
我可以使用以下命令在DL4j中成功
加载
和使用模型现在,我正在尝试使用
gensim
在
python
中读取该模型但我得到以下错误:如果我解压缩DL4J生成的模型,我会得到以下文件:有没有办法在
python</e
浏览 2
提问于2018-10-11
得票数 0
1
回答
导出R text2vec
矢量
以在
Python
中的
Gensim
中使用
、
、
、
有没有什么简单的方法可以将它们导出到
Python
中使用,在
Python
中我有脚本可以与
Gensim
创建的
单词
矢量
进行比较/比较?
浏览 13
提问于2020-08-18
得票数 1
3
回答
如何使用深入集的字嵌入预训练模型使用
gensim
?
、
、
、
、
我原以为只有一个文件,但是有"“和"”
文本文件
。如何使用这些文件来使用
gensim
(或任何其他工具)
加载
经过预先培训的模型?testtt.py", line 11, in <module> File "/home/bugra/word2vec_imp/project_envv/lib/
python
3.7=datatype) File "/home&
浏览 3
提问于2020-12-03
得票数 2
3
回答
Gensim
: doc2vec是一个模型还是一个操作?与R执行的差异
、
、
、
、
我们的途径之一是用
Python
重新创建代码和模型。离线 然后,在这些较小的文本身体上对各种模型进行培训。--我为
Gensim</
浏览 45
提问于2021-06-17
得票数 1
回答已采纳
1
回答
从
gensim
模型中提取令牌频率
、
像和这样的问题给出了
从
gensim
word2vec模型中检索词汇频率的答案。 出于某种原因,他们实际上只是给出了一个
从
n(vocab的大小)到0的反推荐计数器,以及最常见的有序标记。给出一个词,我如何
从
模型中提取术语频率?
浏览 1
提问于2020-10-01
得票数 0
回答已采纳
1
回答
在word2vec
gensim
模型中添加词嵌入
、
、
我正在寻找一种方法,在word2vec
gensim
模型中添加预先训练过的
单词
向量。为了避免
加载
整个词汇表的需要,我只想
加载
在语料库中找到的预先训练过的模型
单词
的子集。但是,如果新文档中的
单词
不在语料库中,而是存在于原始模型词汇表中,则将它们添加到模型中,以便在计算中考虑它们。我想要的是保存RAM,所以有可能对我有帮助: 是否有
从
矩阵或其他对象
加载
到
gensim
浏览 3
提问于2017-04-24
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pyLDA系列︱带‘监督味’的作者-主题模型
自然语言处理中的词表征
pyLDA系列︱考量时间因素的动态主题模型
Python简单品读小说
Python 自然语言处理:文本理解与生成的奥秘
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券