腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7315)
视频
沙龙
2
回答
什么时候
使用
不同
的
Word2Vec
训练方法?
、
、
、
、
因此,我是第一次学习
Word2Vec
,我
的
问题是
非常
基本
的
:如何知道
使用
什么方法?比如Tensorflow中
的
Word2Vec
还是用
Gensim
训练
的
Word2Vec
?在哪些情况下,通过更手动
的
第一种方法来实现它相对于第二种方法是有用
的
呢?如果已经有一种更简单
的
方法来
使用
gensim
来训练
word2vec
模型,
浏览 0
提问于2018-01-08
得票数 3
回答已采纳
1
回答
Word2Vec
:
使用
Gensim
和
谷歌
新闻
数据
集
-
非常
慢
的
执行时间
、
、
代码是用python编写
的
。我将二进制模型加载到python上
的
gensim
中,并
使用
了"init_sims“选项来加快执行速度。操作系统是OS,几乎需要50-60秒来加载它。找到"most_similar“
的
时间也是一样
的
。这是正常
的
吗?在
使用
init_sims选项之前,它几乎花费了两倍
的
时间!我有一种感觉,可能是操作系统
的
内存分配问题。
浏览 14
提问于2016-09-23
得票数 5
回答已采纳
1
回答
预训练
的
跳过向量
和
跳过向量
、
我正在做一个项目,在那里我需要一个预先训练
的
向量
的
跳跃图模型。我听说也有一个变体叫skip模型,它提供了更好
的
结果。 我想知道我需要什么来培养自己
的
模特?因为我只需要它们来初始化我
的
模型
的
嵌入层。我搜索得够多了,但没有找到好
的
例子。我需要你
的
建议。我在哪里可以得到这样
的
预先训练
的
模式,或没有预先培训
的
模式。
浏览 1
提问于2017-10-20
得票数 3
回答已采纳
1
回答
Gensim
word2vec
模型是否与Mikolov
的
标准模型相同?
、
、
、
我正在写一篇论文来比较我们
的
表现。在报纸上,尤瑟尔说 我们将获取在Google部分
浏览 3
提问于2020-04-19
得票数 0
回答已采纳
1
回答
更新
谷歌
新闻
Word2vec
词嵌入?
、
、
、
可以用自定义文本
数据
集
(属于特定域
的
文本
数据
)更新Google嵌入吗? ('croc', 0.6083582639694214),这个输出
浏览 0
提问于2018-12-05
得票数 2
回答已采纳
2
回答
使用
sklearn或
gensim
的
监督维度消减/主题模型
、
、
、
我有弓向量,我想知道在sklearn或
gensim
中是否有监督降维算法能够获取高维
的
监督
数据
,并将其投影到低维空间中,从而保留这些类之间
的
方差。实际上,我正在尝试为分类/回归找到一个合适
的
度量标准,我相信
使用
维数可以帮助我。我知道有一些无监督
的
方法,但我希望在此过程中保留标签信息。
浏览 1
提问于2015-07-29
得票数 0
2
回答
项名
的
字嵌入(整数,一次热编码)
、
、
、
我正在寻找
的
方法,以获得两个项目名称之间
的
相似性
使用
整数编码或一热编码。📷
浏览 0
提问于2019-06-20
得票数 1
3
回答
如何加快
Gensim
Word2vec
模型
的
加载时间?
、
、
我正在构建一个聊天机器人,所以我需要
使用
Word2Vec
向量化用户
的
输入。import
gensim
model =
gensim
.models.KeyedVectors.load_word2vec_format('GoogleNe
浏览 564
提问于2017-03-24
得票数 24
回答已采纳
1
回答
怎样
使用
预先训练过
的
模特(手套)或者训练我自己
的
模特?
、
、
、
我一直在
使用
预先训练
的
模型,如
谷歌
新闻
或手套6B模型,但在我
的
文本
数据
中
的
许多单词没有它们
的
向量表示在那些预先训练
的
模型中。所以我想也许用我
的
数据
来训练我自己
的
模型。在训练我们自己
的
两类分类模型时有什么缺点吗?还是我应该继续
使用
预先训练过
的
模型。训练我们自己
的
模型
和
使用
预先训
浏览 0
提问于2019-03-07
得票数 0
2
回答
我们能以分布式
的
方式建立
word2vec
模型吗?
、
、
、
、
目前,我有1.2tb文本
数据
来构建
gensim
的
word2vec
模型。它几乎要花15到20天才能完成。请提出任何能帮助我缩短
执行时间
的
方法。 FYI,我
的
所有
数据
都在S3中,我
使用
smart_open模块对
浏览 5
提问于2017-10-06
得票数 3
回答已采纳
1
回答
如何利用
word2vec
和
CNN (2D)一起进行文本分类?
、
、
、
、
有Convolution1D示例没有
word2vec
。我想
使用
word2vec
和
keras (2D而不是1D)来进行文档分类(中文文本)。例如(我想象
的
步骤): model =
gensim
.models.Word2Vec(new_sentences,workers
浏览 4
提问于2017-01-17
得票数 2
回答已采纳
1
回答
使用
gensim
.downloader训练
gensim
模型与手动加载时结果不一致
、
、
要在文档中描述
的
“text8”
数据
集
上进行训练,只需执行以下操作: import
gensim
.downloader as apimodel =
Word2Vec
(dataset) 这样做可以得到
非常
好
的
嵌入向量,通过对单词相似度任务
的
评估得到了验证。但是,当加载上面手动<
浏览 128
提问于2020-06-24
得票数 0
回答已采纳
1
回答
Gensim
库是否支持GPU加速?
、
、
、
使用
Gensim
提供
的
Word2vec
和
Doc2vec方法,他们有一个
使用
BLAS、ATLAS等来加速
的
分布式版本(details )。但是,它是否支持GPU模式?如果
使用
Gensim
,可以让GPU正常工作吗?
浏览 131
提问于2016-09-18
得票数 20
1
回答
加载GoogleNews向量
我试着加载GoogleNews-evinative300.bin并尝试
使用
predict_output_word方法,from
gensim
.models import
Word2Vec
model=Word2Vec.load_word2vec_formatUse
gensim
.models.KeyedVectors.load_word2vec_format in
浏览 2
提问于2018-06-13
得票数 2
2
回答
什么是映射相似ngram
的
最佳方法?
、
、
我试图用Wordnet
和
synsets来映射类似的ngram。例如:elder brother
和
older sibling应该映射到同一个实体。我想知道是否有更好
的
方法来实现这一点?older_lemma):
浏览 0
提问于2018-08-17
得票数 1
1
回答
使用
gensim
的
Word2vec
、
、
我正在
使用
gensim
库来查找与我所拥有的一些单词最相似的单词。用10000个
数据
样本(短文主要是1-2句)来训练,我得到了
非常
糟糕
的
结果!为什么会这样?通过重复训练
和
测试,得到了不同
的
结果。难道不应该是决定性
的
吗?model =
gensim
.models.Word2Vec(senforword2vec)(“
浏览 0
提问于2017-07-13
得票数 1
回答已采纳
1
回答
我可以
使用
单词上下文计数对作为
gensim
的
Word2Vec
的
输入吗?
、
我想对大型语料库
数据
进行
word2vec
(
使用
gensim
)
的
培训。我所掌握
的
信息只有两个单词
的
重复出现。我
的
数据
格式为(例如:危险为10,意为‘危险’
和
‘共同发生’10次,在语料库中
的
窗口大小为5)。
gensim
的
word2vec
接受这样
的
输入吗?我
浏览 1
提问于2018-02-12
得票数 0
1
回答
如何在标准环境中将文件加载到Google-App-Engine
、
、
、
、
我在
使用
Python2.7
的
标准(不是flex)环境,我需要加载一些预先训练过
的
模型(
Gensim
的
Word2vec
和
Keras
的
LSTM)。我需要加载它一次(因为它
非常
慢
-大约需要1.5秒),并保持它在更快
的
访问数小时。谢谢!
浏览 0
提问于2018-10-28
得票数 3
回答已采纳
4
回答
带中文
的
Word2Vec
、
、
、
我一直在学习
Word2Vec
(Deeplearning4j),但我找不到任何支持中文
的
东西。我从各种渠道了解到,通过
使用
一些插件,它也可以在中文上工作。所以请告诉我任何中文插件,以及它应该如何在
word2vec
中实现。 以及Deeplearning4j
Word2Vec
是否适合英文
和
中文(两者)
的
支持。如果没有,请建议一些更好
的
选择与它
的
链接。
浏览 2
提问于2016-05-23
得票数 2
1
回答
如何在
非常
大
的
数据
集
上训练
Word2vec
?
、
、
、
我正在考虑在web爬虫转储上训练10 TB+以上
的
大型
数据
的
TB+。我亲自在我
的
iMac上训练了c实现GoogleNews-2012转储(1.5gb),花了大约3个小时来训练
和
生成向量(速度给人留下深刻印象)。不过,我没有尝试python实现:(我在某个地方读到,在wiki转储(11 to )上生成300向量长度
的
向量需要大约9天
的
时间。 如何加快
word2vec
的
速度?我需要
使用
分布式模型,还是需要在2-3天内
浏览 1
提问于2015-06-01
得票数 20
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
自然语言处理中的词表征
GPT-3 vs Bert vs GloVe vs Word2vec 文本嵌入技术的性能对比测试
基于Doc2vec训练句子向量
基于Text-CNN模型的中文文本分类实战
详解人工智能在网络安全中的应用!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券