腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
在星火集群环境下有效地
训练
word2vec
模型
?
、
、
我想在我
的
星团上
训练
关于10G新闻语料库
的
word2vec
模型
。以下是我
的
星星团
的
心声: 如上图所示,只有100%
的
cpu用于一名工人,其他三名工人没有
使用
(所以没有粘贴他们
的
图片),刚才我
如何</
浏览 7
提问于2015-12-20
得票数 3
1
回答
能否以批处理模式
训练
spark
word2vec
模型
、
我想知道是否可以在批处理模式下
训练
spark
word2vec
。或者换句话说,如果可以更新已经
训练
过
的
spark
word2vec
模型
的
词汇表。我
的
应用程序是:我
的
段落位于多个文件中,当我
使用
gensim时,我可以做 def __init__(self, file_list, folder
spark
<
浏览 2
提问于2016-10-26
得票数 2
1
回答
如何
将
spark
mllib
word2vec
模型
转换为glove txt格式?
、
、
、
我
使用
Spark
MLlib来
训练
特定于领域
的
word2vec
模型
,并且我需要在glove
word2vec
格式中
使用
它。
如何
将其转换为glove txt格式?
浏览 20
提问于2018-12-22
得票数 0
1
回答
如何
使用
spark
加速
Word2vec
模型
的
训练
?
、
我正在
使用
spark
Word2vec
应用程序接口来构建单词矢量。代码: .setInputCol("words")我
的
电脑环境有24核CPU和100G内存,
如何
有效地
使用
它们?
浏览 18
提问于2019-08-12
得票数 0
2
回答
使用
ApacheSpark2.0.0和mllib进行分布式
Word2Vec
模型
培训
、
、
、
我一直在尝试
使用
spark
和mllib来
训练
word2vec
模型
,但我似乎没有从大型数据集上
的
分布式机器学习中获得性能上
的
好处。我
的
理解是,如果我有w工人,那么,如果我创建一个包含n个分区
的
RDD,n>w和我试图通过调用以RDD为参数
的
Word2Vec
的
fit函数来创建一个
Word2Vec
模型
,然后
spark
将统一地分发数
浏览 1
提问于2016-09-28
得票数 1
回答已采纳
1
回答
星星之火MLib
Word2Vec
错误:词汇表大小应>0
、
、
、
、
我正在尝试
使用
Spark
的
MLLib实现word矢量化。我正在学习给出
的
示例。scala> v.take(5) res31: Array[Seq[String]] = Array(List([WrappedArray(0_42)]), List([WrappedArray但是,当我尝试在这个输入上
训练</e
浏览 2
提问于2018-01-03
得票数 2
回答已采纳
1
回答
如何
在payspark ml中加载
word2vec
模型
?
、
我尝试
使用
以下代码行加载一个经过
训练
的
word2vec
模型
但是我得到了这个错误: java.lang.NoSuchMethodException: org.apache.
spark
.ml.feature.Word2VecModel
浏览 21
提问于2020-03-10
得票数 1
1
回答
Word2Vec
火花实现是分布式
的
吗?
、
、
、
、
我相对来说是个新手,很难理解
Spark
。 我
的
问题是,我有3TB
的
文本,我想
训练
一个
Word2Vec
模型
。我正在运行
的
服务器大约有1TB
的
ram,所以我不能临时保存该文件。该文件被保存为我导入到星火中
的
一块地板。我
的
问题是
Spark
库是否分发
Word2Vec
培训?如果是这样的话,在处理这么大
的
文本文件时有什么需要我担心
的
吗?如果没有,那么在培训<
浏览 3
提问于2020-12-17
得票数 0
回答已采纳
1
回答
一个gensim
word2vec
模型
能以联邦
的
方式
训练
吗?
、
、
、
、
我试图找出
如何
以联邦
的
方式
训练
word2vec
模型
。 这些数据将被分成多个部分,例如4个“机构”,我想对每个机构
的
数据分别进行
word2vec
模型
的
培训。这里
的
主要限制是,机构
的
数据不能转移到另一个地方,因此永远不能集中
训练
。我知道可以迭代地
训练
word2vec
模型
,这样可以读取来自第一个机构
的
数据,用于<em
浏览 4
提问于2021-09-06
得票数 1
回答已采纳
1
回答
将
word2vec
向量转储到文件中
、
、
、
、
我正在
使用
spark
来生成单词向量。我希望将我所有的数据进行拟合,然后得到经过
训练
的
单词向量并将它们转储到一个文件中。我是这样做
的
:
Word2Vec
word2vec
= new
Word2Vec
(); Word2VecModel model = word2v
浏览 3
提问于2016-12-06
得票数 4
回答已采纳
1
回答
如何
用新
的
训练
数据更新预
训练
的
word2vec
模型
、
、
、
嗨,我
使用
genism加载西班牙快速文本
word2vec
模型
,代码如下: binary=False) 现在我想用新
的
训练
句子来
训练
word2vec
我知道,在天才中,如果加载
浏览 0
提问于2018-07-30
得票数 1
4
回答
如何
计算WordNet中没有出现
的
英语单词
的
相似度?
、
、
一种特殊
的
自然语言实践是
使用
WordNet计算两个单词之间
的
相似度。我从下面的python代码开始我
的
问题:sport = wordnet.synsets("sport")[0]lol = wordnet.synsets("lol")print(lol)[]那么我们就不能考虑它们之
浏览 0
提问于2016-07-09
得票数 6
2
回答
必须
使用
writeStream.start();执行流源查询;
、
、
、
、
我试图从卡夫卡读取数据
使用
火花结构化流和预测形式
的
传入数据。我用
的
是我用
Spark
训练
的
模型
。val
spark
= SparkSession .appName("
Spark
SQL basic example") .getOrCreatefiltered") val removestopdf = remover
浏览 7
提问于2017-10-03
得票数 2
回答已采纳
2
回答
在
Spark
中加载
Word2Vec
模型
、
、
可以加载一个预先
训练
好
的
(二进制)
模型
到
spark
(
使用
scala)吗?我尝试加载google生成
的
一个二进制
模型
,如下所示: val model = Word2VecModel.load(sc, "GoogleNews-vectors-negative300.bin
浏览 1
提问于2017-05-09
得票数 4
2
回答
用Gensim减少谷歌
的
Word2Vec
模型
、
、
通过
word2vec
加载完整
的
预先
训练
的
模型
是耗时而乏味
的
,因此我想知道是否有机会删除低于某一频率
的
单词,从而将vocab计数降低到例如200k单词。我在
Word2Vec
包中找到了gensim方法来确定单词频率,并再次保存
模型
,但我不知道
如何
从经过预先
训练
的
模型
中提取pop/remove语音,然后再保存它。我在KeyedVector class和
浏览 5
提问于2017-02-25
得票数 9
回答已采纳
1
回答
为什么我们需要‘
训练
word2vec
’,而
word2vec
本身被说是‘预培训’?
、
、
我真的很困惑,为什么我们需要‘
训练
word2vec
’,而
word2vec
本身被认为是‘预培训’?我搜索了
word2vec
预
训练
的
嵌入,认为我可以得到一个映射表,直接将我
的
词汇表映射到预先
训练
的
嵌入,但没有效果。相反,我只发现我们是
如何
训练
自己
的
:
Word2Vec
(sentences=common_texts, vector_size=100, window=5,
浏览 0
提问于2022-04-14
得票数 1
回答已采纳
3
回答
用
word2vec
训练
星火RDD[String]
、
、
、
我对
Spark
和Scala并不熟悉,所以我可能误解了这里
的
一些基本内容。我正在尝试根据我自己
的
数据来
训练
Sparks
word2vec
模型
。根据他们
的
,一种方法是val
word2vec
= new
Word2Vec
在按摩了我自己
的
数据
浏览 6
提问于2016-05-11
得票数 1
回答已采纳
1
回答
为什么
spark
.ml.feautures.Word2Vec要将句子向量化而不是单个单词?
、
在理解星火中
的
Word2Vec
与gensim 1有何不同
的
过程中,我对
Spark
(参考链接:https://
spark
.apache.org/docs/2.2.0/ml-features.html#word2vec)中
的
例子感到非常困惑,我想知道为什么它们不是转换单个单词,而是转换整个句子。
word2vec
的
目的不是将单个单词嵌入向量空间吗?为什么要嵌入整个句子?
如何
对
wor
浏览 0
提问于2018-07-27
得票数 7
回答已采纳
2
回答
谷歌
word2vec
训练
模型
是CBOW还是skipgram?
、
、
是谷歌预先
训练
好
的
word2vec
模型
CBO或skipgram。我们通过以下方式加载预
训练
模型
:我们
如何
具体加载预先
训练
的
CB
浏览 40
提问于2019-07-18
得票数 0
1
回答
如何
加载
训练
过
的
模型
,并用它
训练
doc2vec?
、
、
、
我有一个准备去
word2vec
模型
,我已经
训练
过了。., 0.3461
如何
加载
word2vec
浏览 1
提问于2016-04-23
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Uber机器学习平台Michelangelo是如何使用Spark模型的?
如何使用 Java 调取 Python、R 的训练模型?
SparK项目原作解读:卷积模型的首个BERT预训练
使用PyTorch Profiler进行模型性能分析,改善并加速PyTorch训练
如何将训练好的Python模型给JavaScript使用?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券