腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1448)
视频
沙龙
1
回答
如何
使用
预先
训
练好
的
word2vec
模型
(
谷歌
)
将
单词
列表
转
换为
向量
列表
?
python-3.x
、
gensim
、
word2vec
我正在努力学习
word2vec
。我正在
使用
下面的代码在Python3中加载
谷歌
预先
训
练好
的
word2vec
模型
,但我不确定
如何
将
诸如“i”、"ate“、"apple”之类
的
列表
转
换为
向量
列表
(即
如何
从该
模型
中获取
向量
?)import nltk import
浏览 17
提问于2019-07-29
得票数 0
回答已采纳
1
回答
来自网络研讨会
的
培训
word2vec
字幕
nlp
、
word2vec
、
doc2vec
我正在构建一个
模型
,根据上下文从时间帧开始播放视频。比如播放电影
的
高潮,从59分钟开始播放。 我正在
使用
视频
的
字幕,并匹配特定序列中
的
文本,并确定时间帧。我正在尝试寻找具有真实表达式
的
精确
单词
,$$not so effective$$。我偶然发现了
word2vec
,它可以找到余弦相似的相似
单词
。
浏览 2
提问于2019-05-10
得票数 0
1
回答
如何
在GoogleNews- vectors negative3000.bin预训练
模型
中添加缺失
的
单词
向量
?
python
、
nlp
、
gensim
、
word2vec
、
word-embedding
我在python中
使用
gensim
word2vec
库,并
使用
预先
训
练好
的
GoogleNews-word2vec-negative300.bin
模型
。但,print "model
浏览 159
提问于2015-11-29
得票数 2
4
回答
如何
计算WordNet中没有出现
的
英语
单词
的
相似度?
python
、
nltk
、
similarity
一种特殊
的
自然语言实践是
使用
WordNet计算两个
单词
之间
的
相似度。我从下面的python代码开始我
的
问题:sport = wordnet.synsets("sport")[0]lol = wordnet.synsets("lol")print(lol)[]那么我
浏览 0
提问于2016-07-09
得票数 6
1
回答
如何
制作其他语言
的
预训练
向量
(
word2vec
)?
c
、
python-2.7
、
gensim
、
word2vec
我想尝试实现
word2vec
到越南语,但我对预训练
的
向量
感到困惑,当我尝试在英语中
使用
时,我
使用
谷歌
新闻矢量-负
向量
300.bin.gz(大约3.4‘m)作为预训练
的
向量
,它工作得很好。如果我
使用
越南语,我应该自己制作数据预训练
向量
吗??
如何
制作一个
预先
训
练好
的
向量
,比如Google News- vectors
浏览 1
提问于2016-05-26
得票数 0
2
回答
文本分类,
如何
将
文本字符串转
换为
向量
表示
java
、
machine-learning
、
classification
、
svm
、
text-classification
我
的
训练数据是700+文本类别,每个类别包含1-350个文本短语。16k+短语总数。需要分类
的
数据是文本短语。我想对数据进行分类,这样它就可以给我5个最相似的类别。训练数据共享了大量
的
常用词。我
的
第一次尝试是在github上
使用
这个库来
使用
朴素贝叶斯定理,因为这个库非常容易
使用
,并且允许我以字符串
的
形式加载我
的
训练数据。但是其他用户报告了问题,当我试图对我
的
数据进行分类时,我
的
输入要么分类错误,要么
浏览 0
提问于2019-01-09
得票数 0
1
回答
word2vec
对监督学习有意义吗?
machine-learning
、
nlp
、
word2vec
、
supervised-learning
、
unsupervised-learning
我有一个句子/标签对
列表
来训练
模型
,我应该
如何
将
句子编码为输入,比如SVM?
浏览 1
提问于2016-06-27
得票数 1
1
回答
在训练CNN时,输入
word2vec
是
如何
微调
的
?
nlp
、
svm
、
deep-learning
当我读到“用于句子分类
的
卷积神经网络”时,我注意到该论文实现了“CNN-非静态”
模型
--一个
使用
来自
word2vec
的
预训练
向量
的
模型
,所有的
单词
--包括随机初始化
的
未知
单词
,和预训练
向量
对每个任务都进行了微调所以我只是不明白
预先
训
练好
的
向量
是
如何
对每个任务进行微调
的
。因为据
浏览 4
提问于2016-10-18
得票数 1
1
回答
处理大量
使用
ML
模型
的
请求
django
、
memory-management
、
machine-learning
、
word2vec
、
gensim
我正在建立一个聊天机器人,其中每个用户发送
的
消息需要转
换为
一个
向量
(为其他ML相关
的
工作)。我正在
使用
一个
预先
训
练好
的
Word2Vec
模型
来做这件事。
Word2Vec
模型
是
使用
Gensim库创建
的
,并作为600MB文件保存到磁盘上,并在Django/Python web应用程序中
使用
。每次接收到作为API请求
的
浏览 0
提问于2017-11-20
得票数 0
1
回答
如何
找到上下文相关
的
单词
并将其分类为自定义标记/标签?
machine-learning
、
neural-network
、
classification
、
nlp
、
text-mining
问题:现在主要
的
问题是基于上下文来找出两个
单词
之间
的
关系,但我无法决定找到它
的
参数是什么。 我尝试过一种
使用
data
浏览 0
提问于2017-11-06
得票数 1
回答已采纳
1
回答
如何
使用
word2vec
生成句子
向量
?
python
、
nlp
、
word2vec
我想
使用
word2vec
技术生成句子
的
向量
。我已经开发了这段代码,但得到了一个错误。import pandas as pddf = pd.read_csv('after stopwords.csv')model =
Word2Vec
(sentences=vocab, size=100, window=10, min_count=3, wor
浏览 24
提问于2021-10-07
得票数 0
3
回答
有没有可能从python
的
句子语料库中重新训练一个
向量
模型
(例如GoogleNews-
word2vec
-negative300.bin)?
python
、
nlp
、
gensim
、
word2vec
我正在
使用
预先
训
练好
的
Google新闻数据集,通过
使用
python中
的
Gensim库来获取
单词
向量
。model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) 加载
模型
后,我
将
训练评论句子转
换为
向量
过程中,我
的
语料库中
的
浏览 2
提问于2016-02-01
得票数 11
2
回答
项名
的
字嵌入(整数,一次热编码)
python
、
nlp
、
word-embeddings
、
word
我正在寻找
的
方法,以获得两个项目名称之间
的
相似性
使用
整数编码或一热编码。 我有10万个项目名称,由2~3个
单词
组成,如上所示。我想把(项目名称,大小,单位)作为
向量
。要做到这一点,我需要用某种方式
将
文本转
换为
数字。我所发现
的
只是
word2vec
的
东西,但我
的
案件没有上下文。因此,我认为不可能从我
的
数据中了解到一些上下文。
浏览 0
提问于2019-06-20
得票数 1
3
回答
查找
单词
之间
的
余弦相似度
python
、
scikit-learn
、
nlp
、
sklearn-pandas
、
cosine-similarity
有没有可能找到两个词之间
的
相似性?cosine_similarity('kamra', 'cameras')ValueError: could not convert string to float: 'kamra'('kamra').toarray() 我
的
目标是检查与字典中
的
两个值(
列表
)
浏览 4
提问于2020-11-11
得票数 0
1
回答
如何
获取
word2vec
词汇表中不存在
的
单词
的
向量
?
python-3.x
、
pandas
、
word2vec
、
gensim
、
text-classification
我已经检查了之前
的
帖子,但它似乎不适用于我
的
情况:import gensim 现在我有了一个包含关键字
的
我想要在相应
的
列中为每个关键字添加
向量
,但是当我
使用
model['cambodia']时,它会抛出错误,因为它是KeyError: "word
浏览 0
提问于2018-07-04
得票数 6
2
回答
从已清理
的
数据中
使用
代理语句
python
、
nlp
、
gensim
、
word2vec
、
word-embedding
Gensim
的
Word2Vec
模型
将
包含单个标记/句子
单词
的
内部
列表
的
列表
作为输入。据我所知,
Word2Vec
用于
使用
向量
“量化”文本中
单词
的
上下文。我目前正在处理一个文本语料库,这些文本已经被分割成单独
的
标记,并且不再包含明显
的
句子格式(标点符号已被删除)。我想知道
如何
将<
浏览 0
提问于2018-07-10
得票数 0
1
回答
添加一个
Word2Vec
嵌入
列表
是否提供了一个有意义
的
表示?
nlp
、
word2vec
、
embedding
、
language-model
我
使用
了一个
预先
训练过
的
word2vec
模型
(Word2vec-google 300)来获取给定
单词
列表
的
嵌入信息。请注意,这不是标记句子后得到
的
单词
列表
,而是描述给定图像
的
单词
列表
。现在我想得到整个
列表
的
一个
向量
表示。添加所有单独
的
单词
嵌入是否有意义?还是
浏览 5
提问于2021-06-01
得票数 0
回答已采纳
2
回答
从deeplearning4j和
word2vec
获得不同
的
结果
word2vec
我用
谷歌
的
word2vec
训练了一个
单词
嵌入
模型
。输出是一个包含
单词
及其
向量
的
文件。 Collection<String> lst = vec.wordsNearest("someWord&
浏览 13
提问于2015-09-23
得票数 0
1
回答
将
向量
加载到gensim
Word2Vec
模型
--而不是KeyedVectors
machine-learning
、
nlp
、
word2vec
、
gensim
、
word-embedding
我正在尝试
将
一些
预先
训
练好
的
向量
加载到gensim
Word2Vec
模型
中,这样它们就可以用新数据重新训练。我
的
理解是我可以和gensim.Word2Vec.train()一起做再培训。但是,我能找到
的
加载
向量
的
唯一方法是
使用
gensim.models.KeyedVectors.load_word2vec_format('path/to/file.bi
浏览 3
提问于2018-02-09
得票数 4
1
回答
word2vec
语音对焦
python
、
word2vec
我
使用
word2vec
将我
的
单词
表示为
向量
。text = np.loadtxt("file.txt", dtype=str, delimiter=" ")print(len(word2vec.wv.vocab)) 文本是
单词
(字符串)
的
列表
。这段代
浏览 0
提问于2017-07-14
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券