腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
一种
方法
可以
让
我
在
doc2vec
中
获得
每个
段落
对应
的
向量
列表
?
、
有没有
办法用
doc2vec
查看我
在
词汇表
中
按
段落
而不是按
每个
单词得到
的
向量
。通过使用model.wv.vectors,
我
可以
得到
每个
单词
的
所有
向量
。现在,
我
需要它来对嵌入
的
段落
应用聚类算法,
我
希望能
获得
这些
段落
。不过,
我
不确定这种
方
浏览 6
提问于2020-05-03
得票数 0
回答已采纳
2
回答
doc2vec
-如何更快地推断文档
的
向量
?
、
、
、
我
已经训练了大约2300个
段落
的
段落
向量
(
每个
段落
在2,000-12000个单词之间),
每个
段落
的
向量
大小为300。现在,
我
需要推断大约100,000个句子
的
段落
向量
,
我
认为这些句子是
段落
(
每个
句子大约有10-30个单词,
每个
句子
对应
于前面
浏览 1
提问于2016-09-20
得票数 5
1
回答
什么是gensim
的
“docvecs”?
、
、
、
以上图片来自,本文介绍了
Doc2Vec
。
我
正在使用Gensim
的
Word2Vec和
Doc2Vec
的
实现,这两种实现都很棒,但我想了解几个问题。对于给定
的
doc2vec
模型dvm,dvm.docvecs是什么?
我
的
印象是,包含所有单词嵌入和
段落
向量
d
的
是平均
向量
或级联
向量
。这是正确
的
,还是d?假设dvm.docvecs不
浏览 9
提问于2017-01-18
得票数 5
回答已采纳
1
回答
如何
获得
新
段落
的
段落
向量
?
、
、
我
有一组用户及其内容(
每个
用户有一个包含该用户
的
tweet
的
文档)。
我
计划对
每个
用户使用某种大小N
的
分布式
向量
表示。
一种
方法
是
在
twitter数据上获取预先训练过
的
字
向量
,并将它们平均得到用户
的
分布
向量
。
我
计划使用
doc2vec
来
获得
更好
的
results.B
浏览 3
提问于2017-03-27
得票数 1
回答已采纳
1
回答
如何比较
段落
之间
的
相似之处
、
、
、
我
一直
在
试验NLP,并使用
Doc2Vec
模型。不过,
我
想把这个问题扩展至比较问题
的
主体。例如,就像堆栈溢出一样,
我
正在为
浏览 4
提问于2021-08-10
得票数 0
1
回答
用
Doc2vec
查找不同文档
中
1段
的
相似性
、
、
、
如何找到一个目标
段落
或文档,与语义相似的目标
段落
的
其他文档
列表
相似。model.dv))输出现在,
我
如何能够匹配目标数据来训练数据,以及如何知道它们有多相似,有什么
方法
可以
将相似度缩放成百分比呢?
浏览 4
提问于2022-07-03
得票数 0
回答已采纳
1
回答
为
doc2vec
加载预先训练好
的
word2vec模型
、
、
、
、
我
正在使用gensim从文档中提取特征
向量
。
我
已经从谷歌下载了名为GoogleNews-vectors-negative300.bin
的
预训练模型,并使用以下命令加载了该模型:
我
的
目的是从文档
中
获取特征
向量
。一句话,很容易得到相应
的</
浏览 1
提问于2017-02-09
得票数 3
回答已采纳
1
回答
从
每个
文档
的
经过训练
的
Doc2Vec
模型
中
获取数值
向量
、
、
、
这是
我
第一次使用
Doc2Vec
对一个作者
的
作品进行分类。
我
使用带标签
的
句子(
段落
或指定长度
的
字符串)训练了一个模型,其中单词=
段落
中
的
单词
列表
,标签=作者姓名。
在
我
的
例子
中
,
我
只有两个作者。
我
尝试访问训练模型
中
的
docvecs属性,但它只包含两个元素,<em
浏览 6
提问于2017-11-07
得票数 0
2
回答
Word2vec:
在
每个
上下文中添加外部单词
、
我
正在寻找一个简单
的
"hack“来实现以下想法:
我
想
让
一个特定
的
单词人为地出现在
每个
单词
的
上下文中(潜在目标是尝试使用word2vec进行有监督
的
句子分类)。最好
的
例子是:(dog, The), (do
浏览 18
提问于2017-06-28
得票数 1
回答已采纳
1
回答
R包'word2vec‘
doc2vec
函数
、
、
我
是一名学生(计算机科学)。这是
我
在
堆栈溢出
中
的
第一个问题。
我
真的很感谢你
的
帮助!(
我
所指
的
包称为'word2vec',这就是为什么标签/标题有点
让
人费解
的
原因。)在对
doc2vec
函数
的
描述(这里是)
中
,它说: 文档
向量
是以
向量
空间
的
尺度来标准化文档
的
浏览 0
提问于2020-11-10
得票数 0
回答已采纳
1
回答
标签在
Doc2Vec
TaggedDocument
中
的
用途是什么?
、
这些文档和教程并没有解释这一点;它们似乎假设了
我
所没有的理解水平。这些答案很接近,但并没有明确地说:
浏览 7
提问于2022-08-05
得票数 0
回答已采纳
3
回答
Gensim:
doc2vec
是一个模型还是一个操作?与R执行
的
差异
、
、
、
、
我
的
任务是将文档
向量
模型投入生产。
我
是一个R用户,所以我
的
原始模型
在
R
中
。我们
的
途径之一是用Python重新创建代码和模型。离线 单词
向量
是使用text2vec包
中
的
函数(即GloVe或GlobalVectors )
浏览 45
提问于2021-06-17
得票数 1
回答已采纳
1
回答
doc2vec
模型给出了非字典词
的
准确性吗?
、
、
我
在
语料库中有混合词
的
句子(字典和非字典词).非字典词是重要
的
,因为它们是特定
的
领域。
我
不会对非字典词执行任何nlp。
doc2vec
模型是否将非字典词与同一词
在
匹配标准上进行比较? 例如。
我
正在输入'AMDML','release‘。这里,AMDML是特定于域
的
单词。如果
我
在
训练模型中有像'AMDML','release&
浏览 1
提问于2021-01-23
得票数 1
回答已采纳
2
回答
doc2vec
(gensim) infer_vector需要窗口大小
的
填充句吗?
、
根据最初
的
论文,对看不见
的
段落
的
推断
可以
通过 训练“推理阶段”,为新
段落
(从未见过)提供
段落
向量
D,
方法
是
在
D
中
添加更多
的
列,
在
D上增加梯度,同时保持W、U、b固定。这个推理阶段
可以
用infer_vector()
在
gensim
中
完成。如果
我
有window = 5 for
doc2vec
浏览 2
提问于2018-05-29
得票数 1
2
回答
如何利用文字嵌入来进行文档分类等?
、
、
、
、
我
刚开始学习NLP技术,如GPT,Bert,XLnet,word2vec,Glove等,
我
尽力阅读论文和查看源代码。但我仍然不能很好地理解。当我们使用word2vec或Glove将一个单词转换成一个
向量
时,它就像: [0.1,0.1,0.2...]如果要用随机森林等传统
方法
对文档进行分类,那么如何使用这些数据呢?
我
被告知伯特或其他NLP模型
可以
做到这一点。但是
我
真的很好奇嵌入这个词
在
传统
方法
中
是如何应用
的</
浏览 0
提问于2019-09-24
得票数 1
回答已采纳
1
回答
词嵌入是如何实现词相似度
的
?
、
、
、
我
正在尝试应用word2vec/
doc2vec
来找到类似的句子。首先,考虑word2vec
的
词相似性。
我
所理解
的
是,CBOW
可以
用来在给定
的
上下文中找到最合适
的
单词,而Skip-gram是用来查找给定某个单词
的
上下文
的
,所以在这两种情况下,
我
都得到了频繁发生
的
单词。但是找到类似的词是如何工作
的
呢?
我
的
直觉是,由于相似的
浏览 0
提问于2017-12-05
得票数 1
回答已采纳
2
回答
文档相似性:
向量
嵌入与BoW性能?
、
、
、
、
我
有一组文档,
每个
文档都随着时间
的
推移而迅速增长。任务是在任何固定时间找到类似的文件。
我
有两种可能
的
方法
:tf-以色列国防军或其变异,如BM25。其中之一会产生更好
的
效果吗?是否有人对tf与平均word2vec
的
文档相似性做了定量比较? 还有另
一种
<e
浏览 0
提问于2017-03-07
得票数 4
1
回答
AttributeError: python模块
中
的
“list”对象没有属性“word”
、
、
、
、
在
使用
doc2vec
进行培训时,
我
得到了以下错误:# Extracting titles from csv to list reader =
我
使
浏览 2
提问于2018-01-04
得票数 1
回答已采纳
1
回答
如何在gensim 0.11.1
中
从
Doc2Vec
中
获得
文档
向量
?
、
、
、
有没有
办法从gensim 0.11.1版本
的
Doc2Vec
中
获取未见和可见文档
的
文档
向量
? 从同样
的
词汇?
浏览 6
提问于2016-06-11
得票数 5
回答已采纳
3
回答
使用无神经网络
的
预训练词
向量
进行文本分类
、
、
、
背景:
我
一直
在
我
的
数据集上评估各种文本分类
方法
,包括使用从字数统计和TF-IDF派生
的
特征
向量
,然后通过各种分类器运行这些
方法
。
我
的
数据集非常小(大约2300个句子和大约5个类),考虑到上述
方法
将不同
的
方法
视为完全独立
的
方法
,希望使用词
向量
方法
进行分类。
我
使用了带有浅层神经网
浏览 0
提问于2019-01-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于Doc2vec训练句子向量
打造工业级推荐系统(十一):基于内容的推荐算法
文本表示简介
AI研究新利器Etymo,妈妈再也不用担心我找不到论文!
Uber的一键式聊天智能回复系统
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券