doc2vec原理 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

添加句子的内嵌词来表示句子是一种很好的方法吗？

、、

我有一个非英语语言的句子数据集，如：word5 word1 word2我想也许我可以使用像word2vec这样的算法，把每个单词转换成一个固定大小的向量，然后添加所有这些来表示句子，这是一种有意义的方法吗？这比添加单词的热向量来表示句子好吗？有比这两种方法更好的方法吗？ EDIT1:基本上，我有一个随机可变长度句子的数据集，我想以最好的方式嵌入它们，这意味着在结果的嵌入向量中保留尽可能多的信息(它们都有相同的大小)。

浏览 0提问于2020-08-19得票数 0

回答已采纳

1回答

用于字嵌入的Doc2Vec或Word2vec

、、、、

使用Doc2vec进行word嵌入(取代word2vec )有什么好处吗？另一方面，如果我用相同的数据集训练word2vec和doc2vec，我会有相同的单词向量吗？

浏览 0提问于2017-04-03得票数 1

回答已采纳

1回答

如何通过R中的网格使用TaggedDocument函数(Gensim \ Doc2Vec)？

、、、

更具体地说，我正在尝试构建一个doc2vec模型，为此需要准备一个标记和标记集。import pandas as pdfrom gensim.models.doc2vec import Doc2Veclibrary(reticulate) Doc2Vec <- gensim$models$Doc2Vec

浏览 8提问于2020-04-30得票数 1

1回答

Doc2Vec的实际应用是什么？

、、、、

我是Doc2Vec的新手。据我所知，Doc2Vec根据它们的文字上下文对类似的文档进行分组。因此，我有兴趣知道；Doc2Vec算法的实际应用是什么？

浏览 0提问于2017-10-09得票数 4

回答已采纳

1回答

当我不得不手动运行迭代时，在Doc2Vec和训练中，时代意味着什么？

、、

我正在尝试理解Doc2Vec函数中的Doc2Vec参数和train函数中的epochs参数。documents = Documents(train_set) model = Doc2Vec(vector_size=100, dbow_words

浏览 0提问于2018-07-09得票数 7

回答已采纳

1回答

如何在tensorflow.js中训练doc2vec模型？

、、、、

我需要在前端部署doc2vec模型，我正在寻找tensorflow.js框架。我需要在tensorflow.js中训练一个doc2vec模型，以便将其部署到浏览器上。可以在tensorflow.js中训练doc2vec模型吗？

浏览 6提问于2020-12-29得票数 0

1回答

Doc2Vec错误

、、、、

我正在尝试训练一个嵌入到预处理段落上的Doc2Vec单词。我已经删除了标点符号，并执行了标记化、pos标记和分块。import nltkfrom gensim.models.doc2vec import Doc2Vecne_tree = ne_chunk(pos_tag(word_tokenize(sent_pun))) 当我运行Doc2Vec模型时，我得到了错误

浏览 6提问于2018-07-20得票数 0

1回答

Doc2Vec网络体系结构

、

我一直在熟悉Word2Vec和Doc2Vec。在阅读了多篇论文，包括T( Doc2Vec的创建者)的论文之后，我不清楚Doc2Vec的神经网络是什么样的。Doc2Vec是如何改变事物的？

浏览 0提问于2018-07-12得票数 1

1回答

属性错误: Countvectorizer没有属性load_specials

、、

我尝试了很久，但无法修复下面的错误。文件"C:\amnpawar\AIenv\lib\site-packages\gensim\models\deprecated\doc2vec.py"，第91行，在load_old_doc2vec中文件"C:\amnpawar\AIenv\lib\site-packages\gensim\models\deprecated\word2vec.py"，第1617行，加载 model = super(Word2Vec, cls).load

浏览 5提问于2022-12-02得票数 0

1回答

如何在两个不同的文本文件(两个文档)中找到语义相似的段落

、、

我发现了很多类似的问题，没有一个能回答我的问题，有人能帮我吗？我需要找到两个法律文件，它们在上下文上是相同的，或者具有相同的含义，我的方法应该是什么。我想在LSTM中使用一些东西，只要我看到人们有一两个句子可以比较。我想对很多文档这样做，找出它们中哪些是相似的，我不知道如何开始我的任务

浏览 14提问于2019-01-28得票数 0

回答已采纳

4回答

如何将Gensim doc2vec与预先训练好的词向量一起使用？

、、、、

我最近偶然发现Gensim中添加了doc2vec。如何在doc2vec中使用预先训练好的词向量(例如，在word2vec原始网站中找到的)？或者，doc2vec是从用于段落向量训练的相同句子中获得单词向量吗？谢谢。

浏览 1提问于2014-12-14得票数 44

1回答

流水线和GridSearch用于Doc2Vec

、、、

我现在有下面的脚本，可以帮助找到doc2vec模型的最佳模型。它的工作原理如下:首先根据给定的参数训练几个模型，然后对分类器进行测试。最后，它输出最佳的模型和分类器(我希望)。pandas as pdfrom argparse import ArgumentParser import gensim.models.doc2vec fro

浏览 2提问于2018-05-10得票数 7

回答已采纳

1回答

使用文本和数值特性进行聚类

、、、、

我有一个包含两种特征类型的数据集，一种是从doc2vec生成的，另一种是数值特征。我想对它们进行聚类分析。然而，由于doc2vec特性的大小，如果我简单地将它们组合成一个数组，聚类算法就会更多地分配doc2vec特性上的“权重”，如何克服这个问题？例如，对于给定的标签，假设我有来自doc2vec的类似于这个1,2,3,4,5的特性，以及数字特性2。我不想简单地将它们合并到1,2,3,4,5,2中并执行聚类分析。理想情况下，我希望我的聚类算法将数值特征与doc2vec特征同等重要。

浏览 0提问于2021-01-21得票数 1

1回答

分布式Word2Vec & Doc2Vec

、、、

我读到Word2Vec和Doc2Vec往往比LSA和LDA有更好的结果。然而，我也读到了一些关于预先训练过的Word2Vec和Doc2Vec模型的文章。是否有一种以分布式方式使用Word2Vec或Doc2Vec的方法？

浏览 8提问于2022-10-31得票数 0

1回答

gensim LabeledSentence和TaggedDocument有什么区别？

、、、

我的最终目标是使用Doc2Vec模型和任何分类器进行文本分类。我在跟踪这个！'_%s' % item_no]))model_l = Doc2Veclearning ratemodel_t = Doc2Vec你能给我提

浏览 4提问于2016-12-16得票数 8

回答已采纳

2回答

Doc2Vec文档间的文档相似度匹配

、、

我正在用数百个PDF文档创建一个Doc2Vec模型。我有17个文档是这个Doc2Vec的一部分，我想使用这些文档来检查与Doc2Vec模型中其他文档的相似性。

浏览 0提问于2018-12-06得票数 1

1回答

Doc2Vec与BERT的差异

、、、、

我试图理解Doc2Vec和伯特之间的区别。我确实理解doc2vec使用一个段落ID，它也用作段落向量。不过，我不确定这个段落ID是否能更好地理解向量中的上下文？试图理解doc2vec是否也获得了这个上下文，因为在这里，段落id将是不同的(对于doc2vec)。有人能帮忙吗？

浏览 0提问于2022-01-11得票数 0

回答已采纳

1回答

在gensim中，word2vec模型和doc2vec模型的wmdistance是多少？

我想比较两个字符串之间的相似性，我可以用word2vec模型或gensim中的doc2vec模型来计算wmd距离。但我不能理解doc2vec模型的wmd是如何工作的。model:', d2) # wmd distance using a doc2vecmodel: 0.008121068463511764 wmd是否仍然像word2vec模型那样，从doc2vec模型中获取每个单词的单词嵌入？计算w

浏览 17提问于2019-07-18得票数 1

1回答

使用doc2vec的可解释的、有意义的集群

、、、、

我正在使用doc2vec对一组教育文档进行聚类。我一直在尝试的一个策略是过滤掉所有的“胡说八道”的单词，只对那些看起来有意义的单词进行doc2vec培训。我刚刚想到了一件可能有用的事：从每个文档中筛选出无意义的单词(“帮助”、“学生”等)，这些词在这个空格中的意义很小。项目过

浏览 2提问于2018-04-13得票数 2

3回答

Doc2vec(gensim) --我怎么才能推断出看不见的句子的标签？

https://radimrehurek.com/gensim/models/doc2vec.html"aaaaaAAAAAaaaaaa“-”标签1“我们可以推断“aaaaAAAAaaaaAA”标签1使用Doc2vec吗？我知道Doc2vec可以训练单词向量和标签向量。使用这个向量，我们能推断出在哪个标签中没有看到的句子(训练单词的组合)吗？

浏览 0提问于2016-03-09得票数 16

回答已采纳

点击加载更多

添加句子的内嵌词来表示句子是一种很好的方法吗？

用于字嵌入的Doc2Vec或Word2vec

如何通过R中的网格使用TaggedDocument函数(Gensim \ Doc2Vec)？

Doc2Vec的实际应用是什么？

当我不得不手动运行迭代时，在Doc2Vec和训练中，时代意味着什么？

如何在tensorflow.js中训练doc2vec模型？

Doc2Vec错误

Doc2Vec网络体系结构

属性错误: Countvectorizer没有属性load_specials

如何在两个不同的文本文件(两个文档)中找到语义相似的段落

如何将Gensim doc2vec与预先训练好的词向量一起使用？

流水线和GridSearch用于Doc2Vec

使用文本和数值特性进行聚类

分布式Word2Vec & Doc2Vec

gensim LabeledSentence和TaggedDocument有什么区别？

Doc2Vec文档间的文档相似度匹配

Doc2Vec与BERT的差异

在gensim中，word2vec模型和doc2vec模型的wmdistance是多少？

使用doc2vec的可解释的、有意义的集群

Doc2vec(gensim) --我怎么才能推断出看不见的句子的标签？

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐