问spacy's token vectors (英语)中使用的模型架构是什么
EN

Stack Overflow用户

提问于 2021-03-03 04:11:26

回答 1查看 49关注 0票数 1

我很可能遗漏了一些显而易见的东西，但在spacy的英语媒体模型中，使用了什么方法/模型来训练标记向量？是word2vec吗？深度学习架构？只是好奇是什么用来估计这些嵌入。

回答已采纳

发布于 2021-03-03 15:44:04

英语向量是GloVe公共爬网向量。大多数其他语言都有来自OSCAR Common Crawl + Wikipedia的自定义fastText向量。这些源应该包括在模型元数据中，但看起来矢量信息在3.0.0模型版本中被意外遗漏了。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66446435

复制

相似问题

问spacy's token vectors (英语)中使用的模型架构是什么EN