我很可能遗漏了一些显而易见的东西,但在spacy的英语媒体模型中,使用了什么方法/模型来训练标记向量?是word2vec吗?深度学习架构?只是好奇是什么用来估计这些嵌入。
发布于 2021-03-03 15:44:04
英语向量是GloVe公共爬网向量。大多数其他语言都有来自OSCAR Common Crawl + Wikipedia的自定义fastText向量。这些源应该包括在模型元数据中,但看起来矢量信息在3.0.0模型版本中被意外遗漏了。
https://stackoverflow.com/questions/66446435
复制相似问题