我正在尝试转换到Spacy3.0的训练配置文件框架,但在调整设置以适应我想要做的事情时遇到了麻烦。简单地说,我想使用一个开箱即用的textcat模型(比方说,词袋),但传入由预先训练的转换器(例如,bert base base)生成的词嵌入,而不进行任何微调。到目前为止,我一直在使用Spacy网站上提供的te
我想用Universal Sentence Encoder on TensorFlow Hub嵌入来计算Word Mover's Distance。我已经在spaCy for WMD-relax上尝试过这个例子,它从spaCy加载'en‘模型,但我找不到另一种方法来提供其他嵌入。在gensim中,它似乎只接受load_word2vec_format文件(file.bin)或load文件(file.vec)。据我所知,有人写了一个Bert</e