我用的是Gensim软件包。但是,当我想加载word2vec模型时,gensim.downloader函数似乎不存在。
w2v = gensim.downloader.load('word2vec-google-news-300')收到错误消息:
AttributeError: module 'gensim' has no attribute 'downloader'我使用dir()方法检查了gensim目录,下面是我得到的内容:
['__builtins__','__cached__','__doc__','__file__','__loader__','__name__','__package__','__path__','__spec__','__version__','_matutils','corpora','interfaces','logger','logging','matutils','models','parsing','similarities','topic_coherence','utils']似乎下载程序方法不在目录中。我想知道是否有另一种方法可以下载带有gensim库的特定预培训模型,以及gensim下载器有什么问题。
我的gensim版本是4.2.0。
发布于 2022-08-01 04:43:34
如果您遵循一些示例代码,您应该准确地复制它的导入&代码。我不认为您会发现有任何文档/示例建议以您尝试的方式使用gensim.downloader模块。
更广泛地说:我建议不要使用gensim.downloader。它隐藏它检索的数据的实际源、本地路径和返回类型,并从网络运行新代码,这不是Gensim项目源代码的一部分,也不是版本化的Gensim版本的一部分。(这是一个粗略的软件工程实践。)
相反,直接从某个主机下载GoogleNews数据集,将确切的原始文件保存到您选择的特定位置。检查下载以了解它们的文件名/格式(必要时解压缩)。
然后使用其他Gensim方法(如KeyedVectors.load_word2vec_format() )从特定的已知本地文件路径加载,并带有特定文档类型的返回对象。
您的代码(以及您自己的理解)将更加清晰、健壮和安全。
https://stackoverflow.com/questions/73188799
复制相似问题