我已经使用Watson Studio完成了一些基本的课程工作;是否可以将二进制形式的Google Word向量(.bin)加载到Watson Studio中?
发布于 2019-03-05 06:38:16
当然,您可以在watson studio Notebook中读取二进制格式的文件,从技术上讲,还可以读取任何类型的文件。
首先,您需要将GoogleNews-vectors Negative300.bin.gz的二进制zip文件上传到watson studio数据资产,您可以将其拖放到文件区。完成后,您可以使用project-lib
将该文件读取到二进制对象中。
my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")
import gzip
gzip_f = gzip.GzipFile(fileobj=my_file)
!pip install gensim
导入gensim
# Load Google's pre-trained Word2Vec model.
model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)
https://stackoverflow.com/questions/54990768
复制