我正在尝试保存我的优化高斯进程模型,以便在不同的脚本中使用。我目前的想法是利用GPy内置的to_dict
和from_dict
函数将模型信息存储在json文件中。大致是这样的:
import GPy
import numpy as np
import json
X = np.random.uniform(-3.,3.,(20,1))
Y = np.sin(X) + np.random.randn(20,1)*0.05
kernel = GPy.kern.RBF(input_dim=1, variance=1., lengthscale=1.)
m = GPy.models.GPRegression(X, Y, kernel)
m.optimize(messages=True)
m.optimize_restarts(num_restarts = 10)
jt = json.dumps(m.to_dict(save_data=False), indent=4)
with open("j-test.json", 'w') as file:
file.write(jt)
这一步没有问题,但是我在尝试使用以下命令加载模型信息时遇到了问题:
with open("j-test.json", 'r') as file:
d = json.load(file) # d is a dictionary
m2 = GPy.models.GPClassification.from_dict(d, data=None)
这给了我一个断言错误,因为“数据不是None”--至少我是这么认为的。
我对GPy和jsons的使用都是新手,所以我真的不确定我在哪里走错了路。我试着查看了文档,但文档有点模糊,我找不到它的用法示例。是否有我遗漏的步骤/概念?另外,这是存储和重新加载模型的最佳方式吗?在这方面的任何帮助都将非常感谢!谢谢!
发布于 2020-10-27 23:44:52
模块pickle在这里是你的朋友!
import pickle
with open('save.pkl', 'wb') as file:
pickle.dump(m, file)
您可以在将来的脚本中使用以下命令回调它:
with open('save.pkl', 'rb') as file:
loaded_model = pickle.load(file)
发布于 2021-10-28 15:49:19
没有建议将泡菜作为执行此操作的推荐方法。请参见末尾部分中的here。下面是相同的示例。
# let X, Y be data loaded above
# Model creation:
m = GPy.models.GPRegression(X, Y)
m.optimize()
# 1: Saving a model:
np.save('model_save.npy', m.param_array)
# 2: loading a model
# Model creation, without initialization:
m_load = GPy.models.GPRegression(X, Y, initialize=False)
m_load.update_model(False) # do not call the underlying expensive algebra on load
m_load.initialize_parameter() # Initialize the parameters (connect the parameters up)
m_load[:] = np.load('model_save.npy') # Load the parameters
m_load.update_model(True) # Call the algebra only once
print(m_load)
https://stackoverflow.com/questions/64557786
复制相似问题