我正试图加速并行化的pymc3采样,我只看到了有限的好处.
在njobs=1 Pro上,我能够将总运行时间从25分钟(njobs=1)减少到13分钟(njobs=6)。由于pymc实际开始取样大约需要4分钟,所以增幅相对较小。
问题是,是否有人成功地使用GPU与pymc3,我可以得到多少好处的模型,需要6-8分钟的样本?(我的MacBook有nvidia GT 750m2GB)
发布于 2015-07-23 00:25:25
我在Intel i7-4930上运行Linux。
我运行了一个PyMC3模型,它在CPU上运行了90分钟(利用所有内核),但在我的GeForce GTX 970上只花了18分钟。
所以速度快了近5倍。
https://stackoverflow.com/questions/27382474
复制相似问题