我在MATLAB中设置了两个相同的测试&关于广播矩阵乘法的Python。对于Python,我使用了NumPy,对于MATLAB,我使用了使用BLAS的库。import timeitimport matplotlib.pyplot as plt
N = 1000 + 100 # a few initial runs是从pip安装的默认Python,它使用OpenBL
我有一个有784个输入,30个隐藏神经元和10个输出神经元的神经网络。主要的性能问题是反向传播。目前,一次反向传播需要大约0.1秒的时间。由于我的训练集是6万个例子,这将需要很长的时间,我甚至确认我的算法是有效的。只是想知道如何在不涉及tensorflow的情况下加速/并行它。for i in range(len(weights2)):
sub_list = [