问题是,代码太慢了,我无法在我真正需要的训练集上测试它。我的训练集是~1200x5600,其中有1200个数据点和5600个特征。我需要计算每一行中每个特征的平方差之和,然后选择最相似的另一行。我相信永远要花费的是距离循环(triple for loop)。
我已经包含了sklearn IRIS数据集中的一个小训练集用于测试。如果任何人有任何建议,以加快这一点,以便我可以测试我的其他代码在一个合理的
对于每一次模拟,我计算一个指标,它告诉我模拟是否正在改进(较低的索引)。要做到这一点,我使用的是scipy.optimize.minimize,但我不确定哪种方法是最好的(我正在努力学习更多)。(Data_from,Data_to,simulation,results) return value
每个参数在我用“界”表示的范围内变化。当我启动模拟时,每个参数都会随