这是矩阵乘法的优化实现,这个例程执行矩阵乘法操作。C := C+ A * B (其中A、B和C是以列主要格式存储的n对n矩阵),A和B保持它们的输入值。C[i + j * n] = cij; // allocate the final result into C }}函数matmul_optimize
我试图用多线程实现矩阵乘法。一切看起来都是正确的,然而,它的工作速度比通常的算法慢得多。result2[i][j] = temp; //writing the resulting element to the resulting matrix }在这里,我为结果矩阵中的每个元素创建一个新线程我将这些线程写入数组,启动它们,最后等待它们完成工作。我已经看到了一些实现,其中整个输入矩阵(它们都是)将作为线程</e