为什么我在c中的矩阵乘法代码总是给出无用的值？(使用共享内存和fork)

c、unix、fork、shared-memory

这是我用c编写的代码，用来做矩阵乘法，实现fork和共享内存。看起来我得到的值大部分是垃圾值。也许我没有初始化数组C的值，它首先是结果数组。(我是C语言的初学者，这是我第一次使用

浏览 29提问于2021-02-25得票数 0

回答已采纳

1回答

C fork的问题，错误的结果，可能是共享内存

c、fork、shared-memory

我有一个任务是用fork做一个矩阵乘法，使用共享内存，然后将时间结果与没有fork的乘法进行比较，所以这是没有fork的乘法：int matrizB[An][matrizR[a][b] += matrizA[a][c] * matrizB[c][b]; }

浏览 0提问于2015-09-30得票数 1

2回答

rootbeer CUDA示例代码量化吞吐量增益

cuda、rootbeer

以下是我在装有Ubuntu 12.04 (精确)的笔记本电脑上运行的Nvidia CUDA的rootbeer示例代码，带有bumblebee和optirun。我几乎没有获得任何吞吐量收益。有什么问题吗？

浏览 3提问于2012-11-08得票数 1

回答已采纳

2回答

可以通过pnacl加速webgl矩阵乘法吗？

javascript、matrix、webgl、google-nativeclient

javascript中矩阵乘法运算性能差是高性能webgl的一个障碍。所以我正在考虑使用pnacl来加速它。理想情况下，我希望将ArrayBuffer(Float32Array)和矩阵传递给pnacl，然后使用本机代码完成乘法并更新缓冲区中的值，最后通知页面(Javascript)。但我怀疑pnacl和page javascri

浏览 9提问于2016-02-23得票数 2

1回答

任意精度算法的CUDA实现

matrix、cuda、matrix-multiplication、arbitrary-precision

我必须乘两个非常大的(~ 2000×2000)稠密矩阵，它们的条目是具有任意精度的浮动(我使用的是GMP，其精度目前设置为600)。我想知道是否有支持任意精确算法的CUDA库？我找到的唯一一个库叫做CAMPARY，但是它似乎缺少了对一些已使用函数的引用。我正在考虑的另一个解决方案是实现Karatsuba算法<

浏览 3提问于2016-04-27得票数 4

1回答

GPU上所需的计算内存比(OP/B)

performance、cuda、gpu、metrics

我试图理解和了解GPU的架构，以及我们如何评估我们的程序在GPU上的性能。我知道应用程序可以是：下面的图像显示了每个微体系结构的触发器速率、峰值

浏览 8提问于2020-02-16得票数 1

回答已采纳

1回答

用SIMD和openMP加速矩阵乘法

c、multithreading、performance、parallel-processing、openmp

我试图加快矩阵乘法的速度，这样它的性能就比简单的实现要好得多。我的目标是把速度提高到150倍。到目前为止，我在实现过程中尝试了以下几点： 使用</em

浏览 1提问于2020-11-17得票数 2

回答已采纳

1回答

numpy矩阵乘法形状

python、numpy、matrix-multiplication

在矩阵乘法中，假设A是3x2矩阵(3行，2列)，B是2x4矩阵(2行，4列)，那么如果矩阵C = A * B，则C应该具有3行4列。为什么numpy不做这个乘法呢？当我尝试下面的代码时，我得到一个错误：ValueError: operands could not be broadcast together with shapes (3,2) (2,4) a = n

浏览 4提问于2013-08-15得票数 5

回答已采纳

1回答

将尖头稀疏矩阵变量封装在推力指针中

cuda、max、sparse-matrix、thrust、cusp-library

我用尖来做稀疏矩阵乘法。从结果矩阵中，我需要最大值，而不需要将矩阵从设备内存复制到主机内存。我计划将结果矩阵封装在推力装置指针中，然后使用函数thrust::max_element获得最大元素。如果C是乘积稀疏矩阵，则C.colum

浏览 2提问于2012-10-30得票数 0

回答已采纳

5回答

是否有任何公式可以知道fork()是如何对当前进程进行近乎完美的复制的？

c、fork

#include <stdio.h>{ fork(); }我很困惑，如果我把n=1，它打印Hello2次。以此类推。

浏览 0提问于2014-02-18得票数 1

2回答

创建的进程不能并行执行

c、linux、process、fork

我在共享内存中得到了一个整数矩阵，有n个列，所以我创建了n个进程，每个进程都生成一个colum的和。问题是它们不能并行执行。这里有代码(这实际上不做和，被用来测试)： i=0; pid2[i] = fork(); if(pid2[i]==-1)printf("fork() fail!，它按照

浏览 3提问于2016-02-28得票数 0

回答已采纳

1回答

矩阵乘法:在CUDA中合并全局内存访问后性能下降

parallel-processing、cuda、gpu、matrix-multiplication

我最近开始使用CUDA与GPU合作。作为一个启动程序，我试图高效地实现一个简单的矩阵乘法。C= AB 从朴素矩阵乘法开始(每个线程为C中的一个元素加载A和B的所有元素)，平铺实现(线程在共享内存中将A和B中的元素块协同加载以减少全局<

浏览 2提问于2018-08-06得票数 1

回答已采纳

1回答

具有CUSPARSE库的并发内核

cuda、nvidia

我想问您一个关于Nvidia GPU中并发内核执行的问题。我解释我的情况。我有一个代码，它为两个不同的矩阵启动一个稀疏矩阵乘法(每个一个)。这些矩阵乘法是用cuSPARSE库执行的。我希望两个操作都可以同时执行，所以我使用两个流来启动它们。使用Nvidia可视化分析器，<em

浏览 1提问于2015-10-02得票数 0

回答已采纳

5回答

java中的矩阵乘法

java、r、matrix-multiplication

我想用Java做矩阵乘法，速度需要很好。不过，我有几个问题：我离开公司的同事是一名C#程序员，他被迫编写涉及矩阵

浏览 3提问于2010-04-17得票数 1

1回答

为什么翻译矩阵需要额外的行？

matrix、transformation

我对矩阵有些熟悉，我得出的结论是向量和矩阵乘法实际上是2x2和2x1矩阵的乘法：开始{方程*}开始{b矩阵}a&c&d\结束{b矩阵} \qquad \开始{b矩阵}x\y\结束{b矩阵}{方程*}在文章中，作者发现除了旋转之外，要完成平移，我们需要在翻译<

浏览 0提问于2018-06-26得票数 1

回答已采纳

1回答

将结构复制到设备内存CUDA

c++、cuda

我是数据自动化系统的新手，并且浏览过数据自动化系统的工具包文档。在这里，我发现了一个例子，矩阵乘法使用共享内存。这里，当将矩阵结构从主机内存复制到设备内存时，只复制数据元素。我无法理解的是其他变量是如何被复制到设备内存中的。;

浏览 3提问于2016-11-09得票数 2

回答已采纳

1回答

如何使用mmap和shm_open在多个独立进程之间共享内存

c++、c、linux、shared-memory、mmap

我想在进程之间共享内存，这些进程独立运行，而不是fork。我已经阅读了mmap和shm_open的手册页，仍然对使用感到困惑。在我看来，共享内存应该是在不同进程之间映射虚拟内存空间的机制，但是为什么mmap有fd参数呢？这是否意味着内存实际上是通过文件共享的？而且，shm_open似乎接受一

浏览 0提问于2019-07-19得票数 3

回答已采纳

2回答

顶点着色器中的转换仅适用于后乘。

opengl、matrix、glsl、shader

我目前正在学习OpenGL和GLSL，编写一个简单的软件来加载模型、在屏幕上显示它们、转换它们等等。作为第一阶段，我没有使用OpenGL编写了一个纯C++程序.它工作得很好，并且使用了行主矩阵表示： <em

浏览 4提问于2016-06-01得票数 8

回答已采纳

5回答

如何在C中与Linux一起使用共享内存

c、linux、fork、shared-memory

我的一个项目有点问题。我一直试图找到一个在fork()中使用共享内存的文档丰富的示例，但没有成功。基本上，当用户启动程序时，我需要在共享内存中存储两个值：current_path (即char* )和file_name (也是char* )。根据命令参数，使用fork()启

浏览 8提问于2011-04-13得票数 153

回答已采纳

3回答

C++程序在数百万次执行后的稳定性

c++、multithreading、matrix、stability

我在C++中有一个程序，主要执行矩阵乘法、加法等等。当一个问题被执行了数百万次和几个小时时，有没有可能出现的问题？有关计划的详情：没有内存泄漏，<

浏览 5提问于2013-09-21得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

C fork的问题，错误的结果，可能是共享内存

rootbeer CUDA示例代码量化吞吐量增益

可以通过pnacl加速webgl矩阵乘法吗？

任意精度算法的CUDA实现

GPU上所需的计算内存比(OP/B)

用SIMD和openMP加速矩阵乘法

numpy矩阵乘法形状

将尖头稀疏矩阵变量封装在推力指针中

是否有任何公式可以知道fork()是如何对当前进程进行近乎完美的复制的？

创建的进程不能并行执行

矩阵乘法:在CUDA中合并全局内存访问后性能下降

具有CUSPARSE库的并发内核

java中的矩阵乘法

为什么翻译矩阵需要额外的行？

将结构复制到设备内存CUDA

如何使用mmap和shm_open在多个独立进程之间共享内存

顶点着色器中的转换仅适用于后乘。

如何在C中与Linux一起使用共享内存

C++程序在数百万次执行后的稳定性

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐