腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(4660)
视频
沙龙
1
回答
在
我
的
OpenCL
/
Cloo
(
C#
)
程序
中
,“
零
拷贝
”
比
非
零
拷贝
慢
。
、
、
这可能只是.NET框架分配
的
内存对象没有正确地按页对齐
的
问题,但我不明白为什么
零
复制
比
非
零
复制
慢
。 public float[] M
浏览 30
提问于2017-02-17
得票数 1
1
回答
从操作系统内核访问GPU内存
、
、
目前,我们有一个用户模式模块,它使用
OpenCL
将数据复制到GPU内存和从GPU内存复制数据。 我们更喜欢直接从Windows访问GPU内存
的
方法(从而减少引入
的
f.e
的
开销。通过上下文切换)。
浏览 4
提问于2012-02-10
得票数 0
1
回答
在
实现
零
拷贝
时使用clEnqueueMapBuffer和clEnqueueUnmapMemObject
的
建议方法
我
正在与
opencl
进行深度学习,张量
的
输出大小是固定
的
。它非常高效,因为它只
在
我
的
整个
程序
执行过程中被调用了一次。<
浏览 5
提问于2019-09-28
得票数 2
回答已采纳
1
回答
为什么clEnequeMapBuffer不能映射到原始指针、
OpenCL
、Caffe
、
假设CPU指针(Cpu_ptr_)已经存在,然后
我
为gpu(cl_gpu_mem_)创建了一个缓冲区。"Device claims it supports zero copy"
我
根本不知道为什么会发生这个错误
浏览 18
提问于2016-09-10
得票数 1
回答已采纳
3
回答
AMD
的
OpenCL
是否提供与CUDA
的
GPUDirect类似的功能?
、
、
、
、
我
想知道AMD/ATI是否也有类似的概念?具体地说: 1)
在
与网卡接口时,AMD GPU是否避免了第二次内存传输。如果图形
在
某一时刻丢失,这里描述了GPUDirect对从一台机器上
的
图形处理器获取数据并通过网络接口传输
的
影响:使用GPUDirect,图形处理器内存进入主机内存,然后直接进入网络接口卡。
在
没有GPUDirect
的
情况下,GPU内存在一个地址空间中访问主机内存,然后CPU必须复制内存到另一个主机内存地址空间中,然后它才能访问网卡。如果图形
在
浏览 8
提问于2012-02-15
得票数 12
回答已采纳
2
回答
arm mali gpus上
的
零
拷贝
缓冲区分配?
、
、
、
我
希望
在
arm、马里、midgard、gpus和arm clBuffer上
的
opencl
buffers具有
零
拷贝
行为,以便矢量
的
数据指针和cpus在其生命周期内指向相同
的
位置。
我
尝试过
的
一些事情。
我
为一个向量编写了一个自定义分配器(64字节对齐),然后
我
尝试使用cl_arm_import_memory函数并将向量
的
指针传递给该函数。但问题是,当我查询设备扩展属
浏览 18
提问于2019-10-21
得票数 0
1
回答
默认情况下,“
零
拷贝
网络”是否
在
Linux上实现?
、
我
看到这篇文章:
零
拷贝
网络将在2.4.4.这个补丁由David、Alexey和其他人开发和测试了一段时间,并在2.4.2ac4
中
集成到了"ac“内核系列
中
。
在
某种程度上,
在
一个稳定
的
内核系列中看到这是一个令人惊讶
的
变化,因为它在网络代码中进行了根本性
的
更改。然而,从所有的报告来看,它
浏览 0
提问于2013-08-20
得票数 6
1
回答
Linux下
的
AIO网络套接字和
零
拷贝
、
、
我
一直
在
尝试使用async Linux网络套接字(aio_read等人在aio.h/librt
中
),
我
一直
在
尝试找出这些套接字是否是
零
拷贝
的
。到目前为止,
我
读到
的
几乎所有内容都讨论了文件I/O,而我感兴趣
的
是它
的
网络I/O。 使用AIO有点麻烦,而且
我
怀疑它是不可移植
的
,所以我想知道坚持使用它是否值得。
零</
浏览 0
提问于2010-06-04
得票数 7
回答已采纳
2
回答
谷物和促进序列化使用
零
拷贝
吗?
、
、
、
、
我
在
几种序列化协议(包括FlatBuffers、Cap、Boost序列化和谷物)之间做了一些性能比较。所有的测试都是用C++编写
的
。
我
以为麦片和升级版没有使用
零
拷贝
。但是,序列化时间(对于int和double)几乎为空,序列化对象
的
大小与Cap或Flatbuffe
浏览 7
提问于2017-01-23
得票数 19
回答已采纳
1
回答
简单
的
快速读取过程
、
、
我
想在一个非常
慢
的
设备上解压缩文件
中
的
数据(读取速度=1mo/s)。解压缩算法至少可以执行这个速度
的
三倍。
在
C/C++
中
并行这些任务
的
最快方法是什么,这样读取过程就不会因为解压缩而变慢,从而使用最大
的
带宽。
我
已经用常规管道尝试了两个线程。但我不知道这是不是最好
的
解决方案。至少它不是一个
零
拷贝
算法。
我
当前<e
浏览 2
提问于2019-03-25
得票数 1
4
回答
“
零
拷贝
网络”vs“内核旁路”?
、
、
、
、
“
零
拷贝
网络”和“内核旁路”
的
区别是什么?这两个短语
的
意思是相同
的
,还是不同
的
?内核旁路是“
零
拷贝
网络”中使用
的
一种技术吗?这就是关系?
浏览 73
提问于2013-08-21
得票数 46
1
回答
使用sendfile而不是sendto
零
拷贝
udp套接字
、
、
我
正在实时环境中使用udp套接字。
我
目前使用
的
是标准套接字函数sendto(),这需要相当长
的
时间。
我
读到可以使用
零
拷贝
,如果
我
理解得很好,就可以避免通过从用户/内核环境复制文件而增加额外
的
时间。但是,
我
看到只允许从一个文件描述符复制到另一个文件描述符。
我
不知道如何使用它来发送UDP数据包,
在
我
的
例子
中
,UDP数据包是
浏览 4
提问于2017-04-06
得票数 1
1
回答
要使用
的
内容:
零
拷贝
内存与固定内存
在
我
的
设备功能
中
,
我
将一个值存储
在
主机
的
全局内存
中
(不管是固定
的
还是
零
拷贝
的
)数百万次。
在
我
的
主机函数
中
,循环一次从全局内存
中
迭代和读取一个值(s.t )。
我
可以看到从设备中产生
的
值,而不是等待产生所有的值)。 为了更好
的
表演,
我<
浏览 1
提问于2018-09-17
得票数 0
回答已采纳
1
回答
修改CUDA上
的
设备内存仅一次
、
、
我
是CUDA
的
新手。
我
在
设备上为浮动变量分配了内存。然后,
我
在内核函数
中
向它添加了许多计算值。现在
我
只想对这个变量做一个数学运算。为了做到这一点,
我
必须把它复制回主机吗?
浏览 0
提问于2013-12-25
得票数 0
回答已采纳
1
回答
Cuda
零
拷贝
性能
、
、
、
有没有人有利用
零
拷贝
(此处参考:)内存模型分析CUDA应用
程序
性能
的
经验?
我
有一个使用
零
拷贝
功能
的
内核,
在
使用NVVP时,
我
看到了以下内容:
在
平均问题大小上运行内核,
我
得到0.7%
的
指令重放开销,所以没什么大问题。所有这0.7%都是全局内存重放开销。当我真的增加了问题大小时,
我
得到了95.7%
的
指令重放开销,所有这些都是由于全
浏览 52
提问于2012-12-14
得票数 1
回答已采纳
2
回答
套接字问题
、
、
、
、
有几个套接字问题,没有找到明确
的
是或否,所以提前道歉,如果它是一个转发:)平台是Linux2.6.30,C++应用
程序
。对网络来说还是很新
的
,快到了。 默认情况下,Linux
中
的</e
浏览 0
提问于2012-04-30
得票数 1
1
回答
OpenCL
中
零
拷贝
的
访问路径
我
有点搞不懂
零
拷贝
到底是怎么回事。2-这样做有什么好处?PCI-e仍然限制了所有带宽.或者,在上述情况下,我们可以避免复制c2 & c1/c3?
浏览 1
提问于2012-10-07
得票数 7
1
回答
内存如何映射到gpu (
opencl
Intel图形)
我
正在使用英特尔集成gpu来实现
opencl
。
我
正在实现一个
零
拷贝
的
程序
,而不是将数据复制到gpu,而是共享公共内存(RAM)。if(id==0){ printf("Mem address: %p
浏览 0
提问于2019-06-26
得票数 2
回答已采纳
2
回答
Linux套接字:
零
拷贝
本地TCP/IP远程
、
、
在
我
花大量时间试图进一步调查这个问题之前,
我
希望一些有帮助的人能帮助我回答一些问题: 在任何情况下,
我
浏览 0
提问于2011-12-28
得票数 4
回答已采纳
1
回答
将Data.ByteString.Lazy转换为CStringLen
的
最有效方法
、
、
、
、
我
需要将一些数据编码为JSON,然后使用hsyslog将其推送到syslog。这两项相关职能
的
类型如下: -> IO () 转换Lazy.ByteString -> CStringLen最有效
的
方法
我
找到了,但它只适用于ByteString,
浏览 6
提问于2020-02-15
得票数 1
回答已采纳
点击加载更多
相关
资讯
程序员经典面试题,Kafka读写硬盘为什么速度还那么快
零拷贝技术在 Java 中为何这么牛?
零拷贝原理的文章网上满天飞,但你知道如何使用零拷贝吗?
OpenCL-1-编程四大模型介绍
经常提到的“零拷贝”!你真的理解吗?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券