腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
tensorflow.js
加载
的
图形
模型
可以
使用
图形
处理器
上
的
数据
,
而
不需要
先将
数据传输
到
中央处理器
吗
?
、
、
、
、
我目前正在
使用
TFJS3.8在客户端
加载
一个分段
模型
(作为tf.GraphModel
加载
)。为了创建输入Tensor,我调用了browser.fromPixels(imageData),它从同样位于CPU
上
的
Tensor对象创建CPU
上
的
ImageData。由于我
使用
的
是tfjs
的
webgl后端,所以在调用model.predict(tensor)函数时,
数据
会被发送到GPU。这种
浏览 42
提问于2021-10-22
得票数 1
回答已采纳
1
回答
输入类型(torch.FloatTensor)和权重类型(torch.cuda.FloatTensor)应相同
、
、
、
、
*我将我
的
模型
和
数据
设置在同一个设备
上
,但总是会抛出这样
的
错误: RuntimeError:输入类型(torch.FloatTensor)和权重类型(torch.cuda.FloatTensor)应该相同**以下是训练代码**当我运行以下代码以
使用
<code>D1</code>进行检测时。<code>A2</code> cap.release() cv2
浏览 52
提问于2020-06-10
得票数 0
4
回答
GPU从CPU读取还是CPU写入
到
GPU?
、
、
我是并行编程
的
初学者。我有一个问题,可能看起来很愚蠢,但当我在谷歌
上
搜索它时,我没有得到一个明确
的
答案。 在GPU计算中,有一个设备,即GPU和主机,即CPU。我写了一个简单
的
hello world程序,它将在gpu
上
分配一些内存,将两个参数(例如src[]和dest[])传递给内核,将src字符串(即Hello world )复制
到
dest字符串,并将dest在来回传输
数据
时,有四种可能: 1. CPU
到
GPU - CPU写入GPU - GPU读取2
浏览 6
提问于2012-07-03
得票数 7
2
回答
如何将GPU全局内存中
的
像素阵列直接显示
到
屏幕
上
?
、
、
我在GPU
上
做了一个路径跟踪,我在GPU全局内存上得到了一些像素
数据
(这是一个float3数组)
的
跟踪结果,为了在屏幕
上
显示该数组,我所做
的
是将该数组复制
到
CPU内存并调用OpenGL glTexImage2DpixelArray是要显示
的
像素
数据
数组。由于
图形
处理器
是管理整个渲染过程
的
设备,有没有一种方法
可以
在屏幕
上
显示pixelArray
而
<
浏览 0
提问于2013-03-27
得票数 5
回答已采纳
2
回答
在多核
上
运行速度较快,但在GPU上相对较慢
的
内核
、
、
、
我知道混合方法仍然会更快,但我真正想要
的
是了解GPU仍然落后于多核
的
领域。
浏览 1
提问于2011-12-16
得票数 1
回答已采纳
2
回答
我们
可以
在没有
图形
处理器
的
自定义对象
上
训练YOLOv3
吗
?
、
、
、
我
的
YOLO
模型
可以
很好地检测瓶子、人、手机、背包等物体。但我想让我
的
模型
检测到戒指、手镯或头盔(在目前
的
yolo
模型
中不存在
的
对象)。没有GPU,我能做一个自定义
的
对象检测yolo
模型
吗
?涉及
的
风险是什么?(如有)。 我
的
系统是Windows 10 Home single language,内存为8 8GB。
浏览 21
提问于2019-06-10
得票数 2
1
回答
如何优化动态几何
图形
的
渲染?
、
、
据我所知,批处理和实例化是用来减少静态meshes.But
的
绘制调用量
的
,那么动态网格呢?我如何优化它们
的
绘制调用量?实例化和批处理会产生很大
的
开销,因为您需要在每个frame.Or中重新计算位置,所以最好
使用
单独
的
绘制调用来绘制动态网格?
浏览 0
提问于2021-06-10
得票数 1
2
回答
tfjs_layers_model与tfjs_graph_model
的
区别
、
、
有
使用
推荐
吗
?
浏览 2
提问于2019-04-24
得票数 10
回答已采纳
2
回答
我
可以
将numpy与AMD
的
gpu加速
的
blas库链接起来
吗
、
、
、
我意识
到
numpy
可以
与blas链接,我想为什么不
使用
gpu加速
的
blas库。 过去有没有人这样做?
浏览 0
提问于2013-05-19
得票数 2
回答已采纳
1
回答
OpenACC中求中值
的
并行算法
、
、
有没有
可以
在OpenACC中实现
的
并行算法来求一个向量
的
中位数?
浏览 1
提问于2018-03-22
得票数 0
1
回答
Linux多GPU屏幕外渲染
、
、
我试图在Linux
上
做多
图形
处理器
的
工作,特别是
使用
2sli
的
glmark2。我尝试过
使用
SLI,但即使在
使用
nvidia-xconfig将X11/xorg.conf文件修改为SFR之后,它似乎也没有
使用
第二个
图形
处理器
(我尝试过
的
glmark2测试仍然在相同
的
范围内)。这有可能
吗
? 如果不可能,我想知道我是否
可以
手动
浏览 3
提问于2015-10-02
得票数 3
3
回答
DirectCompute信息
、
、
作为我
的
一个项目的一部分,我一直在尝试
使用
GPU。我已经研究了CUDA和OpenCL,但缺乏向您展示如何将它们引入项目的信息是令人震惊
的
。甚至连他们专门
的
论坛群也死了。据我所知,它只是一种
使用
HLSL
的
新型着色器文件。我
的
问题是,我
的
程序(除了DirectX 10 / 11之外)需要改变它
的
结构
吗
?我
的
意思是,这是一个简单
的
情况下创建CS文件,设置项目中
的</em
浏览 5
提问于2012-03-04
得票数 1
回答已采纳
1
回答
如何将来自多个
模型
的
所有计算放到GPU中
、
、
现在,我在GPU
上
运行MTCNN(在Tensorflow
上
实现)进行人脸识别。 由于MTCNN
使用
了三种
模型
,PNet,RNet,ONet,以及它们之间,运行了一些步骤
的
NumPy。因此,我认为只有PNet、RNet和ONet
模型
可以
在
图形
处理器
上
运行,其他NumPy步骤将在
中央处理器
上
运行。然后,它会将输出从GPU内存复制
到
主内存。这将是相当浪费时间
的<
浏览 47
提问于2019-02-06
得票数 1
1
回答
Tensorflow 0.6 GPU问题
、
、
我
使用
Nvidia Digits Box和
图形
处理器
(Nvidia GeForce GTX Titan X)和Tensorflow 0.6来训练神经网络,一切都正常。但是,当我
使用
nvidia-smi -l 1检查Volatile GPU Util时,我注意
到
它只有6%,而且我认为大部分计算都在CPU
上
,因为我注意
到
运行Tensorflow
的
进程有大约90%
的
CPU
使用
率。我想知道是否有方法
可以
充分
浏览 0
提问于2016-04-30
得票数 0
1
回答
使用
ATI流
处理器
的
GPU
上
的
RAR密码恢复
、
我是GPU编程
的
新手,
使用
brook+语言在ATI Stream Processor上进行暴力破解密码恢复,但我看到用brook+语言编写
的
内核不允许调用任何正常函数(内核函数除外),我
的
问题是:2)
使用
图形
处理器
的
和ElcomSoft软件如何工作? 3) GPU (ATI流
处理器</em
浏览 0
提问于2009-12-26
得票数 5
回答已采纳
2
回答
什么是
数据
自动化系统和OpenCL?它们是如何和为什么被用于PoW挖掘?
、
、
人们经常建议,要实际参与采矿,必须获得
图形
卡并安装
数据
自动化系统和/或OpenCL库。库达是Nvidia创建
的
并行计算平台和应用程序编程接口(API)
模型
。它允许软件开发人员和软件工程师
使用
CUDA支持
的
图形
处理单元(GPU)进行通用处理,这种方法称为GPU(
图形
处理单元
上
的
通用计算)。CUDA平台是一个软件层,
可以
直接访问GPU
的
浏览 0
提问于2017-07-22
得票数 1
1
回答
带有TFRecord训练/测试文件
的
mnist和cifar10示例
我是Tensorflow
的
新用户。我想用它来训练一个有2M张图像
的
数据
集。我在caffe中
使用
lmdb文件格式做了这个实验。在阅读了Tensorflow
的
相关文章后,我意识
到
TFRecord是最适合这样做
的
文件格式。因此,我正在寻找
使用
TFRecord
数据
的
完整CNN示例。我注意
到
与图像相关
的
教程( 和中
的
mnist和cifar10 )提供了一种不同
的</
浏览 0
提问于2016-10-03
得票数 3
4
回答
使用
OpenGL或DirectX快速比较两张图片
、
、
、
、
我需要比较2张图片,并找到与指定阈值不同
的
像素。现在我只是在for循环中以编程
的
方式做这件事,对于小
的
600x400
的
图片大约需要3秒。我想知道是否有方法
可以
使用
OpenGL,DirectX,CUDA或类似的东西来更快地完成它?因此,它将
使用
GPU,
而
不仅仅是CPU。请注意,在输出中,我需要一个由不同像素组成
的
数组,
而
不仅仅是布尔值,取决于它是否与图片相同。所以我看了一下delphi
的
源代码,它看起
浏览 0
提问于2012-05-22
得票数 2
回答已采纳
2
回答
网络接口rmnet_ipa0
的
含义
、
当我跑
的
时候adb shell ,ifconfig在我
的
android设备
上
,我得到了一个网络接口列表。
而
this answer涵盖了大部分接口名称,我想知道是什么rmnet_ipa0可能代表。sit接口与IPv4
上
的
隧道IPv6相关联 p2p接口通常与点对点连接相关联(也许你
的
安卓设备
的
WiFi直接支持?)虚拟接口为环回接口提供特殊别名 我相信usb-thethering通常是这样
的
rmnet_usb0,我手机
的
浏览 765
提问于2017-11-26
得票数 7
回答已采纳
1
回答
关于cuda中
的
变量定义
、
、
、
我必须从文件中
加载
数据
。每个样本都是20维
的
。所以我
使用
这个
数据
结构来帮助我:{} 但是当我
使用
这个变量定义时,它不能工作。编译器告诉我不能
使用
向量(主机)进入device_input。因为device_input将在设备(
图形
处理器
)
上
实现,
而
矢量将在
中央处理器
上
实现。那么,
浏览 0
提问于2013-07-13
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
TensorFlow.js发布:使用JS进行机器学习并在浏览器中运行
硬件的未来在AI、AI的未来在材料
CPU vs GPU 有什么不同?优缺点对比
恒讯科技分析:GPU是什么和CPU的区别?
搭载M1芯片的MacBook Air真的强大
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券