首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >使用多少个CUDA核心来处理CUDA偏差?

使用多少个CUDA核心来处理CUDA偏差?
EN

Stack Overflow用户
提问于 2020-06-02 08:13:21
回答 1查看 556关注 0票数 1

我正在寻找答案,但有一些冲突的想法:在这个链接https://www.3dgep.com/cuda-thread-execution-model/中,两个warps (64个线程)可以在SM (32个CUDA内核)上同时运行。因此,据我所知,warp上的线程被拆分并在16个CUDA内核上进行处理。这个想法对我来说很有意义,因为每个CUDA核心都有1个32bitALU。

然而,在其他链接中,他们声称1CUDA核心能够处理32个并发线程(与warp大小相同) (https://cvw.cac.cornell.edu/GPU/simt_warp)。因此,1个CUDA warp只能由一个CUDA内核处理。这也是有意义的,因为所有线程在相同的曲轴上使用相同的PC计数器。

那么,我的问题是如何将CUDA偏差映射到CUDA核心?

EN

回答 1

Stack Overflow用户

发布于 2020-06-02 20:31:43

Inside a CUDA GPU,有称为短消息(流多处理器)的计算单元。每个SM具有各种硬件资源(warp调度器、指令获取/解码、寄存器文件、执行/功能单元、共享存储器、L1高速缓存等)。它们用于支持CUDA执行线程。

无论何时发出指令,它都是在warp范围内发出的。因此,发出的任何指令都需要该类型指令的32个功能单元。CUDA低级指令(SASS)可以分为多个类别,并且有一个功能单元类型来处理该指令或该类别中的指令。例如,从内存加载指令(例如LD)将由LD/ST单元(加载/存储)处理。有许多不同种类的这些指令处理单元。

一些额外的particular kinds of units are SP and DP units。SP单元可以处理单精度浮点乘法、加法或乘加指令。DP单元类似,只是它处理双精度浮点类型的指令。

因此,为了发出指令,warp调度器最终将需要32个适合于该指令类型的单元类型。对于单精度浮点乘法运算,需要在该周期内有32个SP单元可用来接收发出的指令。

其他类型的指令(最终)仍需要32个单元,但SM中可能没有32个给定类型的单元。当特定类型的单元少于32个时,warp调度器将跨多个时钟周期调度单个指令。例如,假设特定的GPU SM设计是这样的,即只有4个DP单元。然后,当warp调度器有例如DP乘法运算/指令要发出时,它将在总共8个时钟周期(4x8=32)中使用这4个单元,以便在考虑每线程、warp宽度时为每个指令提供功能/执行单元。每个线程最终都需要一个功能单元。每个功能单元可以为每个时钟处理一个线程的一条指令。为了处理在warp范围内发布的指令,将需要32个功能单元,以便可以在单个时钟周期中发布指令,或者将在多个时钟周期上将指令发布到较少数量的功能单元。

CUDA中的术语“核心”通常用于指如上所述定义的SP单元。鉴于此,我们可以立即确定:

  1. 一个CUDA“核心”真的不像CPU核心。
  2. 仅涉及相对较少的指令类型的指令处理,包括SP浮点加法、乘法和乘法加法。任何其他指令类型都将需要不同类型的功能单元来处理该指令。并且仅仅因为SM包含例如128个CUDA核心(即SP单元),并不意味着它还包含128个DP单元、或128个LD/ST单元、或特定数量的任何其他功能单元类型。SM中的功能单元的数量可以而且确实随功能单元类型而变化。不同的图形处理器架构(Maxwell,Pascal,Volta)和架构内的不同计算能力,可能具有不同的混合或数量的这些功能单元类型。
票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62147624

复制
相关文章
AWS CPP S3访问COS
COS是完全兼容AWS S3的,项目中经常遇到客户直接使用AWS S3的相关SDK,来访问COS。
ictfox
2021/12/16
1.1K0
k8s中通过aws sdk访问s3遇到的坑
由于java使用命令行时可能会出现卡死现象,所以这里想使用aws提供的sdk来直接上传下载文件。 默认有两种方式,一种是程序中配置key:
一笠风雨任生平
2022/01/06
2.1K0
k8s中通过aws sdk访问s3遇到的坑
AWS CloudFront CDN + S3 CORS 跨域访问的问题
在研究 https://observablehq.com/ 的载入数据的时候,我们会发现如果你数据存在 S3 上使用 CloudFront 作为 CDN 的时候,你会发现数据库载入不进去。
HoneyMoose
2020/04/21
4.7K0
AWS CloudFront CDN + S3 CORS 跨域访问的问题
AWS S3 使用 travis 编译的时候提示错误 Aws::S3::Errors::PermanentRedirect
这是因为在我们的配置文件下 travis 将会把数据存储到 S3 的 us-east-2 存储区。
HoneyMoose
2020/12/22
6220
AWS S3 使用 travis 编译的时候提示错误 Aws::S3::Errors::PermanentRedirect
s3 aws 临时授权
https://docs.aws.amazon.com/zh_cn/AmazonS3/latest/userguide/AuthUsingTempSessionToken.html
周杰伦本人
2022/10/25
1.2K0
AWS S3 学习小结
1.首先,这个是AWS的开发资源使用文档:AWS开发文档,AWS官网 – S3教程
全栈程序员站长
2022/11/03
1.8K0
AWS S3 bucket 的 ACL 控制
https://www.ossez.com/t/aws-s3-bucket-acl/14175
HoneyMoose
2022/11/02
4720
「云网络安全」为AWS S3和Yum执行Squid访问策略
在本文中,我们将设置一个示例情况,展示如何使用开源Squid代理从Amazon虚拟私有云(VPC)中控制对Amazon简单存储服务(S3)的访问。首先,您将配置Squid以允许访问Linux Yum存储库。接下来,您将配置Squid,以限制对已批准的Amazon S3 bucket列表的访问。然后,您将配置Squid以根据URL直接流量,将一些请求发送到Internet网关(IGW),并将其他流量发送到虚拟专用网关(VGW)。最后,您将探索使Squid高度可用的选项。
架构师研究会
2021/01/06
3K0
「云网络安全」为AWS S3和Yum执行Squid访问策略
AWS EC2 在线扩容磁盘
对正在运行的生产服务器进行在线不停机扩容卷大小,在这个过程中,不影响已有的数据,不会对已有的磁盘做格式化,只单纯增加容量。
行 者
2023/10/20
6930
aws s3 java SDK使用[通俗易懂]
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/179078.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/27
1.8K0
aws s3 java SDK使用[通俗易懂]
AWS CLI使用s3
aws CLI是什么东西,暂且先不去了解,目前的需求是s3. 我在Jenkins上创建一个bucket,然后申请access_key,然后就可以使用s3来存储数据了。也就是说,s3就是一个网盘。 1.安装CLI 文档:http://docs.aws.amazon.com/cli/latest/userguide/installing.html $ curl "https://s3.amazonaws.com/aws-cli/awscli-bundle.zip" -o "awscli-bundle.zip"
Ryan-Miao
2018/03/13
1.9K0
aws lambda python 上传s3
代码编写 Code writing 编写lambda函数 Write lambda functions 主要功能是查询数据库,在本地生成test.csv,而后上传至s3://test-bucket-dev桶,bthlt目录下. test.csv is generated locally and uploaded to s3://test-bucket-dev bucket,bthlt path. import pymysql import logging import boto3 from botocore
葫芦
2021/12/20
2.2K1
aws lambda python 上传s3
aws生产实践-8:解决私有子网下(nat网关)的EC2访问公网的问题
首先,AWS会分配一个VPC,在这个VPC下默认会有3个子网,我们建立的EC2实例都在这3个子网里。
千里行走
2021/11/10
1.7K0
aws生产实践-8:解决私有子网下(nat网关)的EC2访问公网的问题
LayerNorm 在 Transformers 中对注意力的作用研究
LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。
deephub
2023/08/28
3040
LayerNorm 在 Transformers 中对注意力的作用研究
Linux使用root用户登录(AWS EC2)
在aws ec2上使用root用户登录 aws ec2默认是使用ec2-user账号登陆的,对很多文件夹是没有权限的。如何使用root账号执行命令就是一个问题了。解决办法如下: 1.根据官网提供的方法登录连接到EC2服务器(官网推荐widows用户使用PUTTY连接) 主机:是服务器的Public DNS 端口:22 2.创建root的密码,输入如下命令:sudo passwd root 3.然后会提示你输
小晟
2023/04/01
5.2K0
Linux使用root用户登录(AWS EC2)
What is AWS S3 and Why to use it?
AWS S3 is an object-based serverless storage service by Amazon web services which is much faster than hard drive file systems and block storage approaches to save data. Serverless means the storage is hosted on the cloud where you don’t have to configure the server with storage space restriction, it gets expanded dynamically with usage.
用户4822892
2020/01/22
6010
AWS S3 对象存储攻防
文章来源:火线Zone社区,链接:https://zone.huoxian.cn/d/907-aws-s3
火线安全
2022/03/01
3.5K0
AWS S3 对象存储攻防
如何使用亚马逊对象存储AWS S3 SDK访问腾讯云存储COS
COS 提供了 AWS S3 兼容的 API,因此当您的数据从 S3 迁移到 COS 之后,只需要进行简单的配置修改,即可让您的客户端应用轻松兼容 COS 服务。本文主要介绍不同开发平台的 S3 SDK 的适配步骤。在完成添加适配步骤后,您就可以使用 S3 SDK 的接口来访问 COS 上的文件了。
云存储
2020/05/26
4.2K0
如何使用goGetBucket扫描和发现AWS S3 Bucket
goGetBucket是一款针对AWS S3 Bucket的渗透测试与安全研究工具,在该工具的帮助下,广大研究人员可以快速扫描和发现AWS S3 Bucket。
FB客服
2023/08/08
2500
如何使用goGetBucket扫描和发现AWS S3 Bucket
AWS EC2 增加多个弹性 IP
一、 添加一个私有IP的 1. 实例->联网->管理私有IP地址 2. 分配新IP->是,更新 注意:记下刚生成的 私有 IP 二、把刚才生成的私有IP地址添加到网络接口 1. SSH连接到您的实例并
码农编程进阶笔记
2021/07/20
2K0

相似问题

通过角色和访问S3的AWS EC2 SSH

10

用于S3访问的AWS EC2 IAM角色不起作用

126

在terraform中授予aws ec2实例对aws secretsmanager的访问权限

119

AWS S3对象访问和编辑

14

AWS:提供对S3对象的有限和安全访问

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文