4.3 CG 编译

文章内容源自《GPU编程与CG语言之阳春白雪下里巴人》,因笔者读书易中途放弃,遂每读一章节,将其移至简书平台,以此作为对自己读书的勉励。笔者用粗体斜体 标注了关键词句,望感兴趣的读者们一起学习共勉。猛戳这里查看更多!

4.3 CG 编译

4.3.1 CG 编译原理

计算机只能理解和执行由 0、1 序列(电压序列)构成的机器语言,所以汇编语言和高级语言程序都需要进行翻译才能被计算机所理解,担负这一任务的程序称为语言处理程序,通常也被称为编译程序。例如 C 或者 C++ 编写的程序,需要首先编译成可执行文件(.exe 文件),然后才能在 GPU 上运行,且一旦编译后,除非改变程序代码,否则不需要重新编译,这种方式称为静态编译(static coompilation)。静态编译重要的特征是:一旦编译为可执行文件,在可执行文件运行期间不再需要源码信息。而动态编译(dynamic compilation)与之相反,编译程序和源码都要参与到程序的运行过程中。

Cg语言通常采用动态编译的方式,即,在宿主程序运行时利用Cg运行库( Cg Runtime library)动态编译 Cg 代码,使用动态编译的方式,可以将 Cg 程序当作一个脚本,随时修改随时运行,节省大量的时间,在 OGRE 图形引擎中就是采用这样的方法。在文献[2]的 1.4.2 章节中提到 Cg 语言同样支持静态编译方式,即,Cg 源码编译成汇编代码后,这部分目标代码被链接到宿主程序后的可执行程序中。使用静态编译的好处是只要发布可执行文件即可,源码不会被公开。

Cg 编译器首先将 Cg 程序翻译成可被图形 API(OpenGL 和 Direct3D)所接受的形式,然后应用程序使用适当的 OpenGL 和 Direct3D 命令将翻译后的 Cg 程序传递给图形处理器,OpenGL 和 Direct3D 驱动程序后把它翻译成图形处理器所需要的硬件可执行格式。NVIDIA 提供的 Cg 编译器为 cgc.exe。

Cg 程序的编译不但依赖于宿主程序所使用的三维编程接口,而且依赖于图形硬件环境,因为图形硬件自身的限制,不一定支持某种 Cg 语句,例如,如果你所使用的 GPU 并不支持循环控制指令,那么在 Cg 程序中编写的循环控制语句将无法通过编译。被特定的图形硬件环境或 API 所支持的 Cg 语言子集,被称 为 Cg Profiles。需要注意的是: profile 分为顶点程序的 profile 和片段程序的 profile,这是因为顶点着色器和片段着色器原本就不是工作在同一个硬件。

Cg Profiles 是 Cg 语言的重要组成部分,在使用 Cg 语言编写着色程序时,首先要考虑的一点就是“当前的图形硬件环境支持哪个 Cg Profile”,这直接关系到您所编写的着色程序是否可以在当前的图形硬件上运行。

4.2.1 CGC 编译命令

图 12 cgc -h 命令

如果 Cg Toolkit 安装正确,在 NVIDIA Corporation\Cg\bin 文件夹下会看到 cgc.exe 文件。首先打开命令行窗口,输入“cgc –h”(引号不用输入),如果安装正确,则会出现图 12 所示的提示信息。

Cg 程序编译的命令形式为:

cgc [options] file 

[options]表示可选配置项,file 表示 Cg 程序文件名。可选配置项包括编译时选择使用的 profile、着色程序的入口函数名称,以及着色程序文件名。比较典型的编译方式是:

 cgc –profile glslv –entry main_v test.cg 

-profile是profile配置项名;glslv是当前所使用的profile名称;-entry着色程序的入口函数名称配置项;main_v 是顶点着色程序的入口函数名;test.cg 是当前的着色程序文件名。编译器指定的着色程序入口函数名默认为 main通常为了将顶点\片段着色程序入口函数名区别开来,而并不使用默认名称。在下面所有的例子中,main_v 表示顶点着色程序入口函数名,main_f 表示片段着色程序入口函数名。

需要强调如下几点:

  • 1.着色程序分为顶点着色程序片段着色程序,profile 也分为顶点 profile片段 profile,所以编译顶点着色程序时必须选用当前图形硬件支持的顶点 profile,同理,编译片段着色程序时必须选用当前图形硬件支持的片段 profile。下面所示使用片段 profile fp20 编译顶点着色程序是不对的。 cgc –profile fp20 glslv –entry main_v test.cg 所以,如果您的着色程序中同时存在顶点着色程序和片段着色程序,在编译前切记分别选择各自的profile
  • 2.选择 profile 如果不被当前图形硬件所支持,编译时会出现错误。被编译的着色程序中,如果存在不被所选择的 profile 所支持的语句,则编译时会出现错误。例如,tex2D(sampler2D tex , float3 sz ,float2 dsdx , float2 dsdy )不被 fp20 所支持,如果你的编译形式为: cgc –profile fp20 –entry main_f test.cg 则会出现错误提示信息: error C3004: function “tex2D” not supported in this profile。 改用fp30,进行编译就会通过。 cgc –profile fp30 –entry main_f test.cg 尤其需要注意的是,循环语句for,while只被vs_2_x, vp30, vp40,fp40等少量的 profiles所支持。在CgUsersManual中提到:“In other profiles, for and while loops may only be used if the compiler can fully unroll them (that is, if the compiler can determine the iteration count at compile time)” 这句话的意思是“在其他的profiles中,for和while循环只有当确切的知道循环次数时才能被使用”。但经过试验,通常在其他profiles编译含义for,while语句时会出现错误提示信息: error c6003:instruction limit of exceeded…… 因此,如果没有确切的把握,不要在低级的profiles中使用循环控制语句。
  • 3.被编译的着色程序文件名必须加上.cg 后。如果没有加后,写成如下的形式: cgc –profile glslv –entry main_v 则会出现错误提示信息: fatal error C9999: Can’t open file:test
  • 4.另外 cgc 还提供一种比较特殊的功能:就是将 Cg 语言所写的着色程序转换为使用 GLSL 或 HLSL 所编写的程序。例如,将代码写成如下形式,表示编译文件 test.cg 中的顶点着色程序,入口函数名为 main_v,并将顶点着色程序转换为 glsl 程序,然后保存成文件 direct.glsl。 cgc –profile glslv –o direct.glsl –entry main_v test.cg
  • 5.还有一个非常隐蔽 的编译情况是:如果着色程序中的某些变量并没有为终的输出做出贡献,则编译时会将该部分代码忽略(会检查语法错误,但并不编译成汇编代码)。通常这一点不会造成太大的影响,但是如果这些变量刚好是从外部宿主程序中传入的变量,并且在着色程序中没有被使用,则宿主程序传入变量的接口函数可能会报错“找不到该变量”。这种情况比较少遇到,但并非不存在,且一旦遇上问题的原因难以查明,故而我在此写上,希望可以有所帮助。

基于 GPU 编程,令人崩溃的一点是:无法跟踪调试着色程序!这一点目前还没有解决方案出现。对于一个着色程序,语法错误可以通过编译器发现,而代码逻辑错误只能是人为查找。常会遇到这种情况,一段代码编译通过,但是运行结果不在预期之中,如果是 C++\JAVA 程序就可以进行跟踪调试,但是着色程序不能被调试,只能一行代码一行代码的进行逻辑分析

所以,编译着色程序要非常注意逻辑的严密性和代码的组织结构,这是为了更加容易的暴露错误和维护代码。一个良好的习惯是加入注释语句

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据派THU

独家 | 手把手教你如何用Python从PDF文件中导出数据(附链接)

有很多时候你会想用Python从PDF中提取数据,然后将其导出成其他格式。不幸的是,并没有多少Python包可以很好的执行这部分工作。在这篇贴子中,我们将探讨多...

2423
来自专栏AI研习社

开发、调试计算机视觉代码有哪些技巧?

在调试视觉代码时, 基本就是和多维数组打交道, 多维数组有很多的属性,打印起来比较麻烦。 boxx.loga 可以一次性展现出一个数组的大多数属性。

1101
来自专栏前端杂货铺

[译] Cookbook of QUnit

本篇文章是QUnit的简介,可以作为很好的入门教程。文章原址 介绍 自动化测试时软件开发过程中必不可少的一部分,而单元测试则是自动化测试的最为基本的一块,软件的...

30311
来自专栏每日一篇技术文章

Metal_入门01_为什么要学习它

Metal 系列教程 Metal_入门01_为什么要学习它 Metal_入门02_带你走流程

1422
来自专栏Golang语言社区

数据说话:Go语言的Switch和Map性能实测

在开发pgx(一个针对Go语言的PostgreSQL driver)的时候,有好几次我都需要在20多个代码分支间跳转。通常我会选用switch语句。还有个更加可...

4255
来自专栏Golang语言社区

【golang】调优工具 pprof

Golang 提供了 pprof 包(runtime/pprof)用于输出运行时的 profiling 数据,这些数据可以被 pprof 工具(或者 go to...

1593
来自专栏CNN

TensorFlow读取数据

本文介绍如何使用TensorFlow来读取图片数据,主要介绍写入TFRecord文件再读取和直接使用队列来读取两种方式。假设我们图片目录结构如下:

1382
来自专栏Jerry的SAP技术分享

用代码判断当前系统是否支持某个版本的feature

JDK9已经出来有一段时间了,因此很多流行的Java应用纷纷增添了对JDK9乃至JDK10的支持,比如Tomcat。

1392
来自专栏互联网杂技

Angular2 脏检查过程

在本文中我将会深入讨论Angular 2 中的变更检测系统。 高层次概览 一个Angular 2 应用就是一颗组件树。 ? Angular 2 应用是一个反馈系...

4318
来自专栏ATYUN订阅号

最新!TensorFlow 1.9.0正式版发布

TensorFlow 1.9.0正式版发布了,下面是更新和改进的细节,更详细的信息请到网站查阅:github.com/tensorflow/tensorflow...

1562

扫码关注云+社区

领取腾讯云代金券