首页
学习
活动
专区
工具
TVP
发布

人人可有的算力服务器,技嘉4070Ti显卡生产力应用展示

前言

笔者在网上写写测评是其中一项兴趣爱好,现实中其实是一名苦逼的影视广告后期,主要做剪辑、特效、合成这些工作,这些工作有一个非常大的特点,就是对电脑的配置要求特别高,不仅CPU要好,内存要大,硬盘要快,现在还要显卡够强,完全可以说是用钱堆出来的生产力

为啥说是从前不需要太强大的显卡,而现在才要呢?因为越来越多的专业软件开始广泛地支持GPU加速,并且还加入了AI相关的功能,显卡众生平等这一说法(Tips:Adobe从前无论啥显卡,对AE的性能影响差距不超10%),逐渐成为过去。而最快占领AI高地的不是一众软件厂商,而是Nvidia(英伟达)这一硬件厂商,他所生产出来的显卡和专业加速卡,不仅有着强大的计算性能,还提供了CUDA深度神经网络库等高性能库,在AI领域具有广泛的生态系统支持,许多相关的库和工具都针对NVIDIA显卡(下文统称N卡)进行了优化

苹果的Mac系列电脑一直以来在专业市场上无人出其右,但这两年开始,被搭载N卡的PC逐渐蚕食市场份额,原因就是AMD显卡和M1自研处理器,在全民AI的大环境下逐渐乏力。作为第一批吃苹果M1处理器螃蟹的用户,一位忠实的果蛆,这次我却把目光投在了Windows+Nvidia的阵营上

今天就来组装一台基于此的个人算力服务器,或者说是渲染工作专用电脑,并让其兼任亿点点的游戏娱乐需求,主要是分享显卡性能上来后,对于视频后期工作的些许不同

服务器搭建

想要紧跟AI时代所购置的电脑,核心配件便是显卡的选择。N卡在这一方面是毋庸置疑的最佳选择。40系N卡的发售也让混乱的显卡市场开始走向平稳,本以为会无休止暴涨的功耗和价格,也成为了过去式。简单盘算下之后,便决定使用RTX 4070Ti,这张本来应该叫RTX 4080 12G的卡。它有着超过上代RTX 3090、接近于RTX 3090Ti的性能,却只有其一半的功耗和更低的价格,非常适合没持有30系显卡的玩家升级(比如说我)

40系显卡改用了全新的PCIE 4.0 16-pin电源接口,这个新升级在前不久引发了非常多的讨论,我个人建议是更换支持ATX3.0的电源,最终我选择的鑫谷的GP850W黑金全模组,金牌转换效率和日系电容加持,重要的是支持ATX3.0新标准,配备了原生的16-pin 12VHPWR接口

为了控制预算,我采用了DDR4平台,内存方面节省了不少钱,金百达银爵的大名想必各位老玩家都听过,这次终于拔了草。银爵采用了国产颗粒“长鑫Adie”,开启XMP2.0后,一键可超频至3200C16使用,不到400的价格确实没有拒绝的理由

由于我的目的之一是7*24小时使用,不仅是一台个人工作电脑,还是家里的一台算力服务器,希望机器的存在感越低越好。所以配件的选择上倾向了没有灯光的版本,省钱之余还省电,不过这么一来,RGB所带来的额外性能提升就只能含泪舍弃了。最终机器主要配置如下

板U套装:Intel 13600K的B760M套装

内存:金百达 银爵 DDR4 16GB*2

GPU:技嘉 RTX 4070Ti Gaming OC 魔鹰 12G

电源:鑫谷 GP850W

机箱:乔思伯 松果 D41 MESH 副屏版

系统装的Win11 22H2,生产力软件目前安装了DaVinci Resolve、Adobe AE、Blender等视频后期常用宝库,并部署了DaVinci Server Project和Stable Diffusion(添加--listen命令开启局域网访问权限)作为个人工作流中的算力服务器使用

达芬奇工作流分享

我工作中主要使用的生产力软件是DaVinci Resolve(下文统称达芬奇),以强大的调色功能出名,好莱坞不少电影调色师都是使用的它,除了调色外,它还能剪辑、合成、混音,功能强大不说,价格还非常厚道。而且功能迭代迅速,紧跟市场风向,一早就支持了显卡加速功能,不仅有硬件的编解码器,还有AI相关的功能,包括人脸识别、SpeedWarp慢动作以及视频超分辨率等。在4月底更新的达芬奇18.5版本,还加入了音频识别分类、Relight FX重新照明等强大的AI功能,等稳定版上线后就可以用于我工作上的商业项目

输出交付页面中,导出设置里的编码器菜单选择“Nvidia”,这样就可以调用显卡的硬件编码器进行加速▽▼

在我日常工作项目里,其实剪辑都算轻松的事情,麻烦的都是特效合成。一般商业项目所需要做的一个Fusion合成片段,往少了说都有20来个节点,还包含了降噪、擦除、抠像、色彩空间转换等吃性能算力非常多的节点,合成片段可以说是随着工作的完成,机器越来越卡,速度越来越慢,曙光前的黑暗总是特别难熬▽▼

以前使用Intel iMac进行渲染输出,如动图所示这么一条总共20秒的合成片段,19年的顶配iMac需要十来分钟时间,20年的的顶配iMac还要6分半钟,现在这台搭载4070Ti的算力服务器只需要3分多钟▽▼

怎么描述该工程复杂程度呢?这台我们用来DIT的苹果笔记本,它搭载了M1 Pro处理器和16内存。对于剪辑来说已经足够强了,但是用来合成就完全不行,这个只有合成演示的工程甚至都没法正常打开,连参赛资格都没有▽▼

调色输出也不外如是,看看这节点树的复杂程度就可见一斑▽▼

在这总共2分20秒的调色项目上,我拉出了M1Pro的苹果笔记本和20年顶配iMac一同进行调色竞速,但结果依旧是算力服务器以碾压的优势战胜前两者。为了探究算力服务器究竟有多强,我借了一台搭载i9 9900K + Radeon VII的黑苹果进行对比,但算力服务器的渲染速度依旧领先将近有1分钟▽▼

当剪辑、合成、调色、混音的工作都集成在一个工程的时候,虽然工作起来很方便,但交付输出的时候就慢得不得了,电脑稍微差点都不敢这么玩。这次搭建的渲染用算力服务器,在预算范围内拉满了算力,给我带来的效率提升无疑是巨大的

协同工作展示

达芬奇的项目库(通俗的讲,就是工程文件的一种管理方法),一般是存放在机器本地的,一旦中途想换一台电脑进行剪辑啥的,需要将项目进行打包才能迁移。相对于Adobe系列等可以把工程文件直接存放在NAS里的软件,是要麻烦很多,让人非常无语。解决这一痛点的方法,就是DaVinci Server Project这一官方软件,这软件可以被部署到nas里,也可以被部署到任意一台工作机器上。只要软件在线,同一局域网内的机器,持专门的密钥就可以访问到DaVinci Server Project中的项目库

也就是说,不仅可以随时换一台电脑接力工作,甚至在项目中开启多用户协同功能后,同一个工程可以被多名用户同时打开编辑,可以实现剪辑、合成、调色、混音同时在线工作。这个多用户协同功能太强大了,充分发挥了达芬奇软件功能全面的特性,非常推荐团队使用

基于这次搭建的这台算力服务器,我来演示一下达芬奇的协同工作这一功能,演示前已经将DaVinci Server Project部署好了,并且在局域网中的另外两台电脑上也使用相关密钥,打开了这台算力服务器中的同一个工程▽▼

如果你对协同工作也很感兴趣,那么这段文字就需要注意一下。DaVinci Server Project的在线项目里,默认是单人模式,如果需要开放多用户协作,需要在项目中点击"文件"-"多用户协作"功能按钮进行开启▽▼

这时,团队中的相关人员就可以打开项目进行工作了,在软件页面右下角这边可以看到目前项目在线的用户,也可以对他们发起聊天,比如问问他们今天中午吃什么▽▼

另外如果团队中的机器配置有高有低,还可以使用远程渲染功能,指定某一台配置高的电脑去渲染交付,比如我用小笔记本修改了一些剪辑片段后,就指定这台刚装好的算力服务器去远程渲染▽▼

用于远程渲染的机器,需要点击"工作区"菜单中的"远程渲染",开启相关状态。该功能不是默认开启的,开启后就是远程渲染的监控窗口,可以查看所有的远程渲染状态。而且需要注意的是,开启该功能后,软件就不允许你做别的事情了,回到工作则需要点击关掉远程渲染状态▽▼

如果我们希望达芬奇在开启时自动进入远程渲染状态,也使用添加命令行“-rr”进行配置,Windows系统下,如果安装在默认位置的话代码结构是这样的

C: \Program Files\Blackmagic Design\ DaVinci Resolve>resolve -rr

macOS系统则是

/Applications/DaVinci\ Resolve/DaVinci\ Resolve.app/Contents/MacOS/Resolve -rr

需要注意的是,这行代码会将达芬奇进入到Headless模式,也就是完全没有UI界面的情况,纯后台的进行渲染交付工作。这个功能就特别适合这种算力服务器使用,团队中可以专门配一台机器去进行渲染交付,这样就可以大大节省项目中杂七杂八的输出任务的时间

其他有趣功能

这个机箱自带的小屏幕,可以让我在不开启桌面显示器的时候也能正常使用机器本身,也能非常方便的查看机器性能状态,也可以把它当做一块临时窗口查看软件运行情况▽▼

GoodBye Greenscreen是一个AI抠像插件,这是目前业内少有的好东西,但非常的吃显卡资源,现在有了技嘉RTX4070Ti魔鹰进行加速运算,终于能畅玩了▽▼

Stable Diffusion是目前最热门的图片AI之一,相对于Midjourney,优势就是开源免费,插件多,但非常吃自己机器的算力。这块4070Ti的算力配上12G大显存,跑起图来太舒服了,我甚至还开启了Listen模式,在局域网内用iPad、手机等移动设备调用这台服务器的算力进行跑图▽▼

Topaz video是市场上最强的的视频AI工具之一,它可以完成低质量视频转制高清、常速视频转制慢动作等功能,这些都是视频后期的救命稻草。我曾经就遇到过客户对于前期拍摄的动作不够满意,希望能够将人物动作变得更慢,可以更好的去渲染氛围。这在以前是想都不敢想的,拍回来啥样就是啥样,强行放慢只会掉帧,现在有了AI工具,这些无理的需求开始合理化了起来▽▼

以前不怎么乐意去用Topaz video,因为iMac赢弱的显卡性能处理起来真的太慢了,往往都是一顿午饭加上午觉的时间。比如说上图这段8秒的视频放慢4倍的操作,Radeon Pro 580X需要1小时16分8秒,Radeon Pro 5700居然没快多少,还要54分7秒。但是在使用RTX 4070Ti显卡之后,运行速度有了巨大的改善,居然喝口水就完成了,实在离谱▽▼

Steam Deck是目前最优秀的掌机之一,3A大作随时随地可以流畅的去玩,但赢弱的机器性能,平时只能跑跑最低画质。正好机箱小屏幕的分辨率和刷新率跟Steam Deck的屏幕保持一致,那我们就可以在算力服务器上使用Steam串流,从而保证一比一的像素点渲染,不浪费一丝多余的性能。这也是我第一次在Steam Deck上看到如此真实的霍格沃茨、如此绚丽的夜之城,而不是各种大果粒▽▼

结语

磨刀不误砍柴工,这次的设备升级让我非常满意,尤其是这块技嘉RTX 4070Ti魔鹰非常给力,许多软件跑出了我从前不敢想的高速▽▼

外观好看不说,显卡出厂状态下直接为性能模式档,用户可以即插即用。Boost频率到了2640MHz,单精度浮点性能为40+TFLOPs,3D Mark FSE跑分2W6,Time Spy跑分2W2。面对我繁杂的项目需求,居然显得轻松有余,让我不由得感慨,550C真的太快了▽▼

内存也跑了分,供大家参考,AIDA64中可以看到,时延成绩为64.8ns,如果压压小参还可以再提升,读写由于是DDR4,看起来就没有DDR5那么漂亮,但用起来其实感知不大,虽说我们的是算力服务器,但个人用也没有太高的并发需求,跑跑AI软件足矣▽▼

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230616A011GA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券