这篇文章,聊聊不同类型的 Windows 设备上使用雷电显卡坞外接 Intel 显卡的经验(同适用 AMD 显卡),希望能给有类似需求的朋友一些参考。
上周回北京的前一天,收到了一张 Intel ARC 580 显卡,作为一个爱折腾的人,分享下这几天有趣的折腾过程。
知乎版利益无关“众测召唤”
这件事情,要从这封信开始。
Intel ARC 这张显卡,从 2024 年 12 月开始,就有各路媒体和爱好者入手,发布了许多评测,不过好像没有多少是和“雷电显卡坞”相关的,尤其是似乎没有人打用雷电显卡坞跑模型的心思。
元旦第二天,我在知乎上收到了小鱼的一条帖子里的评论“阿特”,知乎好物团队购买了几张蓝戟 Intel Arc B580 显卡[1],邀请答主们做评测。
那么,就填报报名呗。随后,我就收到了下面这封信:
可以说“不好的”的评测邀请
实话说,我对这张显卡还是蛮感兴趣的。主要有三个原因:
首先,Intel 在 2022 年推出的 Arc A770(A770 规格[2])就是一张堆料很猛的显卡。有趣的是,这张卡从最初的“差评如潮”到后来口碑逐渐转好,也就用了一年时间,圈内甚至给它起了个“养成系显卡”的昵称。
抛开游戏性能不谈(我有 4090 和 4090 mobile、Steam Deck 等),就单说模型推理来说,在不追求极限性能的情况下,它在玩 LLM 和 Stable Diffusion 图像生成上的表现都相当不错,尤其是价格很棒,功耗也不高,显存给的还多。
我收到的是蓝戟版本的卡,非公版
而这次的 B580,同样是一张堆料很猛的卡,让我想起了当年小米红米系列的堆料性价比路线。
白色显卡印着“前沿探索”
我个人觉得显卡和小徽章的颜值都蛮高的。硬件参数解析相关的事情,网上参数一大把,我就不写了,还能节约点篇幅分享折腾过程。
其次,虽然我家里已经有了 4090 和 4090 mobile,但这两张卡在运行时的噪音确实有点大。如果能有一张功耗更低、运行更安静的显卡,并且通过某种灵活的高性能连接方案,让家里其他设备也能获得 AI 运算能力,那想想就很有意思。
4090 大小“亲兄弟”
我之前的文章里,多次提到过“雷电接口”(之前的文章[3]),这项技术最早主要出现在高端笔记本和游戏本上。随着市场发展,现在很多小主机也都配备了功能类似的 USB 4 接口,支持“雷电组网”。如果这张配置强劲的显卡能通过雷电接口实现热插拔,岂不是能随意接入各种设备使用了?
有朋友可能会提到雷电接口组网会带来带宽损耗和预留问题。这确实不假,在许多使用场景下会产生明显的性能瓶颈。不过对于模型推理这个特定场景来说,这个问题主要只会影响模型的初始加载过程。一旦模型被成功装载到显卡显存中,如果不频繁切换模型的话,实际的运算性能并不会受到明显影响。这个场景下,它比还在发育过程中,尚未成熟的 OCuLink 要更合适这个场景一些(很少能够热插拔,并且许多设备需要改装)。
最后,我觉得应该有不少朋友和我一样,偶尔会想玩玩游戏,但手头的设备要么是工作用的,要么装的是 macOS 或 Linux。虽然有各种掌机可以选择,但有时就是想体验下 Windows 下的经典老游戏,这张卡或许能满足这种临时起意的游戏需求。
好了,让我们入坑开始。
在入坑前,我想分享一个小知识点,对于是否能够正常使用这张显卡至关重要。
Resizable BAR (Base Address Register) 是一个 PCI Express 总线规范中的功能,它允许 CPU 直接访问显卡全部的显存空间。在这项技术出现之前,CPU 只能以 256MB 为单位分块访问显存,这种方式会造成额外的处理开销和延迟。
启用 Resizable BAR 后,CPU 可以一次性访问完整的显存空间,显著提升数据传输效率。这项改进在特定游戏场景下可以带来至少 5-10% 的性能提升,尤其是在需要频繁加载纹理或处理大量资产的游戏中表现更为明显。
然而,NVIDIA 显卡对这项技术的依赖度并不高。这是因为 NVIDIA 早已在硬件层面实现了类似的功能,称为 BAR1 映射。此外,NVIDIA 的显卡架构本身就对内存访问进行了深度优化,再加上其成熟的驱动层优化方案,使得 Resizable BAR 带来的额外收益相对有限。
相比之下,Intel 和 AMD 显卡从 Resizable BAR 获得的收益更为显著。这主要是因为 AMD 显卡的内存访问架构相对简单,也没有类似 NVIDIA BAR1 这样的专有解决方案。因此,启用 Resizable BAR 能够为“红蓝厂显卡”带来更明显的性能提升。
我们使用的笔记本或掌机设备,具体是否支持,不仅仅要看 BIOS 设置选项,或者使用 GPU-Z 等软件探测,还需要实际实机验证。
入坑第一步是选择显卡坞类型,看到标题,你已经知道了我的选择。但是我还是想和你分享下,我为什么会选择雷电接口的显卡坞。
虽然 eGPU 硬件方案有许多种,但是主流的方案还是雷电接口,设备可选性和成熟度也相对其他方案更高。
eGPU 官网中的设备列表
详细展开原因,主要基于以下几点考虑:
首先,是接口的普及性。从 2015 年苹果率先采用 Type-C 接口并推广“雷雳”协议开始,各大品牌陆续都开始支持雷电接口。特别是 2020 年推出的雷电 4,不仅对雷电 3 进行了升级增强,还推动了 USB 4 协议的发展。现在我们用的设备,尤其是笔记本电脑,基本都标配了满血雷电 4 或者几乎等价的 USB 4 。
其次,是使用场景的灵活性。用雷电扩展坞的好处是,我可以带着轻薄本到处跑,回到家接上显卡坞就秒变“工作站”。而且只需要一根线就能搞定所有外设,再也不用为桌面上缠绕的各种线缆发愁了。
最重要的是安全性。跟其他外接显卡方案比,雷电显卡坞普遍都支持安全“热拔插”,而且接口发热问题是最轻的。 要知道,如果使用设备时要小心翼翼,用户体验就会线性下降。比如,我之前写过的那篇关于 ROG 幻 X 和 4090 扩展坞的文章(《便携移动工作站,端侧 AI 大模型设备折腾笔记:ROG 幻 X 和 4090 扩展坞[4]》)提到的设备,有用户因为热拔插导致设备接口烧毁。所以,虽然设备算力很棒,但是每次使用都要小心翼翼。
另外就是性价比了。随着各路厂商和 DIY 玩家的加入,雷电扩展坞设备的价格也越来越亲民了。
虽然雷电接口的普及和苹果的大力推广离不开关系,但是想要在非 Intel 芯片的 Mac 设备上使用 eGPU,暂时是不被支持的。
在 Apple 还在使用 Intel 处理器的时代,这个方案是提升 Mac 设备性能的高性价比方案,可以用来相对低成本完成媒体处理性能的提升。但随着 M 系列芯片的推出,苹果在软硬件层面都设置了严格的限制(软硬件防火墙高耸)。所以,目前这个方案目前只能用于非苹果设备或者苹果 Intel 芯片的老设备了。
macOS 只能做到扩展坞连接
新的 Apple 芯片的设备,仅仅能够做到连接扩展坞,识别出 40Gbps 的雷电连接。
我之前写过两篇文章,一篇是《突破内存限制:Mac Mini M2 服务器化实践指南[5]》,另一篇是《MacBook Pro 原生安装 Ubuntu 24.04 ARM 版[6]》,其中提到的 Asahi Linux 目前正在开发雷电驱动支持。也许在不远的将来,Mac 设备也能重新使用上雷电显卡坞,尤其是未来的雷电 5 显卡坞。
开始动手前,有不少需要准备的东西,软件、测试硬件、显卡坞硬件、驱动、系统,都得盘一盘。
第一阶段的测试,我使用了多台不同类型的设备,除了任何现成的“台式机”。
测试使用的一些设备
这些设备类型,应该都比较有代表性:
因为英特尔官方“ARC 显卡,台式机快速入门指南[10]”中专门提到了这个系列的显卡需要 10 代之后的 CPU,所以我没有测试其他的支持雷电,但是芯片代数小于 10 代的设备。
上面这些设备目前基本都使用 Linux 操作环境(Ubuntu 24.04 ~ Ubuntu 24.10)或 macOS 操作系统。为了验证不是 Linux 操作系统驱动兼容性的问题,以及验证雷电显卡坞靠谱,我特意将两台 Intel 笔电和一台 AMD 迷你主机更换了操作系统,重新安装了 Windows 操作系统。
给 B580 “安个家”
我选择的是一款老设备:Razer Core X Chroma 雷蛇战核 X 幻彩版[11],官方说明书[12]中提到它是支持雷电 3 的,实际上不论是官网还是大家实测,雷电 4 也是支持的。
知乎上的用户经验是这样的
选择它之前,我还使用了“知乎版的 Perplexity”,知乎直答,比较了几轮。基本上每轮都有雷蛇灯厂出品的“战核幻 X”。
选择它,除了看中它的颜值在线、价格实惠(海鲜市场 600 元)外。相比较“开放式机箱”,有金属外壳保护的情况下,既保护了我家猫,也保护了显卡坞里的显卡,当然,这个设备还附带一堆额外的接口。
关于这个显卡坞的详细介绍,文章《Razer Core X Review – Thick and Juicy[13]》里讲的比较多了,我就不赘述了。如果你对这个设备感兴趣,一定要阅读官方设备参数页面[14],了解供电和显卡坞空间尺寸。设备个性化相关驱动可以在 Razer Core X 支持页面[15]找到。
核心板尺寸不大
显卡坞使用的扩展板尺寸不大,比我之前买过的 PCIe 雷电扩展板小多了。可惜的是这个板子上使用的是 6 系雷电芯片,带宽限制在 22Gbps。目前最新的 9 系芯片,能够达到 80 / 120G 连接。或许,随着支持雷电 5 的主板和设备变多,雷电 5 显卡坞产品也快出现了吧。
整个过程中,我分别使用 Linux 和 Windows 进行了一些基础的验证尝试。
Win11_24H2_Pro_Chinese_Simplified_x64.iso
),安装使用《开源的全能维护 U 盘工具:Ventoy[17]》文章中的方法,或者经常在文章中提到的 Balena Etcher(“制作系统安装引导盘的两种方法[18]”)制作好安装镜像即可。因为篇幅原因,本篇文章先聊 Windows 环境下的设备情况。
当前时代下的 Linux、Windows、macOS 都内置了不少设备驱动,能够满足我们的设备基础运行。雷电接口在当前世代系统,也基本都是免驱动的。
所以,我们只需要考虑显卡驱动问题即可。 相比较常见的 N 系显卡,Windows 和 Linux 基本免驱(系统会自动安装驱动),Intel ARC 新出显卡和 AMD 显卡一样,通常需要我们手动完成显卡驱动的安装。
在Intel B580 的官方驱动网站[19]中,目前其实只有 Windows 驱动下载。如果我们点击 Linux (驱动更新时间 2025 年 1 月 9 日,提示适配 Ubuntu 22.04),会出现这个页面和驱动页面相互引用的无尽循环,但就是没有可用的驱动包。
这篇文章只聊 Windows 系统的驱动问题,关于 Linux 环境的 ARC 显卡驱动问题,我们在下一篇文章再聊。
雷电数据线有 3、4,主动/被动线的差异,虽然这几种线我都有,但是这次测试为了减少干扰因素,我只使用了雷电4被动数据线。
Linux 下的测试软件有非常多,不少都是开源软件,可信度相对都比较高。但 Windows 环境下,因为近些年评测已经是一门生意,厂商、评测机构经常使用的软件逐渐娱乐化。
为测试准备的“小软件”
所以,我准备了一款不一样的,但又很常见的测试工具。这个游戏出圈之后,可以站着赚钱,应该不需要适配厂商出一些“数字”结果。
下面的过程看似简单,其实花了非常多的时间折腾。
让我们先从 Windows 开始折腾。
为测试准备的“新窗户”
第一台测试的设备是 ThinkBook 14,CPU 是 Intel 13700H,机器没有独显。这台设备是非常典型的日常办公场景用的笔记本。
系统正常识别雷电显卡坞
安装好系统后,默认情况下能够直接识别我们的雷电显卡坞,和显卡坞上的各种接口(网口、USB、HDMI),但是 Intel ARC 显卡是不能直接识别的。不过,为了能够控制“光”,我们可以下载上文提到的个性化驱动。
完成显卡驱动安装
同样的,使用上文中提到的 Windows 驱动,完整显卡的驱动。在安装过程中,显卡就能够被激活,我们在任务管理器中,可以看到这张显卡的基础资源情况。
控制面板显示不支持 Resizable Bar
重启设备后,我们打开 Intel 的控制面板,能够看到这张卡的运行状况。这里,除了能够展示我们的独显信息外,还能够正确识别到 13700H 上携带的集成显卡。
不过,界面中红色的标签告诉我们这台笔记本电脑(Lenovo ThinkBook)的主板不支持 Resizable BAR 特性。** 在文章的开头,我提到过 Resizable BAR 对于这张显卡的重要性。**
用黑猴进行第一次测试
在没有 Resizable BAR 的情况下,虽然游戏也能运行,但是测试工具(默认配置)输出结果惨不忍睹。两次测试结果都只有 18 帧。退出游戏后,打开任务管理器,能够看到刚刚 GPU 吃满了,没有“消极怠工”。
用“虚幻4”游戏做第二次测试
为了排除不是虚幻 5 引擎游戏的事情,我换用媳妇说的“马赛克小游戏”做第二次测试,虚幻4 引擎制作的逸剑。运行是能运行,但是非常卡,帧率不时就掉到 0 帧, GPU 使用率基本经常 100%,显存使用还好,只使用了 2GB(显卡资源的 1/6),还有很大冗余。
使用 4090 对照测试参考
我使用台式机的 4090 运行了这款游戏,显存资源使用差不多,GPU 使用率大概是 24%。
此处虽然不合适这样直接对比,但至少说明在这台机器的软硬件环境下,游戏测试这关是过不去了。
Windows 系统的启动过程中,即使我们看不到类似 Linux 设备的 dmesg
的日志输出,但是根据 Linux 的经验,如果我们直接插着显卡坞启动设备,让设备在启动的时候就默认使用外置显卡坞作为视频设备,或许是能够提升性能的,也能够减少一些不必要的干扰项。
用黑猴进行第二次测试
我这样试了试,并进行了两次黑猴测试,平均帧率从 18 帧提升到了 21~22 帧。有提升,但是不明显。
Intel 核显设备 GPU-Z 展示主板状况
通过 GPU-Z,我们能够直观的看到这台设备的主板状况。
主板的“Above 4G Decode enabled in BIOS” 选项虽然在主板中找不到,但其实已经是打开了的,可是最关键的“Resizable BAR”选项却没有打开。
开源项目 github.com/xCuri0/ReBarUEFI[20] 或许解锁这个选项,但是可能会带来一些副作用。目前这台设备还有其他的用途,反正还有其他的设备可以验证,那么在之后的文章中,我们再来试试使用这关方式进行复现吧。
测试到这里,我个人认为,在修改 BIOS 解锁 ReBAR 特性支持之前,这台设备的 Windows 环境的表现,没有继续测试必要了。
当然,如果你对这个有限制的系统环境下,模型的运行效率感兴趣,可以参考《基于 Docker 的深度学习环境:Windows 篇[21]》完成 Docker 环境的部署,参考之前类似这些文章[22]内容进行基础测试。
有了“第一关”的测试经验,我们了解了 Windows 系统下,即便显卡坞和显卡都能够被正确驱动,但是如果没有 ReBAR 特性支持,外置显卡坞使用 Intel 显卡的使用体验通常是比较糟糕的。
接下来,我们来验证一台国产迷你小主机。这类小主机通常以迷你台式机的定位出现,相比较笔记本 BIOS,相对更加开放,不过也相对缺乏精细设计和验证。
国产迷你主机
我测试的设备是零刻的 SER7(AMD 7840HS),完成系统的安装之后,我们首先使用 CPU-Z 和 GPU-Z 来了解设备基础状况。
测试的开始,就有一个好消息和一个坏消息。
AMD 核显设备 GPU-Z 展示主板状况
坏消息是,使用 GPU-Z 查看 ReBAR 支持,默认情况下,设备不支持 ReBAR。
这台 AMD 设备可以打开 BIOS,启用 ReBAR
好消息是,我们可以在 BIOS 中,打开这个选项。
接下来,是第二个好消息和第二个坏消息。
设置并不奏效
坏消息是,BIOS 开启的设置,实际测试下来并不完全符合预期。它在 Windows 中并不奏效。
好像相同游戏的情况有点变化
好消息是,上文中的游戏帧率都有了一些改善(黑猴微弱改善、逸剑改善明显),看来这个设置并不是完全没有奏效。逸剑的帧率记录中一度能够 60 帧运行(也有掉帧),并且 CPU 和 GPU 的占用率都得到了非常大的改善。
关于 ReBAR 的支持,这里应该是官方 BIOS 的 BUG。在官方论坛和社区爱好者论坛里,都有用户反馈过。比如,有海外用户反馈 “resize bar not detected[23]” 的问题,不论是 ARC 770 还是 AMD 7900 都无法完成显卡配置。可惜这个问题反馈被另外一个用户的跟帖打断了。除此之外,最近还有其他用户也在反馈类似问题[24],从回复看起来厂商没有计划做积极 BIOS 改进支持。
为了减少干扰项,我进行了一些其他的尝试。
禁用 AMD 780m 核显,未能解决问题
我穷举试验了 BIOS 中的设置,不论如何调整,均未能解决 ReBAR 识别的问题。包括正确禁用掉 AMD 780m 核心显卡,并强制设备只使用扩展坞进行输出。
当然,因为这台小主机的 BIOS 存在一些 BUG,在这台设备中完成上面的操作,需要很多额外的技巧,甚至可以单独展开一篇文章来聊了。
此外,我除了尝试只允许蓝厂显卡工作之外,还尝试了更新官方提供的各种版本的 BIOS。很可惜的是,不论是论坛提供的 BIOS[25]、官网提供的 BIOS[26],还是官方 BIOS 下载站[27]提供的 BIOS 程序,在刷机的时候,都会提示“secure flash rom verify fail”错误,无法完成刷机。
测试到这里,我个人认为,同样在修改 BIOS 解锁 ReBAR 特性支持之前,这台设备的 Windows 环境的表现,没有继续测试必要了。
到这里为止,对于只有核心显卡的设备,在 Windows 环境下使用雷电显卡,外接 Intel ARC 显卡的状况,大家应该就都了解啦。
实际上,除了文章中的测试,我还进行了很多次验证。在不能解锁主板 ReBAR 选项前,再次进行 Windows 环境下的测试应该没有任何必要