汽车变革时代,如果说上半场的焦点是“能源”,那么下半场的焦点则一定是“智能”。
在汽车的智能化上,一般认为造车新势力的步伐会快些,从产品落地的速度上看也确实如此。但这并不意味着,传统厂商就是在故步自封。
传统厂商也是重视研发的,甚至在更健康的现金流和更完善的研发体系下,一些厂商的研发投入甚至要高于新势力。
例如,根据公开的财报信息,长城汽车2022年的研发投入为121.81亿元,而“蔚小理”的这一数字则分别是108亿、52.1亿、67.8亿。
当然,长城与“蔚小理”等新势力并不完全处于同一“赛道”,因此这些数字并不宜直接对比,但这依然可以让一些“传统车企在摆烂”之类的谣传不攻自破。
可能有人好奇:长城研发投了这么多钱,花在哪了?
「智能化」绝对是其中的“吃钱”大户。
9月12日,长城在总部保定开办了一次“智能沙龙”,我们也因此得到了一探长城智能化布局全貌的机会。
长城透露,随着智能化在汽车竞争中的权重不断增大,长城也一直在增加相关的“筹码”,截止目前已设立或收购了包括毫末(智能驾驶)、诺博科技(智能座舱)、曼德(电子电气架构)等诸多智能化关联公司,在全球布局了10个研发中心,关于智能化相关的研发人员就已超过了4000人。
4000人,放到互联网公司中已属于相当大的规模了,那么在如此大的研发投入下,长城又做到了什么?
结果反而非常收敛,就是长城口中的“咖啡智能”。
“咖啡智能”是一整套汽车智能化体系,是长城汽车整车智能化技术品牌。在“咖啡智能”体系下,包含了智能座舱、智能驾驶、电子电气架构、云平台等多个并行模块。
例如我们常提到的毫末智行,就是负责咖啡智能驾驶的主力军。他们在国内率先引入了超大规模机器学习模型 Transformer,将Transformer 模型融入到其MANA(雪湖系统)中,极大地提高了车辆视觉感知的能力,并由此率先确立了“重感知、轻地图”的技术路径。
而随着以GPT为代表的大模型的涌现,毫末也率先提出了DriveGPT的概念,针对自动驾驶这种特别“专”的应用场景,推出了自动驾驶生成式大模型“雪湖·海若”,具备驾驶场景识别、智能驾驶、驾驶行为验证、困难场景脱困等四大应用场景。
可以说,在自动驾驶前沿技术上,毫末、或者说长城,是一直走在前列的。
智能座舱亦是如此。
今年3月,随着哈弗二代大狗的上市,长城汽车全新一代智能座舱系统Coffee OS 2也正式亮相,这套系统基于长城GEEP3.5架构打造,不仅触控响应速度快,而且还大幅加强了其语音交互的能力。
比如,基于Coffee OS 2的语音助手,首次唤醒的响应时间仅需250毫秒,而业界第一梯队的平均速度为300-350毫秒。同时,它的语音引擎音色和对话节奏也像聊天一样自然,并且支持全场景语音连续对话、上下文理解、可见即可说等高阶语音能力。
例如,笔者在现场体验魏牌蓝山(同样基于Coffee OS 2)的语音助手时,就尝试了这样一个对话:
“我想听周杰伦的歌”
“换成它的布拉格广场”
“再换一个”
“音量小点”
“再小点……”
简短的5句对话,“小魏同学”均能快速地理解我的意图并快速执行。
整体体验下来,能感觉到Coffee OS 2的语音助手在能力上是足以位列第一梯队的,包括夸
车控域的连续命令、前后排分区语音识别等能力均具备,这可能有点突破部分人的认知。
不止语音交互,在蓝山的车机系统中,还具备一个“AI实验室”功能,其中包含了“手势控制”“导航转向灯辅助”“姿态识别”等功能,通过OK、比V、点赞、比嘘、比心等手势,就能实现座舱高频功能的快捷操控,例如静音、确认等等。
有趣的是,与其他车型通过红外或者TOF传感器来识别不同,蓝山的“手势控制”是通过车内摄像头对手势的识别来实现的。没错,长城在这一功能中也引入了AI视觉感知的能力。
对长城来说,AI正是智能化下阶段的关键所在。
在这次沙龙上,长城宣布,成立智能化前沿组织——TCAL(Technology Center Al Lab,简称 Al Lab)。
顾名思义,这是一个专注于AI技术的研究机构,负责人是曾在沙龙任职的杨继峰。
但从具体职能来看,Al Lab并不专注于某一方面AI技术、算法的研发,它的官方定义为:“基于跨域化、横向化、创新化的理念,以算力、算法、大模型能力建设为基础,将动力、底盘、造型、上车身等组织拉通,打造长城汽车大模型服务平台,形成面向整车领域与研发领域的技术中台。”
看起来有些难理解,但其实只需抓住其中关键——「大模型」。
无论在哪个行业,「大模型」的概念都十分火热,但对于汽车行业来说,如何将「大模型」落地、应用,目前尚无定数。
而在长城的规划里,「大模型」或将成为未来一切业务的“基座”,不仅包括智能座舱、智能驾驶,甚至还包括技术研发、车型开发等。
具体来说,在未来,长城的智能驾驶将会以「大模型」为基础,在车端感知方面,采用“感知大模型”,提升车辆的感知推理性能;在决策方面,将采用“认知大模型”,全面升级智能驾驶的预测、决策、规划算法的架构体系;在模型训练方面,将引入“3D场景构建大模型”,在虚拟世界中实现对现实世界的“重建”,为感知和决策模型的训练和升级提供更丰富的数据,降低Corner Case的构造成本。
而在座舱方面,将引入SpaceGPT空间感知大模型,基于多模态大模型的端到端能力,将时间、地点、车辆状态、驾驶员行为等多模态信息进行整合推理,得出每一时刻的“座舱空间”状态,让智能座舱也具备“预测”和“决策”能力,从而让智能座舱由“被动服务”向“管家式主动服务”转变。
例如,基于SpaceGPT空间感知大模型,车辆可以精准判断驾驶员是真的在打盹,还是只在眯眼,并基于时间、车速、驾驶员的操作行为等综合判断,实现最适合当下的驾驶行为提醒或个性化的内容推荐。
可以说,基于「大模型」的引入,车辆的智能化体验也会出现“涌现”般的飞跃式提升。
当然了,这一切的实现仍需要时间,但从这些架构层面的规划和布局来看,不难发现长城在车辆智能化方面的坚定。
长城做智能化能成吗?我们所期盼的“真智能”汽车能否到来?何时到来?接下来的关键,就是拼“速度”了,我们拭目以待。
领取专属 10元无门槛券
私享最新 技术干货