理科状元！零一万物发布开源大模型Yi-9B

文章来源：企鹅号 - 晓得智能

全文共计1092字，预计阅读4分钟

零一万物开源社区近日迎来了Yi系列最新力作——Yi-9B大模型的发布，这款被誉为“理科状元”的人工智能模型凭借卓越的代码和数学综合能力，以及强大的中英文双语处理能力，成为了开源社区关注的焦点。

此举不仅是零一万物自年初开源多模态模型Yi-VL-34B后的又一重大里程碑，更是为全球开发者提供了高效且成本友好的智能助手。

| Yi-9B：全面提升，多项评测名列前茅

零一万物精心打造的Yi-9B模型在多个维度展现出非凡实力。综合能力评测（Mean-All）中，Yi-9B荣登同尺寸开源模型榜首，远超DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等同类竞品。

尤其在代码能力（Mean-Code）与数学能力（Mean-Math）两项专项评测中，Yi-9B紧随细分领域最强者之后，再次印证了其在技术领域的深厚积淀。

同时，在常识推理能力（Mean-Text）上，Y-9B也表现出色，与顶尖对手平分秋色。

| 核心亮点：代码与数学技能爆棚

Yi-9B不仅延续了Yi系列一贯的卓越语言处理能力，特别是在中英文方面的表现，而且针对先前模型在代码和数学方面的潜在提升空间，进行了针对性优化。在非文本任务上，Yi-9B实现了跨越性突破，打破了原有的性能壁垒。

| 参数规模与训练效率：高性价比的典范

Yi-9B的实际参数规模达8.8B，遵循行业标准命名规则，并在表2所展示的参数量对比中，以仅高出Gemma-7B约7%的有效参数量，实现了更为优异的性能表现。

此外，Yi-9B及其量化版都能够轻松适应消费级显卡，降低了开发者的硬件门槛与使用成本。

| 深度挖掘训练秘籍，实现性能飞跃

零一万物预训练团队在模型训练环节大胆创新，结合模型深度扩增与多阶段增量训练策略，使得Yi-9B最终脱颖而出。面对扩容挑战，团队并未简单地增加数据量，而是依据scaling laws原理，首先增大模型规模至9B，随后采用精细化的多阶段数据增量训练法。

在扩充模型深度的过程中，团队通过对Yi-6B内部结构的细致分析，选择了复制较为成熟的12-28层，组成48层的Yi-9B，确保新增层能够最大限度地继承和提升原模型性能。这一深度扩增决策在实验结果中得到验证，Yi-9B在保持低性能损失的前提下，成功实现了对前辈Yi-6B的全面超越。

| 未来之路：持续优化，勇攀高峰

展望未来，零一万物团队将持续探索模型训练前沿，致力于研发更优化的宽度扩增方法和高效分阶段训练方案，动态平衡模型大小与数据规模，以期在保证性能最优的同时，进一步降低训练成本，普惠广大开发者。

零一万物Yi-9B模型的开源，无疑为人工智能领域注入了一股新的活力，它以其独特的综合能力和亲民的使用体验，正引领着大模型在编程、数学及自然语言理解等多领域应用的新潮流，为构建更智能的世界写下浓墨重彩的一笔。

项目：https://github.com/01-ai/Yi

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货