开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

阶跃星辰联合吉利开源两款阶跃Step系列多模态大模型

文章来源：企鹅号 - 鞭牛士

鞭牛士 2月18日消息，今日，阶跃星辰与吉利汽车集团联合宣布，开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

官方介绍称，根据技术报告中的评测结果，阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平；而阶跃Step-Audio则是业内首款产品级的开源语音交互模型。

据介绍，阶跃Step-Video-T2V模型的参数量达到300亿，可以直接生成204帧、540P分辨率的高质量视频。

而阶跃Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征，同时也能支持不同角色的音色克隆。

发表于: 2025-02-182025-02-18 13:49:14
原文链接：https://page.om.qq.com/page/OJfaBya1vcEJm4NqRg8VWewA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯