生数科技Vidu视频模型革新Sora架构，真实物理世界模拟，API申请开启

文章来源：企鹅号 - 爱尚学院

Vidu 视频模型开放 Sora架构

7月30日，生数科技正式宣布其Vidu视频模型对外开放，并开放了API申请。这一举措标志着我国在AI视频生成领域的又一次重大突破。Vidu模型凭借其独特的U-ViT架构，可模拟真实物理世界，为用户提供高质量的AI视频生成服务。

早在今年4月28日，Vidu模型便在中关村论坛未来人工智能先锋论坛上与清华大学共同发布，成为国内首个长时长、高一致性、高动态性的视频大模型，达到Sora级别。如今，Vidu模型开放Sora架构，将为更多用户带来创新体验。

Vidu视频宣传片如下：

Vidu模型的核心技术U-ViT架构由团队于2022年9月提出，早于Sora采用的DiT架构，是全球首个Diffusion与Transformer融合的架构。2023年3月，团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser，率先完成了U-ViT架构的大规模可扩展性验证。

Vidu套餐服务详情

免费版：无积分，不支持商用

包月套餐：US$7.99/月，年费US$95.99（50%折扣），支持生成4秒视频，超清，不支持商用

标准版：US$23.99/月，年费US$287.99，支持生成4秒视频，超清，不支持商用

高级版：US$79.99/月，年费US$959.99（50%折扣），支持生成4秒至8秒视频，超清，支持商用，1个并行任务，超清后去除水印

尊享版：年费US$287.99，支持生成4秒至8秒视频，超清，支持商用，4个并行任务，新功能优先体验，超清后去除水印

主要特点和技术创新：

1. 模型结构：Vidu模型融合了Diffusion与Transformer技术，创新性地开发了U-ViT架构。

2. 视频生成能力：Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容。

3. 实际应用演示：官方资料中展示了一个视频示例，内容是“画室中的一艘船驶向镜头”，展现了船和海浪的逼真效果。

4. 高级功能：Vidu不仅能模拟真实物理世界，还具备丰富的想象力，支持多镜头生成和高时空一致性。

Vidu的开放，将为我国AI视频生成领域带来新的发展机遇。用户可通过API申请，利用Vidu模型进行各种创新应用的开发。未来，随着Vidu技术的不断成熟和普及，必将为人们的生活和工作带来更多便利。

发表于: 2024-12-032024-12-03 13:54:35
原文链接：https://page.om.qq.com/page/OrAKfZDaxVpSUU02dP69WIDA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

生数科技Vidu视频模型革新Sora架构，真实物理世界模拟，API申请开启

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐