首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

生数科技Vidu视频模型革新Sora架构,真实物理世界模拟,API申请开启

Vidu 视频模型开放 Sora架构

7月30日,生数科技正式宣布其Vidu视频模型对外开放,并开放了API申请。这一举措标志着我国在AI视频生成领域的又一次重大突破。Vidu模型凭借其独特的U-ViT架构,可模拟真实物理世界,为用户提供高质量的AI视频生成服务。

早在今年4月28日,Vidu模型便在中关村论坛未来人工智能先锋论坛上与清华大学共同发布,成为国内首个长时长、高一致性、高动态性的视频大模型,达到Sora级别。如今,Vidu模型开放Sora架构,将为更多用户带来创新体验。

Vidu视频宣传片如下:

Vidu模型的核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。

Vidu套餐服务详情

免费版:无积分,不支持商用

包月套餐:US$7.99/月,年费US$95.99(50%折扣),支持生成4秒视频,超清,不支持商用

标准版:US$23.99/月,年费US$287.99,支持生成4秒视频,超清,不支持商用

高级版:US$79.99/月,年费US$959.99(50%折扣),支持生成4秒至8秒视频,超清,支持商用,1个并行任务,超清后去除水印

尊享版:年费US$287.99,支持生成4秒至8秒视频,超清,支持商用,4个并行任务,新功能优先体验,超清后去除水印

主要特点和技术创新:

1. 模型结构:Vidu模型融合了Diffusion与Transformer技术,创新性地开发了U-ViT架构。

2. 视频生成能力:Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容。

3. 实际应用演示:官方资料中展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。

4. 高级功能:Vidu不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。

Vidu的开放,将为我国AI视频生成领域带来新的发展机遇。用户可通过API申请,利用Vidu模型进行各种创新应用的开发。未来,随着Vidu技术的不断成熟和普及,必将为人们的生活和工作带来更多便利。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OrAKfZDaxVpSUU02dP69WIDA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券