首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Sora的秘密:30亿参数背后的超级能力,大佬谢赛宁怎么看?

Sora火了,简直就是视频界的爆款神话。这货一出,立马成了网红,各种狂欢,人气爆表。看着作者小哥那些让人眼前一亮的视频,连失败的都让人停不下来。点赞破万,学术界大咖们也忍不住加入讨论,一时间,Sora成了头号话题。

纽约大学的谢赛宁直接宣布:Sora要重塑视频生成领域。英伟达的Jim Fan更是激动地呼喊:这就是视频生成的GPT-3时代啊!技术细节虽然有点模糊,但这反而激起了更多猜测,Sora到底是怎样的存在?

体验中国版Sora公众号搜:索啦AI创意

让我们来掰扯一下,Sora究竟有啥玄机?它是一个在各种格式视频和图像上训练的扩散模型,还整了个Transformer架构,简直就是扩散界的变形金刚。官方放出的技术干货虽然只有那么几点,但足够让人好奇:从视觉数据的独特处理,到视频压缩技术,再到扩展Transformer的黑科技,每一样都让Sora的魅力加分。别的不说,单是Sora对视频多样性的处理,就已经让它在视频生成界独树一帜。

接着,语言理解能力也不容小觑,这得益于OpenAI将DALL·E 3的技术引入视频领域。总而言之,虽然文中对“patch”等关键技术讲解不多,但Sora的能力已经显而易见。

体验中国版Sora公众号搜:索啦AI创意

当然,对于Sora的猜测五花八门。有的说它建立在DiT上,有的说可能采用VAE架构,参数大概30亿。而且,Sora的训练可能并不需要想象中那么疯狂的资源。另一边,有人认为Sora是个数据驱动的物理引擎,甚至有胆大的网友猜测Sora用了虚幻引擎5做训练数据。各种猜测虽然有趣,但也显示出Sora的神秘和吸引力。

OpenAI因Sora火得一塌糊涂,估值飙升至800亿美元,直追字节跳动和SpaceX,成为科技界的新贵。这不仅是对Sora,也是对OpenAI技术实力的一种认可。虽然“GPT”商标申请没过,但这点小插曲丝毫不影响Sora的光芒。

最后的彩蛋是,Stability AI似乎也想分一杯羹,但在Sora的光环下,他们的SVD 1.1显得有点黯淡。

简言之,Sora不仅仅是技术的革新,更是一次对视频生成领域想象力的挑战。它的火爆,预示着视频生成技术的新纪元已经来临。想深入体验,就来搜索啦AI创意,看看Sora能带给我们怎样的视觉盛宴!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oa9zp41qA_agK2mbG3-JAvgQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券