首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2月16日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动中,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....

有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TiktTok等一众长视频或短视频网站估计要迎来一波新的流量。”

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

而OpenAI员工will depue则表示,他们过去两个月一直忙于此事,目前Sora还处于早期宣传阶段。根据OpenAI随后发布的论文来看,这个模型的能力确实已经超出了OpenAI最初所宣传的。

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确性方面可能会遇到困难,也可能无法理解具体的因果关系实例。

例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OH_d2SvEyq9vCBd1q2hcIUQw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券