首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

16G以上显存N卡进,文字生成视频本地整合包体验!

16G以上显存N卡进,文字生成视频本地整合包体验!

文本到视频生成扩散模型, 通过输入英文描述文本,返回符合文本描述的视频。文本到视频生成扩散模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。案例如下所示。

Robot dancing in times square.(机器人在时代广场跳舞)

Clown fish swimming through the coral reef. (小丑鱼在珊瑚中游泳)

学术Fun将上述工具制作成一键启动包,点击即可使用,避免大家配置Python环境出现各种问题,下载地址:  https://xueshu.fun/2804/

整合包使用教程

下载压缩包下载地址: https://xueshu.fun/2804/

解压后,如下图所示,双击bat文件运行

打开软件如下图所示

浏览器访问http://127.0.0.1:7860/,即可在浏览器里操作啦!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O6e2kNjeOB1OHmyCVsxsMX4g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券