首页
学习
活动
专区
圈层
工具
发布

#视频

当万相2.5刚开卷有声视频,7月已经发布音频一体化的百度蒸汽机又开卷长视频了

AI进修生

不过查了一下,第一个中文音视频一体化视频视频生成模型应该也是百度的:他们在7月份发布了MuseSteamer蒸汽机视频生成模型,可实现画面与音效、人声台词的协同...

8510

一块画板,Nano Banana,无限创意:谷歌新工具实测

AI进修生

这是一款人工智能驱动的概念板,可让你在一个屏幕上直观地探索、扩展和完善你能想象到的任何内容。旨在成为你想法的创意合作伙伴。

7610

昨天 B站又血崩了?!

悠悠12138

据多位网友反馈,故障主要表现为视频无法加载、页面打开缓慢或白屏、图片加载失败等问题。有用户表示:"打开B站后一直转圈圈,什么都看不了","首页能打开但是视频播放...

14110

客服团队必备!2025年FAQ管理工具推荐:支持批量导入与实时更新的TOP选择

gavin1024

14710

2025金九银十上云季:对象存储COS的8大实战场景,哪一款最对你的业务“胃口”?

gavin1024

以“视频号直播回看”场景为例,假设每天新增500GB原画视频,保存30天,其中20%在7天后无访问:

22210

小米放大招!开源“最强7B视觉大模型”MiMo-VL:小模型干翻百B巨兽,还能一键关闭思考

AI浩

更惊人的是:这款模型不仅能“看懂”图像和视频,还能告诉你它是怎么想的——甚至你可以命令它:“别想了,直接回答”。

20810

跟踪不稳定目标:基于外观引导的运动建模实现无人机视频中的鲁棒多目标跟踪

AI浩

https://arxiv.org/pdf/2508.01730v1 多目标跟踪(MOT)旨在跟踪多个目标,同时在给定视频的帧之间保持一致的身份标识。在无人机(...

16110

从制造到智造:AI 如何赋能生产力跃迁?

TVP官方团队

腾讯 | 产品经理 (已认证)

9 月 13 日(周六)下午 15:00,「探访灯塔工厂 共见制造新范式」腾讯云 TVP 走进美的将在腾讯云 TVP 视频号等多平台同步直播,扫描「海报二维码」...

17210

混元游戏2.0正式发布,全面开放使用

腾讯开源

9月5日,"混元游戏"(腾讯混元游戏视觉生成平台)发布全新2.0版本,新增游戏图生视频、自定义模型训练、角色一键精修等能力,并大幅提升游戏2D生图模型能力,图生...

26710

为什么你学了很多,能力很强,却依然混得很差?

安徽开发者圈

就是那些能学到的知识和技能,比如编写代码。这些东西重要吗?重要它们也是最容易获得的。

14410

Hutool被卖半年多了,现状是逆袭还是沉寂?

磊哥

是的,没错。那个被人熟知的国产开源框架 Hutool 距离被卖已经过去近 7 个月了。

19710

【模型免训练高效集成】DINOv2 + SAM 2

javpower

如果说第一代 SAM 已经让人眼前一亮,那么 2024 年发布的 SAM 2 则真正将图像分割推向了新高度。它在保持图像分割强大能力的同时,专门针对视频分割进行...

27510

Lovart 爽玩「Banana」,我汇总了当前的N种邪修秘法

AIGC新知

最近banana模型火出圈了,好多人发现了各种各样的玩法,比如说3D手办,P图等等。

27810

人物一致性新王Nano Banana登基,AI图片编辑史诗级升级。

数字生命卡兹克

但是这玩意我觉得真的够强,在我实际工作中也已经用上好几天,所以,体验下来,我是真的觉得对的这个史诗级名号。

24910

颤抖吧3D艺术家!字节Puppeteer让AI自动绑骨+动画:无需专家调参,生成效果超专业级

AI生成未来

论文链接:https://arxiv.org/pdf/2508.10898 Git 链接:https://chaoyuesong.github.io/Puppe...

35810

碾压SOTA!腾讯HunyuanVideo-Foley开源:让视频自动生成电影级音效,沉浸感拉满!

AI生成未来

文章链接:https://arxiv.org/abs/2508.16930 项目链接:https://szczesnys.github.io/hunyuanvi...

23710

混元世界模型上新,综合能力问鼎WorldScore排行榜

腾讯开源

混元Voyager框架创新性地将场景深度预测引入视频生成过程,融合了视频生成与3D建模优势,基于相机可控的视频生成技术,从初始场景视图和用户指定相机轨迹中,合成...

21210

怎样安装xapk软件?安卓的apk和XAPK的区别?安卓手机端安装xapk、apkm软件

小焱写作

.xapk是Android应用分发的一种格式,它是一种将Android应用的多个模块(如APK、配置文件、资源文件等)打包在一起的文件格式。其本质是一个压缩包,...

49310

美团开源InfiniteTalk,AI数字人从“对口型”到“演对手戏”!太强了

AgenticAI

本模型并不是视频生成,而是根据你提供的一段视频和一段新的音频,合成一个全新的视频。其中视频生成需要使用阿里的WAN之类的模型。

1.1K10

你能永远陪我聊天吗?复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

机器之心

如今随着扩散模型的兴起极大,涌现出大量基于音频驱动的数字人生成工作。具体而言,语音驱动人类视频生成旨在基于参考图像与音频,合成面部表情与身体动作与音频高度同步的...

19810
领券