首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#视频

2.3K Star.极客玩法!使用蓝牙设备解锁你的Mac电脑

开源日记

800

Open-Sora全面开源升级:支持16s视频生成和720p分辨率

机器之心

Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频...

100

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

机器之心

过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety System...

1100

CVPR 2024 | 跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式

机器之心

在日常活动中,人的运动经常引起衣服的附属运动 (secondary motion of clothes) 并因此产生不同的衣服褶皱,而这需要对人体及衣服的几何、...

1100

颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑

新智元

这是一款重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个...

2700

Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率

AI科技评论

现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来...

1500

【工具资源】药物研发平台;物理符号优化平台;手术视频可视化解答

HyperAI超神经

在 AI for Science 的规模化推广过程中,低门槛使用且开源的高性能工具至关重要。一方面,科研人员能够通过上手使用,更加直观地了解 AI 的能力;另一...

1500

在线教程丨刘强东数字人首秀交易额破5千万!用GeneFace++ 生成实时说话数字人

HyperAI超神经

近日,京东创始人刘强东化身「采销东哥 AI 数字人」,在京东家电家居和超市的采销直播间开启了自己的直播首秀。此次直播活动观看人次超 2 千万,交易总额超 5 千...

1500

如何使用Metropolis微服务为NVIDIA Jetson构建AI网络视频录像机

GPUS Lady

苏州吉浦迅科技有限公司 · 联合创始人 (已认证)

此外,利用Metropolis微服务在NVIDIA Jetson上运行的生成式AI模型,可以更轻松地深入洞察和分析视频流,实现动态和交互式应用。这种能力使得Me...

1200

CVPR2024-扩散模型可解释性新探索,图像生成一致性创新高!AI视频生成新机遇?

BBuf

在本研究中,作者指出了对图像生成扩散模型的可重复性或一致性进行定量评分的重要性。本文提出了一种基于成对平均CLIP(对比语言-图像预训练)分数的语义一致性评分方...

2300

IEEE Transactions on Multimedia | 实时自由视角视频生成系统

用户1324186

上海交通大学 · 研究员 (已认证)

随着5G网络和边缘计算技术的普及,实时自由视角视频合成方法在自由视角视频直播、3D电视、快速自由视角视频渲染以及许多其他场景中的应用越来越广泛。一般来说,实时自...

1500

ICCV 2023 | Imitator:个性化语音驱动的 3D 人脸动画

用户1324186

上海交通大学 · 研究员 (已认证)

图 1:Imitator 是一种用于个性化语音驱动 3D 人脸动画的新方法。给定音频序列和个性化风格嵌入作为输入,我们生成特定人物的运动序列,并为双唇辅音('m...

3300

RTC @scale 2024 | 如何提升国际通话质量

用户1324186

上海交通大学 · 研究员 (已认证)

通话中继器位于中间,充当通话参与者之间的代理。在一对一的音频通话中,每个参与者发送一个流并接收一个流;而在视频通话中,由于音频和视频被编码为不同的流,相同的参与...

2100

Power BI 矩阵多指标总分解决方案

wujunmin

如果在矩阵中展示一个指标,比如下方的日周业绩,默认的显示效果没有什么值得诟病的地方。

1500

dotnet tool:你可能未曾意识到它的强大

DevOps持续交付

在.NET的世界里,dotnet 命令是一个极其强大的工具,它不仅仅用于构建、运行和发布应用程序,还提供了广泛的内置功能,帮助开发者高效地完成各种任务。然而,你...

1300

达芬奇调色:调色工具基本介绍,PR 和达芬奇交互,场景剪切 Demo

山河已无恙

达芬奇调色工具是一款专业的视频调色软件,广泛应用于电影、电视和广告等影视制作领域。它提供了丰富的调色功能和工具,可以对图像进行精确的色彩校正和后期处理。

3100

Html&Css 基础总结(基础好了才是最能打的)一

胖虎哥

作者在求学期间自学了前端界面相关的,算是有一些基础, 但是在工作中前端知识一直没有用武之地,导致前端的知识七零八落的不成体系,所以痛腚思痛,这篇专栏主要是回顾学...

1900

又进化了!全志T113智能家居86盒圆屏版(圆屏加一体化驱动板+CNC外壳+炫酷LVGL UI)

阿志小管家

移植了之前做的一些个性主题时钟,比如随机星座时钟等,比较二次元,结合全志硬解视频功能,支持mp4视频播放作为动态背景 有兴趣的可以看我相关的视频展示。效果见文首...

4010

Android 14新特性,选择性照片和视频访问授权

用户1158055

如图所示,当用户选择了部分照片和视频访问权限时,我们可以在界面的顶部给用户一个提示,告知下方显示的照片和视频只是用户选择授权的一部分,点击Manage按钮可以跳...

3310

OpenAI 未至,Open-Sora 再度升级!支持生成 16 秒 720p 视频

HelloGitHub

作者团队表示,基于 Transformer 的特性,可以轻松扩展 DiT 架构以支持图像到图像以及视频到视频的任务。他们提出了一种掩码策略来支持图像和视频的条件...

4410
领券