传统转码依赖固定的规则引擎,无法感知现实业务的复杂场景。WAND-Codec+ 引入 VLM 大模型驱动底层编码决策,让大模型真正“看懂”每一帧画面的语义内容,并在编码内核引入去噪、修复的 AI 预处理能力,结合语义进行修复、码率分配和视频压缩。除此之外, WAND-Codec+ 还针对 AV1、H.266 等复杂编码引入 AI 划分决策加速,大幅提升编码速度。WAND-Codec+ 相对开源编码器可节省 50%+ 的码率,提升处理速度 2 倍+,覆盖 10+ 种主流协议,头部平台的接入率达 90%。
传统增强方案基于 CNN 网络,只能做有限的锐化和降噪,细节生成能力弱,处理复杂场景容易出现伪影。WAND-Enhance+ 用 DiT(Diffusion Transformer)架构做画质重建,利用全局上下文建模能力,生成更真实自然的纹理细节,画面清晰度和通透感实现跨代提升。同时,WAND-Enhance+引入了 MoE 架构,针对不同的场景进行优化,并针对电商、游戏、秀场、AI 短剧等业务进行深入 Co-Design 优化基模能力。能力覆盖 4K 超分、智能插帧(最高 120 FPS)、去压缩伪影、SDR2HDR、人脸增强等,为业务带来显著 QoE 提升收益。
传统擦除方案基于图像修复(inpaint)算法,本质是用周围像素做插值填充,处理后画面模糊、边缘不自然,视频场景下还会逐帧闪烁。WAND-EraseVibe+ 采用"编码器-Transformer-解码器"的端到端架构,先将画面压缩到隐空间提取深层语义特征,Transformer 在特征层精准剥离字幕/水印信号并推断被遮挡区域的内容分布,再由解码器重建回像素空间。配合大规模构建的“原画-字幕”成对数据训练,实现零伪影的高保真画面还原,帧间高度一致、连续播放无闪烁。支持多目标同时擦除,日处理量超 10 万分钟,头部短剧客户 80% 以上在用。
通用生成模型追求创意多样性,但在电商、短漫剧等实际业务工作流中结果不可控、可用率低。WAND-Create 针对每个场景做专项训练,把品类适配、角色一致性、画风连贯等业务关键能力内化到模型里,做到成功率高、风格可控、端到端直接出结果。模型能力涵盖图片生成(换装、商品套图、抠图等)和视频生成(视频复刻、文生漫剧、AI 转绘等)两大方向。


三层联动,构成行业覆盖最全、链路最完整的一站式媒体 AI 能力平台。

AI 横转竖 — 不是简单的画面裁切,而是 WAND 多模型协同完成的智能适配。WAND-Sense 识别画面中的感兴趣区域(ROI),智能追踪球、球员等运动主体,确保裁切始终跟随关键内容;同时检测比分牌、信息牌等固定元素,再由 WAND-EraseVibe+ 将其从原画面无痕提取,重新放置到竖屏画面的合适位置,避免关键信息丢失。支持批量将横屏视频资源转换为适合移动端播放的竖屏短视频。

方案价值: 六大模型各司其职,一场比赛进来,AI 辅助完成从理解到生产到分发的全流程。头部体育平台已规模化使用。
