方案特性

引擎整合

基于腾讯各实验室在音视频编解码、深度学习以及编辑处理等多年技术积累,整合各大实验室的最新研究成果应用到视频处理场景中,为用户提供一站式视频 AI 理解和识别服务。

海量标签

百万人脸数据库、海量视频标签,涵盖人物、风景、食物、建筑、动植物、场景等9大类,包含日常生活的各个信息维度,满足视频内容全方位标签化。

简单易用

对外提供公有私有一体化、直播点播统一化的标准 REST API 接口,可与点播服务、COS 存储、第三方存储系统快速打通,便捷接入,自主调度切换。

视频质检

支持检测直播、点播视频中的画面帧以及声音质量,涵盖花屏、黑边、马赛克、噪声等全方位13项检测类型,并提供主播视频整体质量检测评分辅助推荐更精准。

解决方案架构

广电私有化解决方案

方案介绍

为广电客户提供专属私有化服务,将智眸视频分析能力部署在本地服务器,提供智能审核、智能识别、智能编辑等全套 AI 能力,并支撑新闻网、制作网、媒资系统等业务系统的运作。

使用流程

官网申请接入,审核通过后将为您提供专属服务。

方案优势

  • 安全稳定:客户数据运算存储于本地,保障客户资源的版权,提升业务的稳定性。
  • 节省成本:客户在内网传输资源,节省了云端传输的成本。
  • 快速部署:腾讯云拥有丰富的私有化部署经验,实现与业务系统的高效对接。

广电私有化解决方案

方案介绍

为广电客户提供专属私有化服务,将智眸视频分析能力部署在本地服务器,提供智能审核、智能识别、智能编辑等全套 AI 能力,并支撑新闻网、制作网、媒资系统等业务系统的运作。

使用流程

官网申请接入,审核通过后将为您提供专属服务。

方案优势

  • 安全稳定:客户数据运算存储于本地,保障客户资源的版权,提升业务的稳定性。
  • 节省成本:客户在内网传输资源,节省了云端传输的成本。
  • 快速部署:腾讯云拥有丰富的私有化部署经验,实现与业务系统的高效对接。

教育解决方案

方案介绍

在线教育客户通过直播或点播接入智眸视频分析服务,为客户提供视频审核、内容识别、知识拆条等能力,并将处理后的视频分发到客户平台或腾讯云平台。

使用流程

官网申请接入,审核通过后通过控制台或 API 调用服务。

方案优势

  • 提升学习效率:基于万亿级图谱对知识进行关联,构建知识网络,提升学习效率。
  • 高效内容定位:通过对视频内容的深度理解,快速定位相关视频内容。
  • 资源保护:为版权内容提供数字水印,保护独有资源的版权。

在线视频解决方案

功能介绍

用户上传音视频文件,智眸视频分析对音视频文件进行智能审核,解析文件中的物体、场景等元素,并提供精彩集锦、片头片尾等高效编辑能力,最终通过CDN分发到客户平台。

使用流程

官网申请接入,审核通过后通过控制台或API调用服务。

方案优势

  • 高可用媒资:对视频内容深度理解,提供标签、人物、语音、场景、物体等多种元素检索,提高媒资可用性。
  • 快速编辑:提供精彩集锦、片头片尾等智能编辑能力,提升视频生产效率。
  • 节省成本:智能审核代替人工审核,提升审核准确率的同时降低审核成本。

直播解决方案

功能介绍

直播用户通过推流接入智眸视频分析服务,对直播流实时审核,识别直播流中的人脸、语音等元素,并为直播流生成精彩集锦、封面等,最终通过 CDN 将直播流分发给观众。

使用流程

官网申请接入,审核通过后通过控制台或 API 调用服务。

方案优势

  • 高效识别:实时识别视频流中的多种元素,提供高效精准的内容识别服务。
  • 极速推荐:为直播内容高效生成特色标签与封面,提升推荐效率。
  • 节省成本:智能审核代替人工审核,提升审核准确率的同时降低审核成本。

视频智能原子产品功能

人脸识别

快速识别视频中的人脸信息并支持定位出人物所在的视频帧画面,以及人脸所在区域。

特色功能

  • 支持客户自定义人脸库。
  • 存档媒资发起识别后,支持存储视频内人脸向量数据,方便下次快速定位人物所在画面,进行二次编辑。

人脸识别

快速识别视频中的人脸信息并支持定位出人物所在的视频帧画面,以及人脸所在区域。

特色功能

  • 支持客户自定义人脸库。
  • 存档媒资发起识别后,支持存储视频内人脸向量数据,方便下次快速定位人物所在画面,进行二次编辑。

语音识别

快速识别视频中的声音并转化成文字(普通话、英文等),并且支持客户自定义关键词且定位出关键词所在视频的时间点,支持实时流语音识别分析。

特色功能

  • 海量数据积累

立足于腾讯庞大的社交数据平台,积累了数十万小时的语音标注数据,拥有丰富多样的语料库,为高识别率奠定数据基础。

  • 算法业界领先

基于多种序列神经网络结构(LSTM、Attention Model、DeepCNN),采用 Multitask 训练方法,结合T/S方式,在通用以及垂直领域有业内领先的识别精度。

  • 支持语种丰富

现阶段已经支持中文普通话、英语、粤语和韩语语音识别,后续将陆续开放其他语种或方言的识别能力。

  • 噪声环境识别佳

语音识别模型鲁棒性佳,识别精度高,抗噪声的干扰能力强,能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理。

  • 海量内外部业务验证

经过微信、腾讯视频、王者荣耀等内部业务充分验证,也在大量互联网、金融、教育等领域的外部客户业务场景成功落地,日服务亿级用户,性能稳定。

文字识别

快速识别视频中出现的文字信息(简体、繁体、英文等),可用于视频内的自定义关键词的提取,也支持竖版文字的识别。支持客户自定义关键词且定位出关键词所在视频的时间点。

特色功能

  • 支持多场景、任意版面下整图文字的识别

支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。

  • 支持如下丰富的应用场景

印刷文档识别、网络图片识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、头像文字识别等。

  • 支持手写体识别

支持多场景、任意版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。

帧标签识别

支持自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置。帧标签涵盖人物、风景、人造物、建筑、动植物、食物等 9 个大类,包含日常生活的各个信息维度。

特色功能

  • 识别间隔可选

默认1秒识别一帧视频画面,公有云接口最小可设置 500毫秒识别一帧,私有化接口支持自定义。

  • 可辅助媒资管理或二次编辑

识别完的视频标签入库后,可支持快速检索和定位到视频帧画面内容,方便进行二次的剪辑工作。

视频标签识别

智能识别出最符合视频内容的置信度排名前五项标签摘要用于视频推荐、检索等场景,客户可在 API 接口中自行设置返回的标签个数(最多支持10个)。

特色功能

  • 支持定制

可支持根据客户业务场景需求定制标签体系。

  • 获取视频标签后,可对接平台推荐机制,让推荐效果更佳

微信看一看产品,使用视频标签后,为推荐机制赋能,实现平台推荐效率的全面提升,极大节省了人工运营成本。

智能拆条

视频内容多维度结构化分析,结合视频场景、语音及文字信息,对视频智能拆条。支持新闻、广告等。

产品特色

  • 辅助新闻媒资快速入库

完整的新闻节目包含多段新闻片段,可使用智能拆条智能化将整段的新闻拆散成多个新闻片段,方便入库和再利用

  • 支持定制

可根据客户业务场景进行拆条定制。

智能集锦

基于视频时域、空域特征匹配、场景识别、目标检测等技术自动生成视频精彩片段,支持足球、蓝球、绝地求生、王者荣耀等多种视频场景。

产品特色

  • 海量数据积累

依托腾讯游戏丰富的视频训练样本和多媒体实验室与鹏城实验室联合开发的赛事集锦模型,实现高效的游戏和体育智能集锦生产。 

  • 支持定制

可支持根据客户业务场景定制智能集锦。

智能封面

结合视频画面纹理、场景识别、目标检测等特征信息自动生成视频封面,支持静态和动态封面输出,提升视频封面体验和点击转化率。

产品特色

  • 快速生成 GIF 动图视频封面

辅助短视频平台快速生成 GIF 视频动图封面,提升客户点击率,带来更好的口碑。

  • 极大节省人工成本

帮助海量短视频自动产生符合美学的封面图,可极大节省编辑的运营成本。

片头片尾识别

片头片尾 根据视频画面特征、文字、语音等信息自动识别定位电影电视剧片头片尾时间点。

产品特色

  • 广告插入更便捷

自动识别片头片尾后,可快速定位广告插入的时间点,辅助平台提升营销运营效率。

数字水印

将水印图以不可见的形式编码到视频流中,同时不影响视频质量。在视频被盗取后,可对疑似被盗取的资源进行盲水印提取,验证视频归属。

产品特色

  • 具备极强的抗性

对视频再次剪裁、拼接后,数字水印仍然有良好的可抗性。

  • 可支持提取工具检测

提供检测数据水印的软件工具,可便于平台检测数据水印的效果。

应用场景

广电新媒体场景

场景描述

针对广电场景,在媒资生产、媒资归档以及人工审核环节提供准确高效的视频智能服务,支持私有化部署与公有云两种交付形式。

  • 智能识别

可高效生成视频素材的多维度标签(人脸、语音、文字、帧标签、目标检测等),是影像资料馆等媒资素材再利用的最佳服务工具,能让编辑等相关人员快速定位和检索所需视频素材。

  • 智能审核

可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

  • 智能编辑

提供快编解决方案,并结合视频智能,快速生成新闻拆条、游戏及体育赛事等集锦。

广电新媒体场景

场景描述

针对广电场景,在媒资生产、媒资归档以及人工审核环节提供准确高效的视频智能服务,支持私有化部署与公有云两种交付形式。

  • 智能识别

可高效生成视频素材的多维度标签(人脸、语音、文字、帧标签、目标检测等),是影像资料馆等媒资素材再利用的最佳服务工具,能让编辑等相关人员快速定位和检索所需视频素材。

  • 智能审核

可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

  • 智能编辑

提供快编解决方案,并结合视频智能,快速生成新闻拆条、游戏及体育赛事等集锦。

教育场景

场景描述

针对教育视频中的知识点,利用知识图谱进行内容关联,建立结构化知识模型,对知识点进行拆条,并提供版权保护方案,有效保护视频的安全性。

  • 内容关联

通过知识图谱对视频内容与知识点进行关联,构建知识关联网络,提升学习效率。

  • 知识拆条

通过模型训练,对教学内容中的知识点进行智能拆条,形成单一的知识点讲解视频。

  • 版权保护

智能添加隐形水印,防止内部资源被盗用。

在线视频场景

场景描述

解析在线视频中的人脸、语音、标签等信息,智能生成视频的精彩集锦、片头片尾、封面等,提升视频编辑效率,优化资源库可用性。

  • 智能检索

通过对视频内容的深度理解,为视频进行深层次的内容编目,提升媒资系统的检索可用性。

  • 片头片尾

通过海量视频训练,智能识别视频的片头片尾,减少生产工作量。

  • 智能审核

可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

直播场景

场景描述

通过对直播内容的多维度识别,快速输出场景等标签辅助推荐,并支持大客户的标签定制训练服务。

  • 主播行为识别

通过对主播跳舞/歌唱等行为识别,快速输出标签帮助平台推荐算法提升推荐效率。

  • 智能审核

可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

咨询行业专业顾问

关于使用场景和技术架构的更多咨询, 请联系我们的销售和技术支持团队。