腾讯智眸·采编识审

多维AI技术对音视频智能分析,为您提供全面的音视频内容结构化,音画字多维审核高性能的音视频处理框架,让“采、编、存、发”内容生产流程更简单。

 
  • 引擎整合

    基于腾讯各实验室在音视频编解码、深度学习以及编辑处理等多年技术积累,整合各大实验室的最新研究成果应用到视频处理场景中,为用户提供一站式视频 AI 理解和识别服务。

  • 海量标签

    百万人脸数据库、海量视频标签,涵盖人物、风景、食物、建筑、动植物、场景等9大类,包含日常生活的各个信息维度,满足视频内容全方位标签化。

  • 简单易用

    对外提供公有私有一体化、直播点播统一化的标准 REST API 接口,可与点播服务、COS 存储、第三方存储系统快速打通,便捷接入,自主调度切换。

  • 视频质检

    支持检测直播、点播视频中的画面帧以及声音质量,涵盖花屏、黑边、马赛克、噪声等全方位13项检测类型,并提供主播视频整体质量检测评分辅助推荐更精准。

 

解决方案架构

广电私有化解决方案

方案介绍

为广电客户提供专属私有化服务,将智眸视频分析能力部署在本地服务器,提供智能审核、智能识别、智能编辑等全套AI能力,并支撑新闻网、制作网、媒资系统等业务系统的运作。

使用流程

官网申请接入,审核通过后将为您提供专属服务。

方案优势

  • 安全稳定:客户数据运算存储于本地,保障客户资源的版权,提升业务的稳定性。
  • 节省成本:客户在内网传输资源,节省了云端传输的成本。
  • 快速部署:腾讯云拥有丰富的私有化部署经验,实现与业务系统的高效对接。
教育解决方案

方案介绍

在线教育客户通过直播或点播接入智眸视频分析服务,为客户提供视频审核、内容识别、知识拆条等能力,并将处理后的视频分发到客户平台或腾讯云平台。

使用流程

官网申请接入,审核通过后通过控制台或API调用服务。

方案优势

  • 提升学习效率:基于万亿级图谱对知识进行关联,构建知识网络,提升学习效率。
  • 高效内容定位:通过对视频内容的深度理解,快速定位相关视频内容。
  • 资源保护:为版权内容提供数字水印,保护独有资源的版权。
在线视频解决方案

功能介绍

用户上传音视频文件,智眸视频分析对音视频文件进行智能审核,解析文件中的物体、场景等元素,并提供精彩集锦、片头片尾等高效编辑能力,最终通过CDN分发到客户平台。

使用流程

官网申请接入,审核通过后通过控制台或API调用服务。

方案优势

  • 高可用媒资:对视频内容深度理解,提供标签、人物、语音、场景、物体等多种元素检索,提高媒资可用性。
  • 快速编辑:提供精彩集锦、片头片尾等智能编辑能力,提升视频生产效率。
  • 节省成本:智能审核代替人工审核,提升审核准确率的同时降低审核成本。
直播解决方案

功能介绍

直播用户通过推流接入智眸视频分析服务,对直播流实时审核,识别直播流中的人脸、语音等元素,并为直播流生成精彩集锦、封面等,最终通过CDN将直播流分发给观众。

使用流程

官网申请接入,审核通过后通过控制台或API调用服务。

方案优势

  • 高效识别:实时识别视频流中的多种元素,提供高效精准的内容识别服务。
  • 极速推荐:为直播内容高效生成特色标签与封面,提升推荐效率。
  • 节省成本:智能审核代替人工审核,提升审核准确率的同时降低审核成本。
 

视频智能原子产品功能

人脸识别
人脸识别
快速识别视频中的人脸信息并快速定位出视频中的人物所在帧画面,以及人脸所在区域。客户可自定义人物库或配置选择视频 AI 公共人物库进行人脸识别。
人脸识别
语音识别
语音识别
快速识别视频中的声音并转化成文字(普通话、英文、粤语等),并且支持客户自定义关键词且定位出关键词所在视频的时间点,支持实时流语音识别分析。
语音识别
文字识别
文字识别
快速识别视频中出现的文字信息(简体、繁体、英文等),可用于视频内的自定义关键词的提取,也支持竖版文字的识别。支持客户自定义关键词且定位出关键词所在视频的时间点。
文字识别
帧标签识别
帧标签识别
支持自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置。帧标签涵盖人物、风景、人造物、建筑、动植物、食物等 9 个大类,包含日常生活的各个信息维度。
帧标签识别
物体识别(目标检测)
物体识别(目标检测)
支持常见目标物体检测(logo、目标物体、二维码等),可定位检测目标所在视频画面中的位置及时间点,支持目标物体1000+。
物体识别(目标检测)
视频标签识别
视频标签识别
智能识别出最符合视频内容的置信度排名前五项标签摘要用于视频推荐、检索等场景,客户可在API接口中自行设置返回的标签个数(最多支持10个)。
视频标签识别
分类识别
分类识别
全方位、多维度理解分析视频内容,智能视频分类。目前支持美食、旅游、军事、动漫、音乐等19大类。
分类识别
智能拆条
智能拆条
视频内容多维度结构化分析,结合视频场景、语音及文字信息,对视频智能拆条。支持新闻、广告、人物拆条等。
智能拆条
智能集锦
智能集锦
基于视频时域、空域特征匹配、场景识别、目标检测等技术自动生成视频精彩片段,支持足球、蓝球、绝地求生、王者荣耀等视频场景。
智能集锦
智能封面
智能封面
结合视频画面纹理、场景识别、目标检测等特征信息自动生成视频封面,支持静态和动态封面输出,提升视频封面体验和点击转化率。
智能封面
片头片尾识别
片头片尾识别
根据视频画面特征、文字、语音等信息自动识别定位电影电视剧片头片尾时间点。
片头片尾识别
数字水印
数字水印
将水印图以不可见的形式编码到视频流中,不影响视频质量。在视频被盗取后,可对疑似被盗取的资源进行盲水印提取,验证视频归属。
数字水印
智能审核
智能审核
准确、高效的黄暴政、音画字多维度识别,为您大幅降低人工审核的风险和成本。
智能审核
 

应用场景

广电新媒体场景

场景描述

针对广电场景,在媒资生产、媒资归档以及人工审核环节提供准确高效的视频智能服务,支持私有化部署与公有云两种交付形式。

1)智能识别:可高效生成视频素材的多维度标签(人脸、语音、文字、帧标签、目标检测等),是影像资料馆等媒资素材再利用的最佳服务工具,能让编辑等相关人员快速定位和检索所需视频素材;

2)智能审核:可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

3)智能编辑:提供快编解决方案,并结合视频智能,快速生成新闻拆条、游戏及体育赛事等集锦。

教育场景

场景描述

针对教育视频中的知识点,利用知识图谱进行内容关联,建立结构化知识模型,对知识点进行拆条,并提供版权保护方案,有效保护视频的安全性。

1)内容关联:通过知识图谱对视频内容与知识点进行关联,构建知识关联网络,提升学习效率。

2)知识拆条:通过模型训练,对教学内容中的知识点进行智能拆条,形成单一的知识点讲解视频。

3)版权保护:智能添加隐形水印,防止内部资源被盗用。

在线视频场景

场景描述

解析在线视频中的人脸、语音、标签等信息,智能生成视频的精彩集锦、片头片尾、封面等,提升视频编辑效率,优化资源库可用性。

1)智能检索:通过对视频内容的深度理解,为视频进行深层次的内容编目,提升媒资系统的检索可用性。

2)片头片尾:通过海量视频训练,智能识别视频的片头片尾,减少生产工作量。

3)智能审核:可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

直播场景

场景描述

通过对直播内容的多维度识别,快速输出场景等标签辅助推荐,并支持大客户的标签定制训练服务。

1)主播行为识别:通过对主播跳舞/歌唱等行为识别,快速输出标签帮助平台推荐算法提升推荐效率。

2)智能审核:可对长、短视频以及直播流进行音画字的多维(黄/暴/政/违禁等)安全审核。涉政人物库与广电标准一致,并提供自定义人物库和关键词库功能,为人工审核团队提供高效的机审服务。同时支持大客户准召专项服务,支持定制大客户审核标准。

 

联系我们

关于使用场景和技术架构的更多咨询, 请联系我们的销售和技术支持团队。