前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI怎么牛,到底是怎么用在视频中的?

AI怎么牛,到底是怎么用在视频中的?

原创
作者头像
Mr.Rough
发布2020-09-23 19:50:34
1.1K0
发布2020-09-23 19:50:34
举报
文章被收录于专栏:Rough专区

AI、ML和DL的区别

最近几年人工智能这个词很火,在百度的搜索词条上居高不下,电影中的那些硬核高科技也逐渐出现在我们身边。但是什么是人工智能呢?

要搞清楚这个问题,就得先理解人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)这三个词。

人工智能

人工智能这个词早在1956就被人提出,旨在用当时的计算机来构建复杂的,并且拥有人类智慧特征的机器。之后的几十年,对待人工智能分为两种态度,一是认为这是人类文明发展的未来,另一派认为这是技术疯子的狂想。

直到2012年,随着数据量的剧增,机器学习和深度学习的出现,人工智能出现了前所未有的发展,研究的领域也不断的扩大,包括但不限于:机器学习、推荐系统、模糊逻辑、进化计算等。

人工智能按照能力可以分为弱人工智能和强人工智能,弱人工智能是让机器具备观察和感知能力,可以做到一定程度的理解和推理,例如人脸识别、车辆识别;强人工智能是让机器能够获取自适应能力,能自动处理一起没偶遇遇到过的问题,就像电影中描绘的人工智能。

要在人工智能方向有突破,就得依赖机器学习。

机器学习

机器学习是人工智能的一个分支,它的主要目的是“训练机器”,按照指定的步骤向系统输入大量数据信息,这些能够被系统算法不断学习,并不断积累经验实有效的决策和预测。

下图便是决策树算法的一个简单示例,判断一个瓜的好与坏,决定在该父节点中要以哪个维度向下生成子树。

决策树
决策树

在我们生活周边游很多机器学习算法的应用,除了上面提及的人脸识别,还有指纹识别,监控物体检测等,这些应用都非常成熟,但是要有更深的应用,就得用到深度学习。

深度学习

机器学习在于解决实际的问题,而不会有进一步的想法。深度学习旨在模仿人类决策的神经网络,用来解决需要思考的问题。

也正是因为这些研究,诞生了深度神经网络,并在语音识别和图像处理领域有重大的突破。与神经网络不同的是,可以将原始信号直接输入深度神经网络,而不需要创建任何域特定的输入功能。通过多层神经元,深度神经网络可以“自动”通过每一层产生适当的特征,最后提供一个非常好的预测。

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术,可以用一张图来展示他们的关系

三者之间的关系
三者之间的关系

AI在视频中的应用

视频指纹

视频指纹的特征跟人的DNA特征很像,通过AI处理对视频中的每一帧做视觉特征提取、编码、压缩,是根据视频内容生成一串可唯一标识当前视频的指纹字符,可用于视频相似查重、视频版权、广告识别等多种场景。

视频指纹处理流程
视频指纹处理流程

自编码器

通过自编码器来压缩和降噪,来提取图片的稳定特征。

自编码器
自编码器

图片的表征向量计算

计算的流程如下:

(1)训练自编码器后,舍弃解码器;

(2)用编码器对原始图和失真图进行计算,生成新的自编码器的输入和输出;

(3)反复(1)和(2)操作后,将编码器叠加在一起作为图片的特征提取。

图片表征向量计算
图片表征向量计算

关联各帧的表征向量

视频推荐

前一阵子,抖音的日活用户已经突破6亿,数据非常可观,这在个优秀的数据之后,视频推出了很大的力。抖音需要根据不同的用户兴趣推荐不同的短视频,才能吸引大家不断的观看,倘若给一个喜欢美女的用户不断推荐糙汉子,那这个用户很快就失去兴趣。

在推荐系统中,还是拿抖音来举例,其面对海量视频和用户,数据量非常大,一方面,视频和用户更新的速度也非常快,每时每刻都会有新的视频产生,不仅有热点问题,还得平衡新视频和库存视频的观看量;另一方面,用户的喜好也可能会转变,今天喜欢做饭,名他可能喜欢摄影,需要实时追踪用户的兴趣。

Youtube推荐模型
Youtube推荐模型

拿Youtube的推荐模型来做个简单分析,它可以分成两部分:

(1)生成候选项模型,从百万数量级的视频中进行初筛,选出用户可能感兴趣的百数量级的视频。

(2)精排操作,从百数量级的视频中选出用户最可能观看的几十数量级的视频,并且进行排序。

生成候选项模型
生成候选项模型
精排模型
精排模型

总结

本文主要简单介绍人工智能的基础知识和视频网站的视频推荐系统,这点篇幅是没法讲清人工智能,真正要深入研究这块,还得需要积累大量的数学和算法知识

参考资料:

《Deep Neural Networks for YouTubeRecommendations》

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • AI、ML和DL的区别
    • 人工智能
      • 机器学习
        • 深度学习
        • AI在视频中的应用
          • 视频指纹
            • 自编码器
            • 图片的表征向量计算
            • 关联各帧的表征向量
          • 视频推荐
            • 总结
            相关产品与服务
            实时音视频
            实时音视频(Tencent RTC)基于腾讯21年来在网络与音视频技术上的深度积累,以多人音视频通话和低延时互动直播两大场景化方案,通过腾讯云服务向开发者开放,致力于帮助开发者快速搭建低成本、低延时、高品质的音视频互动解决方案。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档