业界 | 提升用户幸福感:快手在AI技术上的探索与应用

作者:李泽南

在中国短视频 APP 领域,「快手」从渗透率、用户数量上都名列第一,其日活跃用户已超 1 亿。在快速发展的背后,快手应用了很多人工智能技术。

5 月 21 日,中国图灵大会(ACM TURC 2018)在上海举行。快手创始人兼 CEO 宿华和快手 AI 技术副总裁郑文出席了大会,并在会上向人们分享了快手在 AI 方面的探索以及应用。

最热门的短视频社交平台

快手成立于 2011 年,自 2013 年转型为短视频社交应用以来,已成为了国内最热门的短视频社交平台。在快手上,用户可以用短视频和照片记录自己的生活片段,也可以通过直播与他人进行交流互动。据快手 AI 技术副总裁郑文介绍,目前用户在快手上累计发布短视频的数量已超 50 亿条,而这些视频每天被播放 150 亿次,用户日均使用时长超过 60 分钟。

「我一直在思考 AI 应该用来解决什么样的问题,」快手 CEO 宿华说道。「这不是数学层面上的问题,而是能为社会、人类解决的问题。在这些年实践的领域中,我明白了技术最终都应该用于提升人类的幸福感。」

今天,快手已成长为拥有 1 亿日活跃用户的庞大网络社区。在这里,每天都会新增 1000-2000 万条视频。每个用户打开快手,都可以看到有关任何一个地方的内容,涵盖生活的方方面面。面对总量达 50 亿条的视频内容,这家公司还希望能够照顾到所有用户,为每个人都带来关注。

这意味着必须对所有视频进行准确的内容标注,而人工智能是唯一的技术手段。

快手背后的 AI 技术

据宿华介绍,快手目前的人工智能技术主要应用在四个方面:视频生产、视频理解、用户理解、视频分发。

今年 4 月,快手上线了「快手时光机」功能,它能够在手机屏幕中快速模拟人从年轻到老去的面部变化过程。5 月,快手推出了「AR 换脸」的玩法。很早之前,快手还推出了基于人体姿态检测技术的游戏,这一切的背后是基于快手自行研发的 YCNN 深度学习推理引擎。快手称,该系统的核心优势在于其可以适配于各类高端和低端硬件,可以方便地跨平台部署。为了在移动端部署神经网络,快手的开发者对模型结构进行了优化,并大幅提高了运行效率。

快手的 YCNN 深度学习推理引擎是其 AI 技术实现的基础

为了实现更多视频玩法,快手探索了姿态识别、人脸关键点检索、视觉惯性和手势识别等方向,并最终将其依次实现。「快手会通过深度学习算法来检测用户拍摄的场景类别,并据此选择最适合的滤镜效果以提升视频的质量。」郑文表示。

「这其中还有和语音有关的理解,」宿华介绍道。「我们经常会发现视频中的很多信息是包含在音频里面的,特别是传递情绪。人类的很多情绪是在声音里面,再转化为语速、语调起伏。」

据介绍,快手目前视频最高的并发量约为 20 万。这意味着存在几十万并发、实时的语音识别需求。快手正在使用自研的机器学习平台处理这类业务。

训练高准确率的机器学习模型需要大量已标注数据,这对于快手而言并不困难,在它的社交网络中,每天都有上亿人次的人工标注行为发生。每个用户的点击、点赞、关注和转发行为,每一条视频的播放时长,用户之间的相互关系,都可以作为可用数据。但如何把这些行为数据和平台中的内容结合,进行连续、深度的分析,则是一个复杂的课题。

在获取大量数据的同时,快手需要理解用户,帮助观看者找到他最喜欢的内容,这就需要推荐系统能够理解每个人的偏好,甚至找到潜在的喜好,这样才能不断拓展推荐的范围。

快手使用了协同过滤模型等算法帮助人们找到自己的新兴趣。每个人都有不同的喜好,但也有相同的兴趣点,机器学习算法可以帮你找到类似的人,推荐他人喜好中和你不一样的东西——你很有可能也会喜欢这些新内容。

通过不断地数据挖掘,快手实现了高效的内容分发系统。

在视频分发上,快手希望能够在推荐热点内容的同时照顾到以往难以「火」起来的长尾内容。在发展早期,快手应用了逻辑回归等机器学习方法。而最近,基于深度学习方法的分发系统已经可以做到实时响应用户的行为,并更新视频推荐了。

未来展望

作为风头正劲的科技公司,快手正在努力加大对于人工智能等技术的研发投入,以不断提高用户体验。今年 4 月,这家公司与清华大学合作成立了未来媒体数据联合研究院,其中包括 AI 技术相关的诸多课题。

视频是一种多模态信息,人们一直希望在视觉、音频和自然语言中获取观点和不变性表示。具有提取不变性表示的识别能力可以让机器从大量数据中学习特征,从而获得接近人类的识别效果。在快手看来,机器学习最终或许可以像人一样能够理解视频中人物的感情。

「也许有一天,我们的人工智能系统能够像人一样理解生活中的视频片段,」宿华表示。「机器将能够更好的理解人类的情绪、情感,甚至灵感。我很期待那一天的到来。」

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-05-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奇点大数据

大数据变现十日谈之十:示例与计算

在前几天我们的大数据变现讨论中有一个问题我们没说完,就是关于“使用价值”的问题。我认为这应该是一个数据中蕴含信息所发挥价值的度量问题。 在平时我们的生产生活中,...

2866
来自专栏UAI人工智能

【再谈AI教育】吴恩达老师的 deep learning 课程是你所需要的吗?

1455
来自专栏量子位

调参的手艺也该失传了:看各路AI专家怎样教AI设计AI

来源 | MIT科技评论 编译 | 量子位 李林 随着人工智能领域的进步,有些人开始担心机器会从人类手中抢走卡车司机等类型的工作。现在,顶尖的科研人员发现,他...

2016
来自专栏人工智能快报

机器学习可帮助预测气候

据《科学美国人》报道,机器学习能帮助分析数据,提高气候预测水平。随着地球观测卫星更多、气候模型变得更强大,全球变暖问题的研究人员正面对着浩瀚的数据。如今,一些研...

2996
来自专栏挖掘大数据

5个典型实例启发:什么是数据可视化

大数据时代,数据是非常重要的,怎样把它的重要之处展示出来成为我们需要掌握的既能,这也就是本文要讲的重点——数据可视化。

18510
来自专栏AI科技大本营的专栏

想去Google Brain实习吗?如何申请?Jeff Dean等牛人很认真地回答了这些问题

编译 | AI科技大本营(rgznai100) 参与 | 鸽子、Shawn 导语:昨晚谷歌大脑(Google Brain)在Reddit上举办了一年一度的在线...

2955
来自专栏企鹅号快讯

现在,AI 已经能预测病人什么时候死亡了,准确率达 90%

关键时刻,第一时间送达! ? 据国外媒体 Eurasia Review 报道,来自斯坦福大学的研究人员已经开发出了一种使用人工智能来预测病人何时死亡的系统,其准...

1779
来自专栏新智元

谷歌大脑背后的大脑Jeff Dean:最快15年实现通用人工智能

【新智元导读】《福布斯》网站今日刊文,专访“谷歌大脑背后的大脑”Jeff Dean。Dean回顾了他自1999年加入至今在公司的不同角色,重点介绍了谷歌大脑的项...

3626
来自专栏大数据文摘

深度学习,未来机器人的进化途径

1515
来自专栏专知

赶超摩尔定律,NIPS2018提交论文达到8000篇!AI论文价值何在?

5035

扫码关注云+社区