荣耀V10的人工智能,原来不仅仅是人脸解锁而已

荣耀V10发布以来,人工智能也越来越火。从“会不会被抢走工作”、“会不会毁灭人类”一路讨论到“什么是机器学习”、“什么是训练模型”。有人还翻出来80年代

侯世达的一句话:

“很遗憾人们把看起来很厉害的程序当作了人工智能”。

那荣耀V10的人工智能功能,比如智慧拍照、人脸解锁、实时翻译……等等,这些到底是真的人工智能,还是“看上去很厉害的程序”呢?

先来看看这些功能都是什么:

智慧拍照:

最广为人知的当然是实时场景识别功能。可根据场景变化自动调节拍照参数,达到最优的拍摄效果,目前可以自动识别雪景、蓝天、狗、猫、美食、日出日落等13种拍摄场景。

不太广为人知其实很强大的功能还有很多:

比如AI智慧运动抓拍功能。拍照时,相机会对运动物体的状态进行大量动作场景学习,预判运动轨迹,设置更合适的拍照参数,确保能抓拍到满意的瞬间。

比如AI脑补图片细节功能。遇到不爱传原图的朋友,小图看着还好,点开大图全是马赛克。利用这个功能,点开小图也能一秒变身“原图”。

其他比如AI背景替换功能、AI自拍秒变“双胞胎”、背景虚化、分性别美化等功能不展开说了。

这些看上去“很厉害”的功能都是怎么实现的呢?普通人只知道学习了多少多少亿张图片,所以能感知到这些场景。只有专业人士才知道,想要准确的感知场景有多困难。

荣耀V10的AI拍照速度很快,但其实过程非常复杂,先识别场景、找出画面主体,再进行一些列的拍照参数设置、色彩、背景优化等。最核心的就是识别,据资料披露,荣耀采用的是 “卷积神经网络”:

有一定计算机图形学基础的同学都知道,我们可以使用特定的参数,对图像做卷积来提取图像局部特征。比如下面这幅图,通过不同的参数卷积运算,图像特征更明显。

实际应用中,往往需要多层卷积计算,才能准确识别出画面情景。

接下来,针对每一个场景,还要进行拍照参数的优化,如曝光、对比度、色彩饱和度、清晰度等等。

V10背景虚化精细、拍照主体更突出、照片色彩更好看,背后的秘密就是“卷积神经网络”这个智能AI。

人脸识别:

很多人都知道荣耀V10的人脸识别,但很少有人知道,荣耀有全球首款“散斑结构光”手机配件点云深度摄像头。

“点云深度摄像头”可以感知用户脸部的深度,对用户的脸部建模,识别精度达到亚毫米级别,从而达到高精度及安全性的人脸识别。借助结构光技术,荣耀 V10可以实现3D人脸建模和人脸识别,同时还有3D面部表情控制以及3D小物体建模。

在这些元件和技术的支持下,荣耀V10人脸解锁实用性相当不错。日常的使用过程中,解锁速度相当快。不过或许是因为安全性的考虑,人脸识别仅仅被用作解锁。但未来人脸识别的应用场景一定会越来越广泛。

实时翻译:

利用NPU处理语义内容,加速翻译实现,拍照翻译加速高达300%;它可识别翻译的语种多达50+种。而且内置语音翻译,可以与外国人实时语音交流。群组模式还能实时把多种不同语种的语言翻译为指定语言,就算多人对话,也一样能实现同步实时翻译

翻译的背后依然是有大量的数据训练,才能熟练掌握不同语言的单词语义和语法结构。

当然,我们可以希望这些功能更“智能“一些:比如摄像头不再是平面的固定的,而是可以360度旋转自动,自动选取最佳拍照角度;比如给人脸建立一个成长档案,能识别出人成长、衰老甚至整容之后的面貌;比如实时翻译,不再是平板的语音而是你的音色……让人工智能更多“自主思考”,是未来的发展方向,也是侯世达发出这句感叹的原因。

V10作为当前市场人工智能手机的典型,无论是智慧拍照还是人脸识别的其他功能,都在朝着让用户生活更加智能的方向发展,由此我们也基本上可以预测一下,以后智能手机功能成熟之后,就真的是一机在手,天下我有了。

本文由“科技充实生活账号”发布,2018年03月02日

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180302A13UUG00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券