首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >智能时代的场景革命

智能时代的场景革命

作者头像
凯哥
发布2020-01-17 16:35:40
4840
发布2020-01-17 16:35:40
举报

从华为P20的拍照功能说起

华为P20系列手机,在拍照功能里,和其他相机一样,分了很多场景,什么人像,夜景,大光圈,食品等。这样可以根据不同的场景,选择不同的技术参数,优化算法。

但是,同时在拍照的功能里,P20系列可以自动识别一些对象,并根据对象来自动选择场景。

当它检测出拍摄主体可能是人像时,会出现人像模式提示。默认会应用人像模式的算法来进行美颜。

当它检测出拍摄主体可能是一个平面印刷品的时候,会出现文档矫正提示,默认会裁剪并拉伸目标。

当它检测出拍摄主题可能是绿叶的时候,会启用绿叶模式来让色彩更鲜艳。

当然,这样的场景还有很多,相信随着智能算法的应用的深入,一个拍照可以做到千变万化,一个入口对应所有场景。

回顾手机拍照功能的历史,我们会发现这是一个从分到合的过程:

诺基亚第一个拍照手机的出现,那时候的拍照程序很简单,没有那么复杂的功能,就是一个按钮。然后随着手机摄像头技术的发展,我们可以调整拍照的形状,ISO,滤镜等,这样,在不同的光线,拍摄不同的对象,不同的环境的时候,就可以选择最好的参数,达到最好的效果。但是每次都这么手动调整参数太麻烦了,于是从手机厂商到应用厂商开始出现了针对场景的拍照程序。手机内置的拍照程序出现了夜景、人像、微距、延时等场景的选择,而更加丰富细分的拍照APP也出现了,比如以美图秀秀,美颜相机为代表的人像APP,比如以名片识别,文档扫描为核心功能的APP,比如以专门拍摄延时和风景的APP。从而满足不同用户在不同场景下的个性化需求。

但是这样带来的问题也是明显的,一个场景一个APP,一个场景一个入口,用户需要自己去判断,选择,不同的入口,最终的照片也无法统一管理。

而在人工智能技术出现的今天,在图片识别技术的应用基础上,一个拍照入口,通过识别拍摄对象的类型,后台调用不同的算法模型去进行不同的处理,减少用户的操作行为,更好地给用户以一致的体验。

当摄像头实时的发现拍摄对象是人像的时候,启动美颜算法;

当摄像头发现拍摄的对象包含大量文字的时候,启动OCR文字识别以及自动翻译的算法;

当摄像头检测到拍摄的主体在运动的时候,启动视频录制模式;

这样的摄像头就具备了一定智能的基础,避免了那种当美好的画面出现的时候,要临时的切换拍摄APP,选择不同的菜单,导致错过美好的瞬间。

这样一个典型的应用的变化的过程,管窥一斑的体现了智能时代正在带来的场景革命。

人工智能重构业务场景

互联网时代场景即价值,场景化思维是用户为中心,关注用户体验,产品设计围绕用户的方法。谁能挖掘更多的业务场景,谁就能够跟用户建立更多的连接,更好地理解用户需求和痛点,从而能够提供更加个性化,更加有竞争力的产品。

大数据和人工智能技术给业务场景的构建带来了巨大的变化,主要体现在以下几点:

场景孤岛到场景融合

用华为P20手机拍照作为例子,拍人像的功能和拍延时的功能是分开的,是需要用户自己根据经验去判断和选择的,所以一个时刻用户只能使用一种场景,并且切换到新的场景的过程是生硬的。当用户在拍照的时候就难免要在不同的应用和功能之间切换,这是不好的用户体验。

传统的业务场景之间是割裂的,是独立的,从业务流程到技术实现都是固化在应用中的,无法在场景中进行切换,而伴随着人工智能技术的深化应用,用户场景可以被自动的识别和切换,凯哥把前者叫做孤岛式场景,后者是融合式场景。

产品和服务本身能懂用户,能够根据用户的业务目标、喜好、习惯不同而自动智能的切换场景。

被动规划式场景到自我裂变式场景

原来的场景是通过访谈调研,研究分析,设计出来的,每一步都带着对于用户的假设和猜想,变成一个流程式的产品或服务。当用户越来越多,出现了超出前期设计的场景的假设条件的时候,那一部分用户的体验就会下降,也就是产品需要更新和升级的时候。

而当人工智能的技术出现,尤其是机器学习,深度学习这样的技术的应用,计算机可以在用户沉淀的数据中发现新的用户行为模式,不同于原来的模型,从而自动设计出新的场景或者服务,凯哥把它叫自我裂变式场景。

举个例子,电商企业先上线通用电商场景的服务,运营一段时间后,沉淀了大量的用户数据、行为数据、SKU数据,然后通过聚类的方法,识别出不同的用户场景和对应的用户行为习惯,然后根据对这些数据的训练,将原来通用电商的业务流程、操作模式细分为不同的场景,裂变成面向用户或者面向SKU的业务场景。而这里最重要的区别在于,这一切不是由人工去分析发生的,而是根据数据训练出模型来驱动的。

刚性固定式场景到柔性演进式场景

在传统的用户场景中,由于用户的旅程,功能,规则,都是设计好的,通过软件固化的,所以是刚性的,不能随着用户行为、画像自动发生变化。

而在智能时代,每一个行为,每一个流程,规则都是动态数据模型算法驱动的,它会根据数据的不同而个性化,是柔性演进式的场景。

在固定的标签系统中,不同的用户被打上个性化标签,然后根据标签的类型来觉定适配什么样的行为,优惠等。但是,在智能驱动的系统中, 用户的标签是动态的。是由一组组的模型去匹配的,而模型本身又是根据数据训练出来的也是动态的。比如,传统的标签系统中,有一个标签是“潜在用户”的标签,他的匹配模型是访问首页的频率和浏览商品的停留时长,只要达到一个阈值范围,那就被认为是潜在用户,这个用户就会被打上潜在用户的标签,然后系统会根据潜在用户的标签去采取对应的行动。而在智能的时代,潜在用户的标签匹配的规则是动态的,是根据后台的历史数据分析的结果产生的,是演进式的,一切都是根据数据去学习和训练的,而不是固定配置的。

从多渠道多应用到统一入口融合体验

借助移动互联网,云计算,大数据技术,传统业务从单一渠道扩展到多渠道,从线下到线上线下的融合打通,衍生出了多场景,多应用。

分久必合,在智能时代,多渠道多应用会逐渐统一到单一入口,融合体验。用户的体验极简化,而后台的计算、分析逻辑是复杂无比的。

让我们来畅想一下,智能时代的搜索引擎,一个极简的输入框或者语音输入,用户说的词语,会被识别成不同的实体,根据实体的类型搜索的结果会以不同的形式展示出来。如果你搜索的是视频的名称,那么下面出来的就是视频相关的操作;如果你搜索的是商品,那么就进入电商模式;如果你搜索的是专业词汇,搜索引擎则进入学术研究模式。这一切都会根据你的用户画像的不同而发生变化,一个入口涵盖多种场景,无缝切换。让用户的学习成本降到最低,一切都自然发生,不需要任何纠结的可能。

这就是随心所欲的智能时代的意义所在。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 凯哥讲故事系列 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档