【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘点

【新智元导读】移动AI,尤其是智能手机上的计算机视觉应用,已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。本人作者是PicsArt的联合创始人兼首席执行官。PicsArt是一家领先的社交照片编辑公司,每月有超过9000万活跃用户。

毫无疑问,人工智能和机器学习是近来最热门的话题。大数据和强有力的GPU使得人工智能为几乎所有行业提供动力。现在,AI甚至可以放在手机一类的设备上。移动AI,尤其是计算机视觉,已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。

三个计算机视觉方面的应用正在兴起:图像识别、图像优化和图像生成。

图像识别:时尚、零售、设计、医疗……各行业的有趣应用

我们可以期待更多类似于Shazam的应用程序(Shazam 是一款可以识别您周围播放的音乐和电视节目的移动应用程序)。时尚、零售和室内设计等垂直领域能从处理图像的应用程序中受益。看到吸引你的东西时,你可以拍张照片,然后这种图像识别的软件就能帮助用户在线上商店里找到相同或类似的产品。举个其他例子,如果你喜欢某人的外表,你可以给那人拍照,用软件查询在哪里能买到类似的衣服和首饰。

例如,Pinterest最近推出了其镜头工具,用户将手机摄像头对准一个物体,在Pinterest就能查到相同或类似的产品。Houzz是一家家居装饰公司,他们提供视觉匹配服务,帮助用户找到喜欢的图片中的物品。The Flow用户通过相机就能识别在亚马逊销售的产品并获得有关的信息,包括物品描述、评论、视频/音频片段。

在医疗领域,尤其是皮肤病检测,图像识别也很重要。用户可以拍摄照片,获得初步诊断。斯坦福大学的研究人员开发了可以发现皮肤癌的算法。根据结果,其诊断皮肤癌的效率与专业医生相当。该算法并未投入生产,仍有商业机会。我们也期待医疗保健app的出现,特别是x射线诊断和超声诊断,以及可以通过图片诊断糖尿病患者不能吃哪些食物。微软、谷歌、亚马逊提供的云服务消除了开发人员将计算机视觉应用生产的障碍。

我自己的公司,PicsArt,提供自动标记和搜索服务,可以分类用户提交的照片。用户每月上传超过2亿张图像到我们的服务器,我们每天收集20亿次用户活动。这使我们能够大量收集图像编辑历史,并将产品开发成具有用户体验个性化的智能编辑器。 例如,平台会向建议用户与他们曾下载过照片类似的图片,来帮助他们发现更多相关照片。

计算机视觉的一个分支是光学字符识别(OCR),可以理解图像中的文本,并将识别的词提取为机器编码的文本流。 这适用于各种领域,包括视觉信用卡扫描和银行支票存款。 ABBYY是市场上最准确的OCR引擎之一,并且具有开发更专业的文本和表单扫描器(例如,在医疗保健,银行,零售服务等)的巨大潜力。

图像识别领域还有一个重要的部分是图形分割,应用程序不仅能定位图片中的特定物体,还能识别该物体的界限。这对面孔识别、背景移除、制作贴纸都很有用。

图像美化

图像美化是另一个值得注意的领域,包括风格改变和图像美化。这方面已经有了很多出色的应用。

此外,我们还可以期待一些新产品的出现,比如美妆品牌能通过App在人脸上实现化妆效果,或者用户可以通过App看到他们接受整容手术后的效果。(FaceApp正在朝这个方向发展。)

图像生成:更多创意应用

第三个区域是图像生成,涉及使用脚本生成动画视频或草图。 这可以应用于娱乐行业,当它从静止图像(例如哈利波特动画图片)创建电影,漫画或视频或从图像切割以创建贴纸(超分辨率功能,允许用户放大小的物体,从照片中删除而不失去其质量)。

例如新智元此前介绍的AI“文森特”,能够将用户在平板上画的简笔画几乎实时地转换为古典大师风格画作。

还有Google的AutoDraw,一个自动绘图机器人,分析用户的涂鸦,并提出更多抛光的剪贴画替代它们。

AR和VR技术将探索图像生成 ,将真实对象与生成的图像混合,以产生与现实世界的另一层交互,或显示对现实世界对象的掌控,如给建筑物上标记附加信息。

苹果的ARKit

根据美国商业媒体Business Insider,今年人们会拍1.2万亿的数码照片。随着移动设备功能越来越强大,计算机视觉模型越来越小,这些丰富的产出正在给商业带来巨大变化。对新老企业来说,迅速适应变化非常重要。机会是无限的,使用移动AI没有天花板。

原文:https://www.forbes.com/sites/forbestechcouncil/2017/09/27/what-can-computer-vision-do-in-the-palm-of-your-hand/2/#1f2983a54ba5

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-10-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯大数据的专栏

大数据产品-腾讯信鸽之手游流失预测

背景 随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的收益。在游戏...

33650
来自专栏PPV课数据科学社区

以电商为例,数据分析的5个思维方法-简单粗暴

在博主雪言舟语看来,数据分析真的很重要,能从一堆看似杂乱的数据里,找到问题并解决问题。从数据上的变化,来判断甄别效果得失;简直是居家旅行,运营生意的必备良品。 ...

35680
来自专栏人工智能头条

基于腾讯信鸽平台的手游流失用户预测模型概览

253100
来自专栏量子位

如何为智能投顾打造对话系统?这有一份指南可供参考

主讲人:灵智优诺CTO 许可 屈鑫 颜萌 整理编辑 量子位 出品 | 公众号 QbitAI 作为人工智能和语言学的重要分支,自然语言处理(NLP)的相关研究一直...

38260
来自专栏人工智能快报

美情报机构拟资助研发可预测未来的智能工具

2016年7月6日,美国国防系统网发布消息称,美国情报高级研究计划局(IARPA)计划资助研发可预测未来的智能工具。 随着来自传感器及其他来源的信息的大量涌入,...

37170
来自专栏华章科技

收藏 | 来自微软大神的机器学习秘籍!

在这个人人都可能是学霸的全民学习时代,为什么人与人的差距依然很大?像优达学城这样的学习网站可以为每一个人想要学习的人带去技能和知识的补充,但要成为一个优秀的人才...

10930
来自专栏大数据挖掘DT机器学习

【解析】数据挖掘工具的评判

要做数据挖掘,当然需要工具。但若靠传统的自我编程来实现,未免有些费时费力,而且其性能也不一定比商业工具来得强和稳定。目前,世界上已经有很多商业公司和研究机构开发...

29640
来自专栏AI科技评论

盘点 | 聊天机器人的发展状况与分类

AI科技评论按:本文作者王海良,呤呤英语开发总监,北京JavaScript/Node.js开发者社区的运营者,曾就职IBM创新中心。本文为系列文章第一篇,由AI...

61580
来自专栏专知

【干货】最全知识图谱综述#2: 构建技术与典型应用

【导读】知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。我们专知的技术基石之一正是知识图谱-构建AI知识体系-...

88740
来自专栏ATYUN订阅号

LG开发基于人工智能解决VR晕动病的技术

有些人在戴上VR设备时会出现晕动病的症状,这可能会让VR变成一种糟糕的体验。VR开发人员花费了大量的时间和研究来减少这种影响,其中一种解决方案与人工智能有关。

12230

扫码关注云+社区

领取腾讯云代金券