业界 | 码隆科技最新发布ProductAI

机器如何懂时尚?这是码隆科技上一款产品希望解决的问题,那一次他们推出了StyleAI,希望用图像识别结合深度学习来破解时尚密码。

10月24日,该公司更进一步,推出ProductAI,将AI做成一项云服务,希望让没有AI技术能力的公司也能利用这一全新技术。同时还宣布获得6200万A轮融资,目前该公司员工人数还不到30人。

ProductAI:定制化AI云服务

StyleAI是一项AI的具体应用,而此次推出的ProductAI则是一款企业端产品,具体来说它是一项PaaS(Platform-as-a-Service)服务,开发者可通过调用其接口来获得人工智能服务。

ProductAI背后的两项核心技术分别是“以图搜图”和“图像识别”,它可以理解图片“表达了什么意思”,还可以对图片进行分类、处理、标注,实现更多应用。

在发布会现场,码隆的程序员演示了用5分钟时间在ProductAI平台上搭建一个定制化的以图搜图引擎。

其收费模式也和一般的云服务类似,按照API接口调用量来收费,通常在千次10元左右,取决于调用的API和使用总量。目前ProductAI的客户包括中国纺织信息中心、视觉中国、微软在线暴风影音等 。

ProductAI应用示例

人工智能并不是一项解决所有问题的技术,它更适合在某个非常细分的领域发挥自己的功能。下面是ProductAI提供的一些主要功能。

1、一张图中多个物体的识别与搜索

假设你拍下了一张照片,照片中有麦当劳、公交车、老人、杨树、白云、蓝天,那么,ProductAI可以精准的将照片中的元素识别出来。比如下面这张图片中,ProductAI将所有13辆汽车都识别出来。

2、以图搜图

ProductAI可以“以图搜图”,识别目标图片中的类似场景。下图是根据城堡图片,搜索出的类似图片。

3、为海量的图片自动打标签

ProductAI可以为海量的图片自动打标签,通过综合识别模型,挖掘出语义信息并用文字标签的形式将这些信息表达出来。可解读的信息包括图片中的客观内容(老人、树、音乐厅等)、主观感受(积极、成功、快乐等)、内容衍生主题(健康生活方式、家庭等)、图片颜色(彩色、黑白等)、图片产生方式(摄影、剪贴画等)、拍摄手法(剪影、留白、逆光等)等。

定制化的AI如何做?

AI不是搜索引擎,但在很多层面和搜索引擎类似。在之前接受雷锋网(公众号:雷锋网)采访时,码隆科技的联合创始人Matt Scott解释了让机器认识时尚的背后技术,

首先,我们从网络上收集关于时尚的海量数据,找出一些已经存在时尚标签的内容(比如这张图片是某位时尚明星的着装照);然后,我们创造一个模型来分析这些数据,用海量的数据来训练它,使它能够理解图片的色彩、纹理和Style,同时还有一小部分人可以帮忙给数据贴上标签;总的来说就是用类似搜索引擎的数据加上很强大的AI模型,收集数据并分析这里面的时尚视觉元素。 之后,我们会把分析的结果,比如版型、类别和衣服之间的关联等提取出来,去匹配你的模型和喜好。

最后的产品,是一款可以了解用户想要什么的个性化时尚工具。这其中AI的部分,主要就是通过深度学习构建起来的可以自我学习的模型,并用数据去训练这个模型。

而ProductAI是面向各种不同用户定制化的AI服务,在不同的应用场景中,它需要胜任不同的任务,这意味着深度学习的模型也是不同的。

一个深度学习的模型,适用于某一个任务。就好像一个人,他去上大学,学的是中文?还是物理?还是建筑,大脑里面的结构是不同的,这个不同是知识上有不同。那我们呢?就相当于要构建一个这样结构的大脑,去适应相应的任务,就好像不同的人有不同的专业一样。

Matt解释道。

Matt告诉我们,在构建特别的AI应用中时,一共有四个步骤:

首先是研究问题,明确我们需要解决的问题是什么,希望得到什么答案; 接着,建立适用于这个问题的神经网络架构; 然后,用海量的数据来训练这个架构; 最后,如果没有解决问题,再回去改。

码隆科技与中国纺织信息中心的合作就是一个例子,需要解决的问题是识别面料,码隆设计出一个神经网络架构,再利用中国纺织信息中心大量的面料图像来训练这个架构,最后得到的就是一款可以智能识别服装面料的工具。

这里面架构的好坏,数据的好坏与多寡都会影响最终工具的性能。码隆科技表示,ProductAI平台的图像分类和识别度匹配识别能力比专业人员还高8%,显示其在人工智能方面的技术实力。

码隆科技创立于2014年7月,两位创始人黄鼎隆(CEO)和Matt Scott(CTO),一位是中国人一位是美国人,两人曾在微软共同合作“必应词典”系列产品。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-10-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏用户2442861的专栏

华为社招面试(拿到offer)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/haluoluo211/article/d...

762
来自专栏java一日一条

我在面试中最喜欢问开发者的问题,和回答思路

我面试过很多人,大部分是开发者,部分是产品经理,有时候会面试主管或者副总监。但不管是面试什么级别和什么工种的应聘者,我都会在过程中对他们提出一个相同的要求: 现...

423
来自专栏BestSDK

Google发布云端文字转语音SDK:支持12种语言,32种声音识别

Google的文字转语音(Text-To-Speech)功能原本使用在Google助理或是GoogleMap等服务上,现在Google推出云端文字转语音服务,开...

3597
来自专栏CDA数据分析师

如何成为一名数据科学家 | 学习篇(附视频中字)

CDA字幕组 编译整理 本文为 CDA 数据分析师原创作品,转载需授权 数据科学家是21世纪最性感的职业,那么该如何成为一名数据科学家呢?HackerEarth...

2127
来自专栏PPV课数据科学社区

☞【案例】盈虚有数《我们可能比你更了解你自己》@EMC杯智慧校园开放数据大赛(最佳数据综合大奖)

转自:公众号Kesci数据实践,如需转载请申请授权 号外号外号外 EMC杯智慧校园开放数据大赛的终极作品,来自盈虚有数团队的《我们可能比你更了解你自己》,终于...

3105
来自专栏企鹅号快讯

TESLA V100如何让质疑GPU的流言“失声”

【IT168 评论】GPU在人工智能来临的前夜火了,很多人的眼光也聚焦到了英伟达身上,随之而来的,流言也就多了起来。有人认为,GPU在人工智能的应用存在一定的局...

1939
来自专栏程序员笔记

建筑和空间

1695
来自专栏CreateAMind

【图文实录】北大AI公开课 | 吴甘沙:智能驾驶,有多少AI可以重来

3月14日,北大AI公开课第四讲邀请到了驭势科技联合创始人&CEO、原英特尔中国研究院院长、英特尔首席工程师吴甘沙老师亲临现场,与北大人工智能创新中心主任、百度...

623
来自专栏人工智能头条

MSRA周明:计算机能“理解”多少我们的语言了?

1316
来自专栏AI科技评论

学界|德州扑克算法幕后研发者CMU博士Noam Brown专访:AI如何打败顶级人类牌手?

在上个月举行的单挑无限注德州扑克( heads-up no-limit hold’em)人机对战中,由卡耐基梅隆大学研发的AI程序Libratus以每100手1...

3484

扫描关注云+社区