这家帮迅雷、小咖秀鉴别“小黄图”的公司要做视频大生意

GAIR

今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在四处拜访人工智能、机器人领域的相关公司,从而筛选最终入选榜单的公司名单。如果你的公司也想加入我们的榜单之中,请联系:2020@leiphone.com

在让计算机理解世界上,或许理解了什么并不重要,重要的是理解的能力。于是图普科技想到让它理解“小黄图”。

图普是一家图像识别云服务公司,接入它的API,上传图片,服务器就能以一定的准确性解读图片。图普告诉雷锋网,其产品包括图像审核、増值及搜索,有鉴黄、人脸识别、场景识别等数十个模块,目前日均处理3亿张图片,是国内最大的图像识别云服务公司。

不过图普最知名的还是鉴别“小黄图”,图像视频审核也是现在最主要的服务,客户包括受不良信息困扰的迅雷,和王思聪投过的直播平台17等。

图片来自图普官网截图

鉴别小黄图听起来像是个苦力活,但与其它类型的图像一样,用的也是深度学习技术。自诞生以来,深度学习已经在计算机视觉和语音识别等领域展现了显著的效果,其中在图像识别的精确度上甚至超过了人类。雷锋网与数位业内人士交流中得知,深度学习可以说降低了机器学习的门槛。传统的机器学习算法,如Boosting和SVM,在模式识别中要设计很多特征,这需要大量经验和技术积累。而深度学习在自动提取特征上有极大优越性,输入原始数据,它能自行提取特征,不用人为设计,这让图像识别更多变成了工程问题。

创始人李明强告诉雷锋网,图普的优势体现在工程及数据两方面。虽然深度学习降低了技术门槛,但产品化过程中还会出现硬件与服务器不兼容,硬件配置与架构搭建上的困难,以及响应速度等问题。直播强调的是即时性,所以视频审核也要做到毫秒级,如果一不小心没审出来,主播们就要大白于天下了。图普日均处理3亿张图片,用的是基于大规模GPU集群的超算平台。李明强2012年前曾在腾讯工作七年,任QQ邮箱技术负责人,也是微信立项创始人之一,两者都有海量数据需要处理。

对人工智能企业来说,数据是一个很大的门槛。数据越多,分析的准确度就越高;而准确度高又能吸引更多用户,得到更多数据。图普表示,与国内主流的直播和短视频平台,如17、风云直播、小咖秀等都有合作,接入的数据多,覆盖全面。

李明强 / 图片来自图普科技

做到这一点的前提是找到方向和需求。图普在做内容审核前尝试的方向是拍照搜衣,即给身上的衣服拍张照,到淘宝搜同款。但搜衣服务需求及盈利空间不大,而且搜同款用关键词或许效果更好。后来由于快播事件,他们发现内容审核对很多社交及云平台都是刚需,才做起了鉴别小黄图。

不过鉴黄并不是图普的目标。也许是继承了腾讯的基因,李明强给图普的定位是给视频时代建立连接。在文字时代,只有对文字理解后才有搜索,才有内容间的连接。同样,图像和视频被计算机理解后,才能形成内容间的连接。

现在视频和图像逐渐成为主要内容和新的描述方式,推荐却还是以“看了的人还喜欢”这种方式为主,而非基于视频的内容。如果计算机看懂了视频,那推荐的理由就会变成类型,风格,甚至是故事结构了。

目前以鉴黄为代表,计算机可以识别人、物与场景,但对它们之前关系的理解还不够深入。李明强认为,根据内容进行推荐、搜索,提供差异化服务,视频行业才算到了第二阶段,目前的审核服务是为了满足基础需求,技术成熟后会提供广告投放和导购等增值服务。

看来,鉴别小黄图还只是开始。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-05-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

搜索,大促场景下智能化演进之路

2064
来自专栏机器之心

观点 | 低门槛究竟是深度学习的危机,还是契机?

选自reddit 机器之心编译 参与:黄小天、刘晓坤 近日,Reddit 上出现了一个颇有争议性的问题,提问者怀疑深度学习的低门槛会破坏这个领域的声誉,业余者的...

2957
来自专栏机器人网

众包:让机器人学习的更快更好

华盛顿大学计算机科学家最近展示了众包如何快速高效教育机器人完成任务。机器人将不再只是从一个人身上学习,而是有可能在更大范围的在线社区内,询问摆放餐具或者为花园浇...

2534
来自专栏大数据文摘

Teradata CTO:将筛选数据的时间用来决策,机器学习如何改变商业决策模式

2044
来自专栏新智元

【谷歌AI换帅】Jeff Dean正式接管,人工智能和搜索部门一分为二!

1544
来自专栏CDA数据分析师

收藏 | 新手零基础数据分析入门指南

什么是数据分析? 数据分析是指用适当的统计分析对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人...

23610
来自专栏机器之心

观点 | UC Berkeley哲学教授 Alva Noe:还原论远不是通向人工智能的坦途

机器之心原创 作者:Junpei Zhong 参与:Yang Haojin、黄小天、蒋思源 Alva Noë 目前是加利福尼亚大学伯克利分校的哲学教授,他的研究...

2946
来自专栏杨建荣的学习笔记

技术学习的一些建议

所以我们总是在不断的学习中,这个技能的迭代速度早就远超大学的学习内容。相比来说,现在我们学习更加追求高效和通俗,即学到的技能相同,但是学习的内容能用大白...

1032
来自专栏人工智能头条

OpenAI用Reddit训练聊天机器人

1814
来自专栏CDA数据分析师

吴甘沙:数据分析师进化的3道阶梯

9月11日—9月12日,由经管之家(原人大经济论坛)主办的“2015中国数据分析师行业峰会(CDA?Summit)”在北京举行。 英特尔中国研究院院长兼首席工程...

2157

扫码关注云+社区