深度学习功能使图像识别洞察力更快速

文章来源：企鹅号 - 百代过客

仅在社交网络上，每天就有超过20亿张图片被分享。研究表明，一个人要花十年的时间才能看完Snapchat（色拉布）上所有的照片。这是一项相当乏味的任务，而且远远超过了人类的能力。媒体购买者和提供者在安排相关内容时遇到困难，分析图像/视频的组成部分，并以有效的方式生成内容定义投资回报。快速、准确、自动地获取多媒体的洞察力（也就是元数据、组成、类别、颜色）一直是一个挑战。NVIDIA有许多客户和生态系统合作伙伴解决这个问题，使用NVIDIA DGX作为深度学习（DL）驱动图像识别的首选平台。Imagga是该生态系统中有名气的品牌之一，它是提供深度学习驱动的图像识别和图像处理解决方案的先驱，该解决方案构建于世界上第一台个人人工智能超级计算机NVIDIA DGX Station。

与图像识别相关的重要术语

机器学习（Machine learning，ML）是一种人工智能的手动实现方法，允许使用近似智能的算法和我们每天都能听到的常用语。ML使用算法来分析数据，从中学习并帮助预测结果。

深度学习（Deep learning，DL）是ML的一个子集，或者说是一种实现ML的技术，随着开发人员利用神经网络的能力来发现洞察力，正在迅速取代工业，在没有人工手动编码功能的情况下自动检测模式是新的圣杯。

计算机视觉（Computer vision，CV）通过使用传感器和图像处理器来匹配人眼的能力，使计算机能够识别图像，ML和CV之间略有重叠。随着CV有助于处理每天产生数量惊人的视觉图像变得很重要。

图像处理（Image processing）是对图像执行某些操作（增强或压缩）以提取有用信息的一种方法。ML可用于计算机视觉和图像处理。

图像识别（Image recognition）是另一个术语，用于描述识别和检测图像或视频中的对象或特征的过程。有些人认为计算机视觉与图像识别相同，但计算机视觉更广泛，包括对象识别、字符识别和文本/情感分析。将图像识别与面部检测联系在一起是很常见的，但它还有更多的含义。

Imagga主要功能

分类/场景分类：自动将图片进行分类。例如，将照片按照山，海滩，宠物等进行分类。Imagga更强大的功能之一，是为特定用例和垂直方向训练特定分类器，从个人照片到植物识别到垃圾分类。

识别主要对象：识别图像中的主要对象。

自动标签照片：用不同的关键词来标注多个对象来帮助照片的排序、获取进行统计。

提取颜色：识别图像中的代表色，包括对所需要的前景和背景颜色进行单独识别。

分析构图：自动检测照片中最具视觉趣味性的区域，并最终实现对这些感兴趣区域的智能裁剪。

面部识别人脸：识别人脸并将其聚集到虚拟人物中，便于组织机构更好的对个人照片和社交媒体进行监控。

视觉相似性搜索：在一个集合中提取图像的特征，在一个集合中提取图像的特征，并允许其基于视觉、语义相似度进行搜索，以及类似的照片/产品建议。

发表于: 2018-09-142018-09-14 17:03:36
原文链接：https://kuaibao.qq.com/s/20180914A1AJTH00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

深度学习功能使图像识别洞察力更快速

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐