IBM的Watson AI用于开发多面跟踪算法

大蓝 IBM利用其沃森人工智能(AI)技术开发了一种新的多面跟踪算法。

尽管改变了摄像机角度,照明和外观,系统仍使用AI来跟踪场景中的多个人。

IBM Watson研究员Chung-Ching Lin与罗格斯大学统计与生物统计学系教授Ying Hung合作, 带领一支科学家团队开发该技术,采用一种方法在视频序列中发现不同的个体。

系统还能够识别人们是否离开然后重新输入视频,即使他们看起来非常不同。

为了在人工智能中创造这种创新,林解释说,该团队首先为源材料中的人们制作了“跟踪”。

“这些跟踪基于多个身体部位(面部,头部和肩部,上半身和整个身体)的共同出现,因此即使人们不能完全看到相机,也可以跟踪人们 - 例如,他们的面孔被其他物体挡开或遮挡“。

林补充说:“我们将多人跟踪问题表述为具有两种边缘的图形结构。”

这些中的第一个是“空间边缘”,其表示候选者在帧内的不同身体部位的连接,并且用于生成候选者的假设状态。

第二个是“时间边缘”,它指的是相邻身体部位在相邻帧上的连接,并用于估计不同帧中每个人的状态。

“我们使用来自每个人的轨迹的面部边框来生成面部轨迹,并提取面部特征以进行聚类,”他补充说。

为了了解该技术的表现如何,林和他的团队将其与分析无约束视频的挑战性数据集的最先进方法进行了比较。

在一项实验中,他们使用了音乐视频,这些视频具有高图像质量,但在场景,相机设置,相机移动,化妆和配件(如眼镜)中有显着的快速变化。

“我们的算法在聚类精度和跟踪方面都优于其他方法,”林补充道。“与其他方法相比,我们的算法可以显着提高聚类纯度[和]自动确定要跟踪的人数或聚类数,而无需手动进行视频分析。”

该算法及其性能在IBM的CVPR研究论文 “ 无约束视频中的多面跟踪的先行方法”中有更详细的描述。μ

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180713A1T4UA00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券