导读
魁达的动态影像标记平台「ezLabel」4月9号改版后,介面不但可以支援1026种物件的标注,比传统流程快15倍,也可弹性让使用者自行定义物件,另外也推出标记行为的功能。
ezLabel平台可以让用户选择欲标记物件的类别后,用方框框出目标物第一次、最后一次出现在画面中的位置,再点击执行,系统就会在影片中自动标出目标物件。
今年COMPUTEX活动上,魁达智慧(creDa)展出了今年1月正式上线的动态影像标记平台「ezLabel」,只要上传影片至平台,并针对目标物件第一次、最后一次出现的画面进行标注,就能透过演算法自动标记出影片中的目标物件,可以比传统标记方式快15倍。而在4月9号改版后,除了介面中可支援的物件标记新增到1026种,也加入了标记行为的功能,可针对同一区段的多种行为重复标记。
一般在标记动态影像时,会需要在一帧一帧的静态画面中标出目标物件,若以一秒24帧来算,每十帧标记一次,在一秒内就需要标记2-3次,时常耗费大量时间来标记影像。为了缩短标注时间,魁达推出ezLabel动态影像标记平台,使用者只需上传影片至平台,先行用方框框出目标物第一次、最后一次出现在画面中的位置,再点击执行,系统就会透过深度学习提取画面特征值并与影片比对,再自动标出目标物件。
虽然平台没有限制影片上传长度,但魁达智慧执行长沈柏均也提醒,影像在平台上播放与标记时,会占用个人电脑的暂存记忆体,记忆体要够大才能处理更长时间的影像,因此会建议影片长度以五分钟为限。
沈柏均也表示,现行的演算法仍无法适用于所有物件的标记。经开发团队测试后,确定可被自动化标记的物件共有1026项,包括常见的汽机车、行人,或是水中生物等,均已内建于平台介面中,但如果用户在介面中找不到欲标注的物件,可以利用自定义的功能新增项目来测试,仍然可能适用于自动化标注。
「全自动的演算法没有到完美,可是可以比过去快15倍。」沈柏均表示,能否被自动标注也取决于影像的复杂度,例如在大量机车停等红灯的场景中,目标机车就不容易被辨识,因此,在系统自动化标注完成后,需要人工复查,重新将错误标记的部份更正,但即便如此,整个标记流程还是能比传统方式快15倍。
ezLabel平台提供用户自行创建任务的功能,并可以选择欲标记物项的种类(Category)、型式(Type)、特征(Attribute)。
若介面中找不到欲标注的物件,可以利用自定义的功能新增项目来测试。
接下来就可以在影片的画面中标记出目标物,再透过演算法自动标注。
今年4月9号改版后ezLabel新增了标记行为的功能,沈柏均表示,许多开源软体提供标记行为的方式,是用单张静态画面去标注,但行为应该是连续性的动作。因此,ezLabel让使用者在区段中标记行为,例如「走路」这个行为,可以用十帧画面中、被标注的人的动作变化来定义。此外,在区段中也可重复标记不同的行为,例如一个人一边走路一边撑伞,就能在区段中同时标记「走路」与「撑伞」的行为。
ezLabel注册帐号后就可以使用,学生用户比例较高,在标记完成后,ezLabel也提供两种常见的下载格式,分别是PASCAL VOC、JSON,能直接用于AI模型的训练。未来,魁达也希望能将标记完的资料直接串接云端,能让用户能更便利运用资料来训练模型,省去资料被下载、再上传云端的程序。