Jacques Mattheij从来没想过他会买两吨的乐高积木。
但是这是他某天在ebay,不小心手滑购买大量二手积木之后必须面对的问题。他原本计划要转卖这些积木来赚取利润,但是他没想到竞标到的积木数量如此庞大,隔天一早,他就收到超过两百万颗的积木。
现在,他必须先帮这些积木分类,才能卖得好价钱,但是,用人力手工进行分类不会是个好主意。Mattheij在自己的部落格上说道:“这些积木大概要花好几辈子才整理得完。”
因此,Mattheij这位住在阿姆斯特丹郊区的发明家,决定要把这项劳累的工作转交给计算机。他推论既然GPU加速的深度学习这么有效,可以在自驾车的轨道上,展现辨识物体的能力,分辨出照片及影片中行人、自行车以及其他各种物体,那何不将AI技术用在这些乐高积木上呢?
拼凑出的大怪兽
Mattheij就像个孩子那般热爱乐高积木,几年前他也带自己的孩子去丹麦的乐高乐园。在搭乘游乐设施,餐厅用餐以及逛街的时候,他发现许多狂热的粉丝购买整箩筐的乐高积木。
当时,他就决定要从事乐高积木转售的新兴行业,并且想要另辟蹊径,利用自动化设备来进行繁琐的分类工作。完整的乐高组和稀有零件,比零散的乐高来得有价值,因此如果他能成功,这将是一门稳赚不赔的生意。
为了要打造乐高分类机,Mattheij首先(当然是..)利用乐高打造了模型。然后花了好几个月进行修正,拼凑出一个堪用的分类原型机,他称呼为“一团瞎拼胡凑的硬件所组合成的独立式机器科学怪人”。
这台“科学怪人”里面有家用跑步机、收款机的输送带、两台冷冻柜的马达,还有一个空气罐和照相机,然后利用了非常大量的快干胶来黏着。以下影片可以看到这台“科学怪人原型机”放慢动作的分类工作情形。
乐高分类机
训练这台乐高自动分类机可不是件容易的事情。一开始的时候,Mattheij要分类超过38,000种造型,超过100种的颜色及色泽,他不断地重新改写软件,但是多方尝试仍旧无法处理如此庞大的工作量。
“历经了六个月的程序编辑,我实在受够了去区分这些细微的不同,重复地测试及筛选乐高配件。”Mattheij说着,于是他使用Keras与TensorFlow深度学习框架训练一个神经网络,并在NVIDIA GeForce GTX 1080 Ti GPU运行GPU加速的cuDNN来进行这项工作,这个方式可以分辨乐高成千上万的造型和颜色。
“新方法只运作了几个小时,就得到比之前更好的成效,这几个月来的痛苦都恍如隔世。”Mattheij说道。
现在,Mattheij打造的乐高分类机,每小时可以分类4,000件乐高积木,正确率达到97%,但是Mattheij认为速度还会更快,正确率也不会受影响。截至目前为止,他已经分类了超过130,000件乐高积木。
“这台分类机效率比人工高得多,而且不需要休息,可以一直工作。”Mattheij说。
点击阅读原文,可阅读他刊登在IEEE Spectrum的文章