【新智元导读】谷歌今天开源了MobileNets,它是一类用于手机等移动设备的视觉应用的高效模型,能够最大限度利用有限的资源实现高准确性。
地址:https://github.com/tensorflow/models/blob/master/slim
近年来,深度学习促进了计算机视觉领域的巨大进步,神经网络不断地推动着视觉识别技术的前沿。虽然许多这些技术,例如对象、地标、logo、文本识别等,是通过 Cloud Vision API 提供给互联网连接的设备,但我们相信,智能手机等移动设备日益强大的计算能力可以令这些技术交付到用户手中,不需互联网连接,随时随地可用。但是,手机上以及嵌入式应用程序的视觉识别有许多挑战,模型必须要能够在资源有限的环境中快速、高效地运行,必须要充分利用有限的计算力、功率和空间。
今天,我们很高兴地宣布开源 MobileNets,这是 TensorFlow上的“移动为先”(mobile-first)计算机视觉模型家族的一员,它能利用移动设备应用程序或嵌入式应用程序的有限资源,最大限度地提高准确性。MobileNets是小型、低延迟、低功耗的模型,参数化以满足各种用例的资源限制。它可以被构建用于分类、检测、嵌入和分割,功能类似其他流行的大规模模型(例如Inception)。
示例用例包括物体检测、细粒度分类、属性提取和地理定位。
此版本包含使用TF-Slim的TensorFlow中的MobileNets的模型定义,以及用于各种规模的手机项目的16个预训练ImageNet分类检查点。这些模型可以使用TensorFlow Mobile在移动设备上高效运行。
选择正确的MobileNet模型,以适应你的延迟时间和规模预算。内存和磁盘上网络的大小与参数数量成正比。网络的延迟时间和功率使用量与成绩累加运算(MAC)的数值相当。Top-1和Top-5的准确度是在ILSVRC数据集上测得。
我们很高兴与开源社区共享MobileNets,开源获取地址:https://github.com/tensorflow/models/blob/master/slim/nets/mobilenet_v1.md
在TensorFlow-Slim Image Classification Library可以获取开始使用信息,了解如何在设备上运行模型,请访问TensorFlowMobile:https://www.tensorflow.org/mobile