嵌入式目标检测--Fast YOLO: A Fast You Only Look Once System for Real-time Embedded Object Detection

Fast YOLO: A Fast You Only Look Once System for Real-time Embedded Object Detection in Video https://arxiv.org/abs/1709.05943

针对在嵌入式设备使用CNN进行目标检测,本文对 YOLOv2进行改进,在稍微降低精度的情况下,减少模型的参数量,提高运算速度。在视频处理中,相对 YOLOv2 平均加速 ∼3.3X, run an average of ∼18FPS on a Nvidia Jetson TX1 embedded system

2 Methodology Fast YOLO framework 主要包括两个部分:1) optimized YOLOv2 architecture,2)motion-adaptive inference

2.1 Optimized Network Architecture CNN网络最优结构设计是一个难题,这个过程通常是一个专家在针对特征任务中的 约束( accuracy and the number of parameters)尝试各种网络结构寻找最佳网络设计。当前寻找最优网络结构通常是当做一个 hyper-parameter optimization problem, 但是这个优化问题的解决 very time-consuming,大多数方法要么计数不可控,要么得到的解不是最优的。例如 在超参数优化中常用的一个方法是 grid search,在大范围内尝试各种不同 network configurations ,将最好的 configuration 作为最终的网络结构。但是用于目标检测的CNN网络通常有很多参数,grid search 这种方法就不是 computationally tractable。

这里我们换个角度看问题,从 improving network efficiency 这个方向,我们参考 evolutionary deep intelligence framework [16, 17, 18],用它来优化 YOLOv2 得到一个 optimized network architecture O-YOLOv2, 这个新的网络 比原来的 YOLOv2 参数减少 ∼2.8X

2.2 Motion-adaptive Inference

因为在视频里存在大量信息冗余,所以不是所有的视频帧都含有 unique 信息,所以不用对每一帧进行 deep inference,这里我们引入一种 基于运动信息的自适应 inference,we introduce a motion-adaptive inference approach to determine if deep inference is needed for a particular video frame

3 Results & Discussion

Pascal VOC dataset

running on a Nvidia Jetson TX1 embedded system

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

怎样构建深度学习模型?六步走,时刻小心过拟合 | 入门指南

872
来自专栏磐创AI技术团队的专栏

深度学习中的正则化技术概述(附Python+keras实现代码)

1191
来自专栏ATYUN订阅号

如何处理机器学习中类的不平衡问题

不平衡类使机器学习的“准确性”受到破坏。这在机器学习(特别是分类)中是一个非常普遍的问题,在每个类中都有一个不成比例的数据集。标准的准确性不再可靠地度量性能,这...

3298
来自专栏计算机视觉战队

深度网络自我学习,最终实现更少样本的学习

接下来我们就开始今日的主题:自我学习,最少的样本去学习。听到这个,大家会想到剪枝、压缩神经网络。今天这个更加有趣,现在我们开始欣赏学术的盛宴!

1421
来自专栏机器之心

学界 | 华盛顿大学推出YOLOv3:检测速度快SSD和RetinaNet三倍(附实现)

选自pjreddie 作者:Joseph Redmon、Ali Farhadi 机器之心编译 近日,来自华盛顿大学的 Joseph Redmon 和 Ali F...

3794
来自专栏企鹅号快讯

高精准预测—人工神经网络

我就在这里等你关注,不离不弃 ——A·May R-46T-56 ? 「序 言 」 前几天学习了R中的KNN近邻分类预测的做法,KNN近邻分析法可以说是最基础的、...

2006
来自专栏算法channel

机器学习:XGBoost 安装及实战应用

《实例》阐述算法,通俗易懂,助您对算法的理解达到一个新高度。包含但不限于:经典算法,机器学习,深度学习,LeetCode 题解,Kaggle 实战。期待您的到来...

4487
来自专栏专知

【明星自动大变脸,嬉笑怒骂加变性】最新StarGAN对抗生成网络实现多领域图像变换(附代码)

【导读】图像之间的风格迁移和翻译是近年来最受关注的人工智能研究方向之一,这个任务在具有趣味性的同时也是很有挑战的。相关的研究成果也层出不穷,有的甚至引起了全世界...

4279
来自专栏视觉求索无尽也

【调参经验】图像分类模型的调参经验前言调参经验与我交流

用深度学习做图像分类任务也有近一年时间了,从最初模型的准确率只有60%到后来调到有80%,再到最后的90%+的准确率,摸索中踩了很多坑,也总结出了一些经验。现在...

1142
来自专栏IT派

随机森林之美

导语:随机森林和决策树相比,能更好的防止过拟合。虽然每个基分类器很弱,但最后组合的结果通常很强,这也类似于:“三个臭皮匠顶个诸葛亮”的思想。对比发现Random...

3964

扫码关注云+社区