OpenBr快速入门 原

转载请注明出处:Gaussic

官方翻译加实践,基于Windows版本。

官网地址:这是链接

这篇教程旨在使用一些有趣的例子让你熟悉OpenBR背后的思想、对象以及动机。注意需要摄像头的支持。

OpenBR是一个基于QT、OpenCV和Eigen而构建的C++库。它既可以在命令行使用br命令来使用,还可以通过C++或C的API接口来使用。使用br命令是最简单也是最快地起步方法,这篇教程中的所有例子都是基于br命令的。

首先,确认OpenBR正确地安装。

Windows版本的安装教程:这是Windows版教程

如果是其他版本,请参照官网:官网

官方文档存在一定错误,Windows版本可参照上面的链接。

在终端或命令行输入:

$ br -gui -algorithm "Show(false)" -enroll 0.webcam

如果每一步都按照上面进行操作,你的摄像头应该打开了并且开始捕捉视频了。恭喜你,你正在使用OpenBR。注:如果是Windows用户请切换到 openbr\build-msvc2013\install\bin 目录下,也可以把这个目录加到环境变量里面。

现在我们来聊聊上面的命令到底发生了什么。-gui-algorithmenroll是OpenBR的一些flag,它们被用来指定br应用的指令操作。OpenBR规定所有的flag都带有-前缀,以及所有的参数都用空格隔开。Flags通常需要特定数量的参数。所有可能的flags以及它们的值在这里:CL_API

让我们一个个解析一些这些参数和值:

  • -gui是用来告诉OpenBR打开一个GUI窗口的flag。注意,如果使用-gui,它必须是第一个传给br的flag。
  • -algorithm是OpenBR最重要的flags之一。它需要一个参数,被称作算法串(algorithm string)。这个字符串决定了传输哪些图像以及元数据的管道。它由Transforms组成,浙江在后续的教程里讲解。
  • -enrollGalleryFormat那里读文件,并且加入到算法管道中,以及将它们序列化给另外的GalleryFormat-enroll需要一个输入参数(在这个例子中是0.webcam)以及一个可选的输出参数。OpenBR支持多种格式,包括.jpg.png.csvxml.webcam格式告诉OpenBR从计算机的摄像头采集图像帧作为输入。

让我们来试试一个稍微更复杂一点的例子。毕竟,OpenBR能做更多的事情,而不仅仅是开摄像头。再次打开终端输入:

$ br -gui -algorithm "Cvt(Gray)+Show(false)" -enroll 0.webcam

这里,通过简单地在算法串中添加Cvt(Gray),我们输入普通的BGR(这里是OpenCV的BGR模式)图像并且将其转换成了灰度图像。Cvt,是 convert的缩写,是OpenBR Transform的一个例子,Show也是。实际上,OpenBR中的每一个算法串都是组成一个管道的一系列Transform的结合,甚至连+都是Pipe的缩写,这是另外一种OpenBR Transform

通常,Transforms会接收参数。我们指定Gray作为Cvt的一个运行时参数,来告诉这个Transform需要将图像转换到哪个颜色空间。我们也可以写Cvt(HSV),如果我们想转换为HSV颜色空间,或者Cvt(Luv),如果我们想转换为LUV。参数可以通过键值对的方式来提供(Cvt(Gray)等价于Cvt(colorSpace=Gray))。注意,如果只想传入值的话,请按照算法定义的参数顺序来传值。试试将上面的算法串改为Show(true)来看看修改参数对输出的影响(提示:按住一个键然后查看变化)。

我们来把这个例子变得更加刺激以及更加贴近OpenBR的目的。人脸检测往往是人脸识别的第一步。我们来执行一下OpenBR中的人脸检测。打开终端输入:

$ br -gui -algorithm "Cvt(Gray)+Cascade(FrontalFace)+Draw(lineThickness=3)+Show(false)" -enroll 0.webcam

你的摄像头应该再一次被打开了,但是这一次在里的脸部多了一个框。我们添加了两个新的Transform:CascadeDraw。我们来通过一个个的Transform来看看它是如何工作的:

  • Cvt(Gray):将图像从BGR转换为灰度图。灰度图是Cascade正常工作所必需的。
  • Cascade(FrontalFace):这个是对OpenCV Cascade分类框架的一个封装版本。它使用FrontalFace模型来检测正脸。
  • Draw(lineThickness=3):获取Cascade检测到的矩形框并且画到摄像头图像帧中。lineThickness决定了矩形框的厚度。
  • Show(false):在GUI窗口中显示图像。false指明图像的显示不需要等待按键操作。

每一个Transform完成一个任务并且将其输出传递给另一个Transform。你可以随心所愿地连接任意多的Transform,但是要注意特定的Transform对它们的输入有着特定的需求。

你可能会思考,到底哪些对象被传递给了算法管道。在OpenBR中有两个对象来处理数据:

  • Files通常被用来存储磁盘上相关元数据文件的路径信息(键值对形式)。在上面的例子中,我们将Cascade检测到的矩形框作为一个元数据,然后交给Draw来可视化。
  • Templates是图像和Files的容器。图像在OpenBr中是OpenCV Mats,且是Templates的成员变量。Templates可以包含一个或多个图像。

如果你想学习更多关于命令行或者所有的插件以及关键数据结构的内容,请参考链接的文档。下一篇教程将会更加深入地探讨算法以及它们的使用。

这篇是 gaussic.github.io 的备份,欢迎拍砖。

转载请注明出处:Gaussic

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏QQ音乐技术团队的专栏

Android 中图片压缩分析(上)

在 Android 中进行图片压缩是非常常见的开发场景,主要的压缩方法有两种:其一是质量压缩,其二是下采样压缩。

1.4K2
来自专栏瓜大三哥

SD-SDI数据解析

凡是做模拟信号采集的,很少不涉及BT.656标准的,因为常见的模拟视频信号采集芯片都支持输出BT.656的数字信号,那么,BT.656到底是何种格式呢? 本文...

1455
来自专栏PPV课数据科学社区

《Kaggle项目实战》 泰坦尼克:从R开始数据挖掘(一)

摘要: 你是否为研究数据挖掘预测问题而感到兴奋?那么如何开始呢,本案例选自Kaggle上的数据竞赛的一个数据竞赛项目《泰坦尼克:灾难中的机器学习》,案例涉及一...

3486
来自专栏媒矿工厂

Ittiam优化VP9,turnaround时间大幅减少

libvpx是Google开发的视频编解码器VP8和VP9的开源软件实现库。libvpx中包含了VP9视频编码算法,相比H.264/AVC,在高...

3165
来自专栏Spark学习技巧

第2篇:数据库关系建模

第二篇:数据库关系建模 前言 ER建模环节完成后,需求就被描述成了ER图。之后,便可根据这个ER图设计相应的关系表了。 但从ER图到具体关系表的建立还需要经过两...

3336
来自专栏Y大宽

RNA-seq(6): reads计数,合并矩阵并进行注释

小结 计数分为三个水平: gene-level, transcript-level, exon-usage-level 标准化方法: FPKM RPKM ...

4755
来自专栏新智元

【TensorFlow1.2.0版发布】14大新功能,增加Intel MKL集成

【新智元导读】TensorFlow 今天发布最新版 1.2.0,公布了14大最新功能。新智元带来最新介绍,包括 API 的重要变化、contrib API的变化...

3459
来自专栏Soul Joy Hub

tensorflow架构

原文 : http://blog.csdn.net/stdcoutzyx/article/details/51645396 Basic Concepts 张量(...

3488
来自专栏人工智能LeadAI

五分钟喝不完一杯咖啡,但五分钟可以带你入门TensorFlow

本文是《人人都能学人工智能-TensorFlow系列》文章的第一篇,这个系列会对TensorFlow的基础使用,SoftMax,交叉熵,Dropout,CNN,...

4579
来自专栏cs

python统计一下自己的花费

1513

扫码关注云+社区

领取腾讯云代金券