前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全志V853 NPU开发之Demo使用说明

全志V853 NPU开发之Demo使用说明

作者头像
阿志小管家
发布2024-02-02 19:52:28
2070
发布2024-02-02 19:52:28
举报
文章被收录于专栏:全志嵌入式那些事

上一章节中配置 NPU 扩展包后可以在 menuconfig 里看到两个 Demo 测试应用程序。这里我们来介绍一下怎么使用这两个 Demo。

YOLOV3

在 NPU Package 中我们提供了一个较为完整的 YOLOV3 Demo 作为测试,程序源码位于:

代码语言:javascript
复制
openwrt/package/npu/yolov3/src

这个 Demo 相较于 Lenet 的 Demo 增加了图片前处理、数据处理、后处理与图片打框的功能。可以将上传的图片物体打框标记并输出打框后的图片。

首先我们在 menuconfig 里选中 YOLOV3 的相关选项

可以看到这里选择了 yolov3 会出现 yolov3-model 这个选项,这个选项是提供一个测试使用的模型到系统中,文件较大,如果编译打包出现错误请参阅【FAQ 常见问题 - V853】查看或参考以下解决方法。

报错时的错误提示:

解决方法:修改板级目录下面的 sys_partition.fex 的 rootfs.fex 节点 45360 ==> 95744

测试 YOLOV3

首先我们准备一张图片,并把图片转换为 416*416 分辨率的图片。

使用 ADB 将图片下载到 root 目录

代码语言:javascript
复制
adb push 2.jpg root

在开发板上,切换文件夹到 root 文件夹,使用 ls 列出看看有没有 2.jpg 这个图片文件

代码语言:javascript
复制
cd /root

ls

可以看到,这里已经下载成功了,接下来运行 yolov3,格式是:

代码语言:javascript
复制
yolov3 <模型文件> <图片文件>

之前我们选中了 yolov3-model 模型包,模型已经安装到/etc/models/yolov3_model.nb了,所以在这里我们直接可以使用这个模型,执行

代码语言:javascript
复制
yolov3 /etc/models/yolov3_model.nb 2.jpg

可以看到识别到了 carmotorbike ,此时 ls 可以看到打标完成的图片 yolo_v3_output.bmp

可以使用 adb 上传图片到主机查看。

代码语言:javascript
复制
adb pull /root/yolo_v3_output.bmp

打开图片即可查看标注情况

如果运行出现错误,请确认图片格式是否为jpg,图片分辨率是否为 416x416

代码语言:javascript
复制
Error: Input size mismatch for 2.jpg, file data size:516672, expected:519168

Lenet

如果说深度学习有什么 HelloWorld,那一定是 Lenet。

在 NPU 扩展包中提供了一个 Lenet 的 Demo 程序。

这个 Demo 较为基础,演示了模型转换生成的模板代码如何集成到 Tina Linux 里。由于没有前处理与后处理,所以输入数据与输出数据均为二进制 tensor 文件。也正因为如此,所以可以将输出的 tensor 与仿真输出的 tensor 进行对比,验证是否有错误。

如果想要更完善的包括前处理与后处理的 Demo 可以查看 yolov3 Demo。

我们先 make menuconfig 找到 Lenet 选项,这里提供 lenet 主程序与 lenet-model 模型两个包,可以只选中主程序使用自己转换的模型测试。

在这里我们就使用扩展包提供的模型进行验证。先去 扩展包里找到测试数据 lenet_input_0.dat 并上传到开发板。

使用 ls 列出上传的数据

使用 lenet 命令运行测试模型

代码语言:javascript
复制
lenet <模型文件> <数据文件>
代码语言:javascript
复制
lenet /etc/models/lenet_model.nb lenet_input_0.dat

可以看到这里输出了 tensor output0_10_1.dat 文件

如果需要实现图片的输入与输出,需要基于这个模板增加图片前处理与数据后处理部分的代码。前处理将图片转为 tensor 输入,后处理解析 tensor 输出数据。

vpm_run

vpm_run 软件包是用于在开发板上测试运行的工具,一般用于开发板测试推理。而且可以通过参考 vpm_run 的流程,用户可以开发自己的 AI 应用程序,所以它可以看成是一套基于 AI 应用开发模板,只不过,它有自己的一些特点,

  • vpm_run 是可以作为一个通用模型运行环境,程序不需要修改,可以运行任何部署正确的NBG 模型文件.
  • vpm_run 基于 viplite 网络层 API,程序短小精悍。
  • vpm_run 具备默认的后处理程序 TOP5, 如果不满足你的算法要求,可以自行扩展。

我们先 make menuconfig 找到 vpm_run 选项,勾选,打包编译。这里我们同样勾选 lenet 选项,待会测试 vpm_run 使用,提供模型。

在开发板中,可以运行 vpm_run 查看支持的操作

代码语言:javascript
复制
vpm_run

可以看到,他需要一个 sample.txt 文件,定义如下

代码语言:javascript
复制
[network]                  # 模型的名称
./lenet_model.nb
[input]                    # 输入数据
./lenet_input_0.dat
[golden]                   # 标准输出数据,会与输出数据比对检查是否有偏差(可选)
./lenet_input_golden.dat
[output]                   # 输出数据
./lenet_output_data.dat

其中的 golden 标签代表的是标准输入,可以看作一个满分的输出,这个输出可以用预推理阶段生成的输出文件,也可以用仿真输出的文件。vpm_run 会比对这两个文件查看是否有错误产生。

代码语言:javascript
复制
vpm_run sample.txt

有些模型需要的内存较大,需要修改更大的内存,可以打开 openwrt/package/npu/vpm_run/src/vpm_run.c 修改分配的内存大小(viip_init(内存大小))。

多输入/多网络配置

多输入sample.txt文件配置,当只有一个nb模型但需要有两个输入时:

``` [network] ./network_binary.nb [input] ./iter_0_images_262_out0_1_3_640_640.tensor ./input_0.dat

代码语言:javascript
复制
多网络sample.txt文件配置,当需要一次运行多个nb模型时,不同nb以标签为界限:

 ```
[network]
 ./network_binary.nb
 [input]
 ./iter_0_images_262_out0_1_3_640_640.tensor

 [network]
 ./network_binary.nb
 [input]
 ./input_0.dat

常见问题

① 按照官网上的教程在V853上部署 lenet 模型,使用 vpm_run sample.txt 的时候出现segmentation fault ,如下图所示

读取sample.txt失败,检查一下vpm_run.c源码,查看获取文件名的换行符类型。

尝试将把sample.txt文件中的空格去掉,这是导致segmentation fault错误的原因之一。

windows操作系统的换行为:CR/LF或\r\n,而Linux的换行符为LF或\n。

② NPU模块vpm_run例程运行时sample.txt读取错误

编写sample.txt文件:

``` [network] ./network_binary.nb [input] ./iter_0_images_262_out0_1_3_640_640.tensor

代码语言:javascript
复制
将模型、输入文件、vpm_run例程传入板端

运行vpm_run例程:

./vpm_run -s sample.txt

代码语言:javascript
复制
报错LOG如下:

unsupported input file type=tenso. error input file type segmentation fault ```

报错为读取sample.txt失败,检查一下vpm_run.c源码,查看获取文件名的换行符类型,多是由于空格字符问题引起。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • YOLOV3
    • 测试 YOLOV3
    • Lenet
      • vpm_run
        • 多输入/多网络配置
        • 常见问题
        相关产品与服务
        腾讯云服务器利旧
        云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档