RKNPU2通用API和零拷贝API

2023-11-18

RKNPU2通用API

通用API接口按照异构编程规范,需要将数据拷贝到NPU运行时的内存空间。

通用API部署流程

  • 初始化上下文,需要先创建上下文对象和读取模型文件

    rknn_context ctx;
    model = load_model(model_path, &model_len);
    ret = rknn_init(&ctx, model, model_len, 0, NULL);
    \\使用opencv读取需要处理的图片,一定要将图片从BGR转换为RGB格式
    
    cv::Mat img = imread(img_path, cv::IMREAD_COLOR);  // 读取图片数据,并保存在img
    cv::cvtColor(img, img, cv::COLOR_BGR2RGB);
    
  • 创建输入

    rknn_input inputs[1];
    inputs[0].index = 0;
    inputs[0].type = RKNN_TENSOR_UINT8;
    inputs[0].size = img.cols*img.rows*img.channels();
    inputs[0].fmt = RKNN_TENSOR_NHWC;
    inputs[0].buf = img.data;			// 把img拷贝到inputs[0].buf
    ``
    - 设置输入
    ```c
    ret = rknn_inputs_set(ctx, io_num.n_input, inputs);  // 把inputs数据拷贝到ctx对象当中
    
  • 执行模型

    ret = rknn_run(ctx, nullptr);
    
    
  • 释放资源

    rknn_outputs_release(ctx, 1, outputs);
    rknn_destroy(ctx);
    free(model);
    
    

在这里插入图片描述

RKNPU2零拷贝API

通用API需要利用rknn_inputs_set设置输入,零拷贝API则直接将数据拷贝到之前申请好的内存即可。

零拷贝API部署流程

  • 初始化上下文,需要先创建上下文对象和读取模型文件

    rknn_context ctx;
    model = load_model(model_path, &model_len);
    ret = rknn_init(&ctx, model, model_len, 0, NULL);
    \\使用opencv读取需要处理的图片,一定要将图片从BGR转换为RGB格式
    
    cv::Mat img = imread(img_path, cv::IMREAD_COLOR);  // 读取图片数据,并保存在img
    cv::cvtColor(img, img, cv::COLOR_BGR2RGB);
    
    
  • 创建输入

    // 调用rknn_create_mem接口申请内存
    input_mems[0]   = rknn_create_mem(ctx, input_attrs[0].size_with_stride);
    ...
    // 调用rknn_set_io_mem接口让NPU使用已经申请的内存
    rknn_set_io_mem(ctx, input_mems[0], &input_attrs[0]);
    
  • 执行模型

    ret = rknn_run(ctx, nullptr);
    
    
  • 释放资源

    rknn_destroy_mem(ctx, input_mems[0]);
    rknn_destroy(ctx);
    free(model);
    
    

在这里插入图片描述

速度对比

warmup轮数50,循环推理1000次,计算平均耗时,包括预处理和后处理的总时间。npu只用了一个核心。

型号 速度
通用API 30-32ms
零拷贝API 30-31ms

来源于https://blog.csdn.net/weixin_43337573/article/details/131817935

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

RKNPU2通用API和零拷贝API 的相关文章

随机推荐

  • JavaScript 數組常用 API 整理

    JavaScript 數組常用 API 整理 push args pop shift unshift args join args concat args slice start end splice start deleteCount v
  • 史上最全的 iOS 各种测试工具集锦,看看有没有你不知道的

    引言 随着移动互联网的兴起 APP 测试的越来越被重视 Android 系统因为自己的开源性 测试工具和测试方法比较广为流传 但是 iOS 系统的私密性 导致很多测试的执行都有点麻烦 为了帮助大家更好的执行 iOS APP 的测试 本文为大
  • linux中 > 、>> 的用法

    linux中 gt 表示覆盖原文件内容 文件的日期也会自动更新 gt gt 表示追加内容 会另起一行 文件的日期也会自动更新 1 将history命令执行的结果保存到history log文件中 root gxzs solr1 histor
  • app与小程序的区别和优劣势

    在今天的移动互联网时代 APP与小程序已成为人们生活中的不可或缺的一部分 虽然两者都可以在智能手机上运行 但它们之间存在着不同 有些人可能会认为两者并无太大区别 但事实上这两种技术有着各自独特的优劣势 1 区别 APP Applicatio
  • flink学习43:基于行的操作map、flatmap、聚合

    Map FlatMap 聚合
  • 在桌面Linux环境下开发图形界面程序的方案对比

    在Linux下开发GUI程序的方法有很多 比如Gnome桌面使用GTK 作为默认的图形界面库 KDE桌面使用Qt作为默认的图形界面库 wxWidgets则是另一个使用广泛的图形库 此外使用Java中的Swing AWT组件也可以用于开发Li
  • 没有与参数列表匹配的 重载函数 std::vector<>::erase(remove)

    include
  • 白盒测试用例设计方法学习笔记(二)----基本路径测试法

    转载请注明出处 白盒测试用例设计方法主要分为两种 1 逻辑覆盖法 2 基本路径测试法 本文主要对基本路径测试法的相关进行整理 基本路径测试法 基本路径测试法 是在程序控制流图的基础上通过分析控制构造的环境复杂性导出基本可执行路径的集合 从而
  • Oracle表空间详细介绍

    表空间概述 Oracle的表空间属于Oracle中的存储结构 是一种用于存储数据库对象 如 数据文件 的逻辑空间 是Oracle中信息存储的最大逻辑单元 其下还包含有段 区 数据块等逻辑数据类型 表空间是在数据库中开辟的一个空间 用于存放数
  • 小白入门angular(一)

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 操作系统 window 10 IDE webstorm 步骤一 安装nodeJS 链接为https nodejs org en 选择对应的node版本 安装node时会自动
  • Python基础知识第四篇:方法重写+文件处理+异常处理,冒死上传

    Python基础知识第四篇 基础知识第一话 基础知识第二话 基础知识第三话 今天给大家分享的是第四篇 前面几篇我都放在上面了 小伙伴可以自己领取巩固复习 方法重写 Python学习交流Q群 906715085 print 方法重写 codi
  • MATLAB滤波算法和LabVIEW心电图诊断系统

    心电图的生理 我们的目标是构建一个心电图 ECG 它不仅可以自动计算心率 还可以检测其他心脏异常 这需要对 ECG 信号进行更高级的分析 为了实现这一目标 需要完成几个步骤 如下面的流程图所示 在我们详细介绍如何构建 ECG 之前 了解 E
  • Stata学习笔记

    目录 数据的三种类型 在stata中以颜色区分 类型转化 1 destring 红转黑 限于第一种红色 2 tostring 黑转红 3 encode 红转蓝 限于第二种红色 4 label define label value 黑转蓝 5
  • rk3568 nvme硬盘分区,格式化,挂载测试

    前言 环境介绍 1 编译环境 Ubuntu 18 04 5 LTS 2 SDK rk356x linux 3 单板 迅为itop 3568开发板 自制底板 一 查看硬盘 插上硬盘上电 进入系统后通过命令lspci查看nvme硬盘识别情况 r
  • 容灾备份

    欢迎关注 全栈工程师修炼指南 公众号 点击 下方卡片 即可关注我哟 设为 星标 每天带你 基础入门 到 进阶实践 再到 放弃学习 涉及 企业运维 网络安全 应用开发 物联网 人工智能 大数据 学习知识 花开堪折直须折 莫待无花空折枝 作者主
  • 使用UE4插件SimpleHTTP的技巧

    UE4插件名 SimpleHTTP 版本 1 1 目录 前置工作 上传资源 下载资源 删除资源 SimpleHTTP源码接口 哈喽大家好 我叫人宅 这节课我们来讲解一下SimpleHTTP使用技巧 该插件目前提供了对web服务器进行上传下载
  • 软件测试的一点心得体会

    在学习软件测试之前 我们先要知道什么是软件测试 只有知道了软件测试是做什么的 我们才能更深入的去理解它 在我的印象里 软件测试就是通过人工或者自动化的方式对软件进行检测 并发现软件的缺陷的一个过程 而软件测试工程师就相当于质检员的角色 在软
  • 深度学习:Keras入门(一)之基础篇

    1 关于Keras 1 简介 Keras是由纯python编写的基于theano tensorflow的深度学习框架 Keras是一个高层神经网络API 支持快速实验 能够把你的idea迅速转换为结果 如果有如下需求 可以优先选择Keras
  • python 指定值的位置_python数组查找某个值的位置

    python如何返回数组中某值在数组的位置 python3里这样 gt gt gt a 1 2 3 gt gt gt b 2 gt gt gt b in a True 先判定b在a里 gt gt gt a index b 1 b在a的位置1
  • RKNPU2通用API和零拷贝API

    RKNPU2通用API 通用API接口按照异构编程规范 需要将数据拷贝到NPU运行时的内存空间 通用API部署流程 初始化上下文 需要先创建上下文对象和读取模型文件 rknn context ctx model load model mod