上位机图像处理和嵌入式模块部署(树莓派4b代码优化)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

        我们把程序从pc端port到嵌入式开发板上面,好处是降低了部署成本,代价是牺牲了设备性能。所以等到程序真正在开发板子上面运行起来,并且解决了基本功能和稳定性之后,剩下来的就是程序优化工作。成年人的世界一般不做选择题,通常是既要、又要、还要。所以这个时候,程序代码的优化往往就显得非常重要了。

1、业务流程的优化

        很多做技术的同学往往习惯于技术的优化,忽视了业务层面的优化。比如说,如果客户的业务种类很少、流程不复杂,甚至于部分流程可以合并解决,那么这节省下来的计算资源、网络资源和存储资源,是多少技术方案都没有办法达到的效果。

2、全方位使用开发板资源

        我们写软件,一般习惯于考虑的都是cpu资源、ram资源、存储资源和网络资源。但是soc上面,还有gpu、dsp、mcu、npu等等,如果能把这些资源也用起来,常常有事半功倍的效果。

3、计算改查找

        一般嵌入式开发板的cpu频率都要比pc的低,指令集也采用了更节约资源的risc指令集。所以,在嵌入式开发板上面,能不要做计算就不要做计算,能用查表处理的就用查表处理。甚至于,在条件允许的范围内,把所有可能性都用查表来代替也不是不可以的。

4、用dma代替memcpy

        如果需要拷贝的数据非常多,这个时候最好复用soc提供的dma资源,而不是让cpu去一个一个搬数据,这样效率是非常低的。

5、用cacheable内存访问代替uncacheable内存

        记得以前在做图像的时候,经常混用cacheable内存和uncachebale内存。两者图像算法访问的速度差太多了。相信有过类似经验的同学,肯定会对这条trick印象深刻。

6、合理使用汇编指令

        arm下面有很多的mac指令、浮点指令。所谓的mac指令,主要就是矩阵的计算、浮点的计算,合理使用这些指令,也可以让程序加快运行速度。

7、并发cpu使用

        如果一个算法执行时间很长,那么没有必要全部用1个cpu来执行。我们可以做成pipeline的形式来处理。比如说,一个算法需要执行40ms,那么分成四个thread来跑,一个thread一个cpu。那么虽然算法执行的总时间没有改变,但是算法结果的输出效率提高了4倍。

8、使用ip内部的加速功能

        从名字上面可能不太好理解,但是我们举个例子就明白了。之前做一个网络报文的发送功能,中间有一个crc计算的子程序。一开始我们都是用软件计算的,后来发现eth ip可以自动帮助计算crc。发现这个功能之后,优化了代码,效率一下子增加了很多。

9、合理使用第三方库

        部分posix提供的函数,性能是比较差的,比如jemalloc第三方库就比自带的malloc库好很多。如果业务比较简单,自己写一个固定内存的分配模块,循环分配和使用也是可以的。

10、从上至下,从主要花费时间的模块入手

        从上至下比较好理解,也就是先从业务层,再从模块层,最后从实现层去优化功能。等这些大的部分做好之后,在实现层的角度,我们先找出最浪费时间的地方,比如循环最多的地方、io阻塞的地方、流程忙等的地方等等去入手。这样优化起来效率高,效果也比较明显。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/674748.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YARN详解

YARN 简介 YARN 是Yet Another Resource Negotiator的缩写。 YARN是第二代MapReduce,即MRv2,是在第一代MapReduce基础上演变而来的,主要是为了解决原始Hadoop扩展性较差,不支持多计算框架而提出的;通俗讲就是资源管理器. YARN核心思想: 将 MR1 中资源管理和作业调度两个功能分…

Linux\_c输出

第一条Linux_c输出 初界面 : ls # 显示目录下的文件cd # 进入到某个目录 # 比如 我进入了Codels # 发现没有显示, 说明为文件下为空vim cpucdoe.c # 创建一个 .c的源码文件进入到了vim的编辑界面: i # 按i 就可以进行编辑 , 下面显示插入标识在编辑模式下, 可以通…

QX-mini51学习---(2)点亮LED

目录 1什么是ed 2led工作参数 3本节相关原理图分析 4本节相关c 5实践 1什么是ed 半导体发光二极管,将电能转化为光能,耗电低,寿命长,抗震动 长正短负,贴片是绿点处是负极 2led工作参数 3本节相关原理图分析 当…

(五)JVM实战——JVM性能调优与监控

JVM调优案例的场景 为什么要调优:防止或者解决jvm虚拟机中的OOM问题;减少FullGC出现的频率,解决系统运行卡、慢问题JVM调优案例的四个方面 OOM(堆溢出):java heap spaceOOM(元空间溢出):MetaspaceOOM(GC overhead lim…

cmake install命令无法覆盖同名文件

文章目录 1. 问题记录2. 原因排查3. 解决方案 1. 问题记录 我有两个同名文件test.txt,它们内容不同,但时间戳相同(文件属性中的修改时间相同) 我希望在cmake中利用install命令,将${PATH_SRC}/test.txt替换${PATH_DES…

idea修改maven项目名称及子模块名称

一、修改目录名称 shift F6修改目录,选择“rename module and dictionary”。![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/43efd9c6af6e43ad9656455db94b37a2.png)二、修改子项目pom的 三、修改父项目pom的 四、刷新maven项目

Redis教程——主从复制

在上篇文章我们学习了Redis教程——管道,这篇文章学习Redis教程——主从复制。 主从复制 为了数据更加安全可靠,在实际的项目中,肯定是有多个Redis服务,主机Redis以写为主,从机Redis以读为主,当主机Redis…

JavaScript异步编程——03-Ajax传输json和XML

Ajax 传输 JSON JSON 的语法 JSON(JavaScript Object Notation):是 ECMAScript 的子集。作用是进行数据的交换。语法更为简洁,网络传输、机器解析都更为迅速。 语法规则: 数据在键值对中 数据由逗号分隔 花括号保存对象 方括号保存数组…

Python批量计算多张遥感影像的NDVI

本文介绍基于Python中的gdal模块,批量基于大量多波段遥感影像文件,计算其每1景图像各自的NDVI数值,并将多景结果依次保存为栅格文件的方法。 如下图所示,现在有大量.tif格式的遥感影像文件,其中均含有红光波段与近红外…

NFTScan 与 Scattering 达成合作伙伴,双方将共同解决混合 NFT 数据需求

在区块链领域,NFT 的创新与发展从未停止。近日,NFT 数据基础设施 NFTScan 与一站式混合 NFT 交易市场 Scattering 达成合作伙伴关系,双方将在 NFT 数据层面展开合作,共同解决混合 NFT 的独特数据需求,Scattering 在协议…

聊聊 ASP.NET Core 中间件(三):如何创建自己的中间件?

前言 本质上,中间件类也是一个普通的 .NET 类,它不需要继承任何父类或者实现任何接口。 但是有几个约定: 需要有一个构造方法构造方法至少要有一个 RequestDelegate 类型的参数,用来指向下一个中间件。需要定义一个名字为 Invo…

【超好用的前端表单辅助功能】

前端表单辅助功能 1. 根据模块自动生成目录锚点定位2. 描点定位动态组件3. 隔离组件,组件内部实现校验逻辑,交给提交按钮统一处理4. 选择不同的类型需要重组不同的模块展示,并整合数据传给后端 最近做了一个复杂的表单,涉及到的技…