Golang数据结构性能优化实践

仅仅通过对struct字段重新排序,优化内存对齐方式,就可以获得明显的内存和执行效率提升。原文: How to Speed Up Your Struct in Golang

Mike @Pexels
Mike @Pexels

如果你有Golang开发经验,一定定义过struct类型。

但可能你不知道,通过简单的重新排序struct字段,可以极大提高Go程序的速度和内存使用效率!

是不是难以置信?我们一起来看一下吧!

简单Demo
type BadStruct struct {
 age         uint8
 passportNum uint64
 siblings    uint16
}

type GoodStruct struct {
 age         uint8
 siblings    uint16
 passportNum uint64
}

在上面的代码片段中,我们创建了两个具有相同字段的结构体。然后编写一个简单程序分别输出其内存使用情况。

// Output
Bad struct is 24 bytes long
Good struct is 16 bytes long

如你所见,它们在内存使用方面并不一样。

是什么原因导致两个完全相似的struct消耗的内存不同?

答案在于数据在计算机内存中的排列方式。

简而言之,数据结构对齐。

数据结构对齐
SHVETS production @Pexels
SHVETS production @Pexels

CPU以字(word)为单位读取数据,而不是字节(byte)。

64位系统中,一个word是8个字节,而32位系统中,一个word是4个字节。

简而言之,CPU以其字长的倍数读取内存地址。

alt

想象一下,在64位系统中,为了获取变量passportNum,CPU需要两个周期来访问数据。

第一个周期将获取内存的0到7字节,下一个周期获取其余内存字节。

把它想象成一个笔记本,每页只能存储一个字大小的数据(在本例中为8字节)。如果passportNum分散在两个页,则需要两次读取才能检索到完整的数据。

非常低效。

因此需要数据结构对齐,让计算机将数据存储在等于数据大小倍数的地址上。

4字节数据只能从内存地址0或4开始
4字节数据只能从内存地址0或4开始

例如,2字节数据可以存储在内存0、2或4中,而4字节数据可以存储在内存0、4或8中。

alt

通过简单的对齐数据,计算机确保可以在一个CPU周期内检索到变量passportNum

数据结构填充
Angela Roma @Pexels
Angela Roma @Pexels

填充是实现数据对齐的关键。

计算机通过在数据结构之间填充额外的字节,从而对齐字段。

这就是额外内存的来源!

我们来回顾一下BadStructGoodStruct

alt

GoodStruct消耗更少的内存,仅仅因为与BadStruct相比,其struct字段顺序更合理。

由于填充,两个13字节的数据结构分别变成了16字节和24字节。

因此,可以仅仅通过对struct字段重新排序来节省额外的内存!

这种优化为什么重要?

问题来了,你为什么要关心这个?

两个方面,速度和内存使用。

我们做一个简单的基准测试来证明!

func traverseGoodStruct() uint16 {
 var arbitraryNum uint16
  
 for _, goodStruct := range GoodStructArr {
  arbitraryNum += goodStruct.siblings
 }
  
 return arbitraryNum
}

func traverseBadStruct() uint16 {
 var arbitraryNum uint16
  
 for _, badStruct := range BadStructArr {
  arbitraryNum += badStruct.siblings
 }
  
 return arbitraryNum
}

func BenchmarkTraverseGoodStruct(b *testing.B) {
 for n := 0; n < b.N; n++ {
  traverseGoodStruct()
 }
}

func BenchmarkTraverseBadStruct(b *testing.B) {
 for n := 0; n < b.N; n++ {
  traverseBadStruct()
 }
}

GoodStructBadStruct进行基准测试的方法是循环遍历数组,并将struct字段累加到变量中。

alt

从结果中可以看出,遍历GoodStruct确实比BadStruct花费时间更少。

对struct字段重排序可以优化应用程序的内存使用和速度。

想象一下,维护一个具有大量结构体的大型应用程序,改变将会更为明显。

结语

好了,全文到此为止,我们以一个简单的行动呼吁来结束:

一定要对struct结构字段进行重排序!


你好,我是俞凡,在Motorola做过研发,现在在Mavenir做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。为了方便大家以后能第一时间看到文章,请朋友们关注公众号"DeepNoMind",并设个星标吧,如果能一键三连(转发、点赞、在看),则能给我带来更多的支持和动力,激励我持续写下去,和大家共同成长进步!

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/440328.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电池-电量监测基础知识

一、为何要进行电池电量监测 不知各位有没有想过为何现在手机电池和笔记本电脑电池不容易鼓包了&#xff1f;十年前还经常出现的电池鼓包最近像是消失了一样&#xff0c;其实是因为随着电量监测技术的发展&#xff0c;哪怕是最基本的电子设备也有电池侧和产品侧至少两级电量监测…

Mysql 插入数据

1 为表的所有字段插入数据 使用基本的INSERT语句插入数据要求指定表名称和插入到新记录中的值。基本语法格式为&#xff1a; INSERT INTO table_name (column_list) VALUES (value_list); 使用INSERT插入数据时&#xff0c;允许列名称列表column_list为空&#xff0c;此时&…

基于JavaWeb开发的药房信息管理系统【附源码】

基于JavaWeb开发的药房信息管理系统【附源码】 &#x1f345; 作者主页 央顺技术团队 &#x1f345; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; &#x1f345; 文末获取源码联系方式 &#x1f4dd; &#x1f345; 查看下方微信号获取联系方式 承接各种定制系统 &#…

【Time Series】获取股票数据代码实战

一、简介 "时间序列金融"是一个很有"钱"景的话题&#xff0c;若想开始DeepLearningTimeSeriesStock&#xff0c;首先得拿到数据。本文提供了一种股票数据获取的源代码。 二、代码 1、首先&#xff0c;将要获取数据的股票按照图中xlsx的格式整理&#xff0…

力扣hot100 柱状图中最大的矩形 单调栈

Problem: 84. 柱状图中最大的矩形 文章目录 思路复杂度Code 思路 &#x1f468;‍&#x1f3eb; 参考地址 复杂度 时间复杂度: O ( n ) O(n) O(n) 空间复杂度: O ( n ) O(n) O(n) Code class Solution {public static int largestRectangleArea(int[] height){Stack&l…

Windows Server 2025 来了

微软于2024年1月26日发布了Windows Server 2025的预览版更新&#xff0c;Windows Server 2025是由您的反馈和您希望拥抱混合、自适应云的愿望驱动的。这是2024年度的首个预览版&#xff0c;版本号为Build 26040。 在Windows Server 2025中&#xff0c;微软引入了多项新安全机制…

旧物回收小程序开发:创新与可持续发展的交汇点

随着社会的发展和人们生活水平的提高&#xff0c;物品的更新换代速度越来越快&#xff0c;这导致了大量的旧物被闲置或丢弃。为了解决这个问题&#xff0c;旧物回收成为了重要的环保行动。而随着移动互联网的普及&#xff0c;旧物回收小程序的开发也成为了新的趋势。本文将探讨…

Redis(九)集群(cluster)

文章目录 概述作用1. redis集群的槽位slot2. redis集群的分片3. 第1,2点的优势&#xff1a;**最大优势&#xff0c;方便扩缩容和数据分派查找**4. slot槽位映射&#xff0c;一般业界有3种解决方案第一种&#xff1a;哈希取余分区第二种&#xff1a;一致性哈希算法分区第三种&am…

【Spring源码分析】循环依赖的底层源码剖析

循环依赖的底层源码剖析 一、预知知识二、循环依赖的底层源码剖析1. Spring 是如何存储半成品Bean的&#xff1f;getEarlyBeanReference 方法的源码分析 2. Spring 是如何解决的循环依赖呢&#xff1f;测试 3. 哪些循环依赖 Spring 是无法解决的呢&#xff1f;Async 引起的循环…

华为配置小型网络WLAN 的基本业务示例

配置小型网络WLAN基本业务示例 组网图形 图1 配置小型网络WLAN基本业务组网图 小型WLAN网络简介配置注意事项组网需求数据规划配置思路操作步骤配置文件 小型WLAN网络简介 本文介绍的WLAN网络是指利用频率为2.4GHz或5GHz的射频信号作为传输介质的无线局域网&#xff0c;相对于有…

Leetcode—1828. 统计一个圆中点的数目【中等】

2024每日刷题&#xff08;一零五&#xff09; Leetcode—1828. 统计一个圆中点的数目 实现代码 class Solution { public:vector<int> countPoints(vector<vector<int>>& points, vector<vector<int>>& queries) {vector<int> a…

LINUX基础培训十九之常见服务dns介绍

前言、本章学习目标 了解dns服务用途掌握dns服务器的配置掌握dns服务的使用 一、DNS服务概述 DNS是域名系统(Domain Name System)的缩写&#xff0c;是因特网的一项核心服务&#xff0c;它作为可以将域名和IP地址相互映射的个分布式数据库&#xff0c;能够使人更方便的访问…