Go 官方标准编译器中所做的优化

本文是对#102 Go 官方标准编译器中实现的优化集锦汇总[1] 内容的记录与总结.


alt

优化1-4: 字符串和字节切片之间的转化


alt

1.紧跟range关键字的 从字符串到字节切片的转换;


package main

import (
 "fmt"
 "strings"
 "testing"
)

var cs10086 = strings.Repeat("shuang!"10086)

func main() {
 fmt.Println(testing.AllocsPerRun(1, f)) //0
 fmt.Println(testing.AllocsPerRun(1, g)) //1

}

func f() {
 for range []byte(cs10086) {

 }
}

func g() {
 bs := []byte(cs10086)
 for range bs {

 }
}


f没有开辟内存,g开辟了一次内存.

alt

2.映射元素读取索引语法中被用做键值的 从字节切片到字符串的转换;


package main

import (
 "bytes"
 "fmt"
 "testing"
)

var name = bytes.Repeat([]byte{'x'}, 188)

var m = make(map[string]string10)
var s = ""

func main() {

 fmt.Println(testing.AllocsPerRun(1, f2)) //0
 fmt.Println(testing.AllocsPerRun(1, g2)) //1
 fmt.Println(testing.AllocsPerRun(1, h2)) //1
}

func f2() {
 s = m[string(name)] // 有效
}

func g2() {
 key := string(name)
 s = m[key] // 无效
}

func h2() {
 m[string(name)] = "Golang" // 无效
}

alt

3.字符串比较表达式中被用做比较值的 从字节切片到字符串的转换


package main

import (
 "fmt"
 "testing"
)

var x = []byte{1023'x'}
var y = []byte{1023'y'}

var b bool

func main() {
 fmt.Println(testing.AllocsPerRun(1, f3)) //0
 fmt.Println(testing.AllocsPerRun(1, g3)) //2

}

func f3() {
 b = string(x) != string(y)
}

func g3() {
 sx, sy := string(x), string(y)
 b = sx == sy
}

alt

4.含 非空字符串常量 的字符串衔接表达式中的 从字节切片到字符串的转换


package main

import (
 "fmt"
 "testing"
)

var p = []byte{1023'p'}

var q = []byte{1023'q'}

var str string

func main() {

 fmt.Println(testing.AllocsPerRun(1, f4)) //1
 fmt.Println(testing.AllocsPerRun(1, g4)) //3
}

func f4() {
 str = ("-" + string(p) + string(q))[1:]
}

func g4() {
 str = string(p) + string(q)
}

alt



5.[]rune(aString)转换的时间和空间复杂度都是O(n),但len([]rune(aString))中的此转换 不需要开辟内存


Go 1.12引入

package main

import (
 "fmt"
 "strings"
 "testing"
)

var shuang = strings.Repeat("shuang!"10086)

func main() {

 fmt.Println(testing.AllocsPerRun(1, f5)) //0
 fmt.Println(testing.AllocsPerRun(1, g5)) //1
}

func f5() {
 _ = len([]rune(shuang))
}

func g5() {
 _ = len([]byte(shuang)) //未对len([]byte(aString))做优化
}

alt



6.字符串衔接表达式只需开辟一次内存,无论需要衔接多少个字符串


package main

import (
 "fmt"
 "testing"
)

var h, i, j, k = "Hello""World""Let's""Go"

var str6 string

func main() {
 fmt.Println(testing.AllocsPerRun(1, f6)) //1
 fmt.Println(testing.AllocsPerRun(1, g6)) //3

}

func f6() {
 str6 = h + i + j + k
}

func g6() {
 str6 = h + i
 str6 += j
 str6 += k
}
alt



7.for i := range anArrayOrSlice{anArrayOrSlice[i]} = zeroElement} 形式 将被优化为一个内部的memclr操作


package main

const N = 1024 * 100

var arr [N]int

func clearArray() {
 for i := range arr {
  arr[i] = 0
 }
}

func clearSlice() {
 sli := arr[:]
 for i := range sli {
  sli[i] = 0
 }
}

func clearArrayPtr() {
 for i := range &arr {
  arr[i] = 0
 }
}
alt

benchmark:

package main

import (
 "testing"
)

func BenchmarkTest1(b *testing.B) {
 for i := 0; i < b.N; i++ {
  clearArray()
 }
}

func BenchmarkTest2(b *testing.B) {
 for i := 0; i < b.N; i++ {
  clearSlice()
 }
}

func BenchmarkTest3(b *testing.B) { //无效
 for i := 0; i < b.N; i++ {
  clearArrayPtr()
 }
}

执行结果:

goos: darwin
goarch: amd64
pkg: xxxx
cpu: Intel(R) Core(TM) i7-8557U CPU @ 1.70GHz
BenchmarkTest1-8           73000             15309 ns/op
BenchmarkTest2-8           76464             15167 ns/op
BenchmarkTest3-8           40194             30096 ns/op
PASS
ok      xxxx    4.213s



8.for k = range m {delete(m,k)}形式 将被优化为一个内部的map清空操作


alt



9.尺寸不大于4个原生字(即int),并且字段数不超过4个的结构体值被视为是小尺寸值


package main

type S1 struct {
 a int
}

type S2 struct {
 a, b int
}

type S3 struct {
 a, b, c int
}

type S4 struct {
 a, b, c, d int
}

type S5 struct {
 a, b, c, d, e int
}

type S6 struct {
 a, b, c, d, e, f int
}

var ss1, ss2, ss3, ss4, ss5, ss6 = make([]S1, 1000), make([]S2, 1000), make([]S3, 1000), make([]S4, 1000), make([]S5, 1000), make([]S6, 1000)

var x1, x2, x3, x4, x5, x6 int


benchmark:

package main

import "testing"

func Benchmark_Range1(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss1 {
   x1 = v.a
  }
 }
}

func Benchmark_Range2(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss2 {
   x2 = v.a
  }
 }
}

func Benchmark_Range3(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss3 {
   x3 = v.a
  }
 }
}

func Benchmark_Range4(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss4 {
   x4 = v.a
  }
 }
}

func Benchmark_Range5(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss5 {
   x5 = v.a
  }
 }
}

func Benchmark_Range6(b *testing.B) {
 for i := 0; i < b.N; i++ {
  for _, v := range ss6 {
   x6 = v.a
  }
 }
}

执行结果:

goos: darwin
goarch: amd64
pkg: xxxx
cpu: Intel(R) Core(TM) i7-8557U CPU @ 1.70GHz
Benchmark_Range1-8       4759434               248.4 ns/op
Benchmark_Range2-8       3910621               306.0 ns/op
Benchmark_Range3-8       3735921               328.9 ns/op
Benchmark_Range4-8       3677784               325.9 ns/op
Benchmark_Range5-8        814666              1517 ns/op
Benchmark_Range6-8        728656              1568 ns/op
PASS
ok      xxxx     8.868s
alt

因为很多一等公民,其底层结构体的元素,都没有超过4个




10.接口值包裹 指针值 比 包裹 其他类型的值 要快


package main

var p, p2 = new([100]int), new([100]int)

var ip interface{}

package main

import "testing"



func Benchmark_PointerAssign(b *testing.B) {
 for i := 0; i < b.N; i++ {
  p = p2
 }
}

func Benchmark_BoxPointer(b *testing.B) {
 for i := 0; i < b.N; i++ {
  ip = p
 }
}

func Benchmark_PointerAssert(b *testing.B) {
 for i := 0; i < b.N; i++ {
  p = ip.(*[100]int)
 }
}


goos: darwin
goarch: amd64
pkg: xxxx
cpu: Intel(R) Core(TM) i7-8557U CPU @ 1.70GHz
Benchmark_PointerAssign-8       1000000000               0.5251 ns/op          0 B/op          0 allocs/op
Benchmark_BoxPointer-8          1000000000               0.5833 ns/op          0 B/op          0 allocs/op
Benchmark_PointerAssert-8       1000000000               0.6418 ns/op          0 B/op          0 allocs/op
PASS
ok      xxxx   2.372s

alt
alt



11.接口值包裹 指针值 比 包裹 其他类型的值 要快


Go 1.15新增优化

package main

var x,y = 255,256

var ix,iy interface{}

package main

import "testing"

func Benchmark_x(b *testing.B) {

 for i := 0; i < b.N; i++ {
  ix = x
 }
}

func Benchmark_y(b *testing.B) {

 for i := 0; i < b.N; i++ {
  iy = y
 }
}


goos: darwin
goarch: amd64
pkg: xxxx
cpu: Intel(R) Core(TM) i7-8557U CPU @ 1.70GHz
Benchmark_x-8           565624285                2.033 ns/op           0 B/op          0 allocs/op
Benchmark_y-8           92127024                12.71 ns/op            8 B/op          1 allocs/op
PASS
ok      xxxx     2.653s
alt



12.Bounds Check Elimination


alt
alt
alt
alt
alt
alt

参考资料

[1]

#102 Go 官方标准编译器中实现的优化集锦汇总: https://www.bilibili.com/video/BV1YZ4y1K7w2

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/95223.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【强化学习】贝尔曼公式 - bellman equation

return作用 还是用这个迷宫游戏说。 首先明确&#xff0c;不撞墙到终点比撞墙到终点好。路径越短到终点越好。 不撞墙到终点比撞墙到终点好。你可以把撞墙这个reward设置成负数&#xff0c;不撞墙设置成0。那么在最终return进行累加的时候&#xff0c;不撞墙的return就会大。路…

【方案】基于视频与AI智能分析技术的城市轨道交通视频监控建设方案

一、背景分析 地铁作为重要的公共场所交通枢纽&#xff0c;流动性非常高、人员大量聚集&#xff0c;轨道交通需要利用视频监控系统来实现全程、全方位的安全防范&#xff0c;这也是保证地铁行车组织和安全的重要手段。调度员和车站值班员通过系统监管列车运行、客流情况、变电…

使用PAM保障开发运营安全

硬编码凭据和 DevOps 系统中缺乏凭据安全性是组织的巨大漏洞。以明文形式访问凭据的恶意内部人员可以在 IT 中建立和扩展其立足点 基础设施&#xff0c;构成巨大的数据被盗风险。 什么是PAM 特权访问管理 &#xff08;PAM&#xff09; 是指一组 IT 安全管理原则&#xff0c;可…

Redis之管道解读

目录 基本介绍 使用例子 管道对比 管道与原生批量命令对比 管道与事务对比 使用pipeline注意事项 基准测试 基本介绍 Redis是一种基于客户端-服务端模型以及请求/响应协议的TCP服务器。 这意味着请求通常按如下步骤处理&#xff1a; 客户端发送一个请求到服务器&am…

Go实现LogCollect:海量日志收集系统【下篇——开发LogTransfer】

Go实现LogAgent&#xff1a;海量日志收集系统【下篇】 0 前置文章 Go实现LogAgent&#xff1a;海量日志收集系统【上篇——LogAgent实现】 前面的章节我们已经完成了日志收集&#xff08;LogAgent&#xff09;&#xff0c;接下来我们需要将日志写入到kafka中&#xff0c;然后…

【C++入门】命名空间、缺省参数、函数重载、引用、内联函数

​&#x1f47b;内容专栏&#xff1a; C/C编程 &#x1f428;本文概括&#xff1a; C入门学习必备语法 &#x1f43c;本文作者&#xff1a; 阿四啊 &#x1f438;发布时间&#xff1a;2023.9.3 前言 C是在C的基础之上&#xff0c;容纳进去了面向对象编程思想&#xff0c;并增加…

【C++技能树】继承概念与解析

Halo&#xff0c;这里是Ppeua。平时主要更新C&#xff0c;数据结构算法&#xff0c;Linux与ROS…感兴趣就关注我bua&#xff01; 继承 0. 继承概念0.1 继承访问限定符 1. 基类和派生类对象赋值兼容转换2. 继承中的作用域3. 派生类中的默认成员函数4.友元5.继承中的静态成员6.菱…

如何使用Puppeteer进行新闻网站数据抓取和聚合

导语 Puppeteer是一个基于Node.js的库&#xff0c;它提供了一个高级的API来控制Chrome或Chromium浏览器。通过Puppeteer&#xff0c;我们可以实现各种自动化任务&#xff0c;如网页截图、PDF生成、表单填写、网络监控等。本文将介绍如何使用Puppeteer进行新闻网站数据抓取和聚…

Linux挖矿程序清除

1. 找到挖矿进程 2.找到病毒的文件地址 ls -l /proc/进程ID/exe3.删除文件命令 rm -rf 文件地址4.杀死挖矿进程 kill -9 进程ID

Python入门学习——Day2-控制流程

一、Python 控制流程 什么是控制流程&#xff1a; 在Python中&#xff0c;控制流程指的是根据不同的条件或规则来控制程序的执行顺序和逻辑。Python提供了多种控制流程的语句和结构&#xff0c;可以根据条件进行分支判断和循环迭代。 1.1 条件语句&#xff08;if-elif-else&…

Kafka知识点总结

常见名词 生产者和消费者 同一个消费组下的消费者订阅同一个topic时&#xff0c;只能有一个消费者收到消息 要想让订阅同一个topic的消费者都能收到信息&#xff0c;需将它们放到不同的组中 分区机制 启动方法 生成者和消费者监听客户端

Docker consul 容器服务自动发现和更新

目录 一、什么是服务注册与发现 二、Docker-consul集群 1.Docker-consul consul提供的一些关键特性 2.registrator 3.Consul-template 三、Docker-consul实现过程 以配置nginx负载均衡为例 先配置consul-agent &#xff0c;有两种模式server和client 四、Docker-cons…