go语言中slice,map,channl底层原理
作者: 树獭叔叔
0. 前序
slice,map,channl是我们Go语言中最最常用的几个数据结构,对于这些做到知根知底,对于我们建立知识体系以及优化代码都有着很重要的意义,所以本文,我们深入这三个数据结构的底层,剖析其设计思想。
1. slice
1.1 slice的创建
slice的创建主要有两种方式,第一种方式是直接创建
var sli []int sli = make([]int, len, cap) // cap可以省略 //或者 sli := make([]int, len, cap) // cap可以省略
另一种方式是借助array创建:
arr := []int{1,2,3,4,5} sli := arr[sta:end:cap] // :cap可以省略,以这种方式创建的sli,其cap为sta到arr的最后一位
1.2 数据结构
slice底层数据结构如下:
type { array unsafe.Pointer // 指针 len int // 现有长度 cap int // 容量 }
在Go语言中,所有的参数传递都是值传递,slice也是如此,不过由于其底层的指针,在其传递到另一个函数后,仍能对其地址对应位置的值做修改,然而,当发生扩容操作时,由于会重新分配地址,就会导致问题的发生,下面我们就来介绍slice的扩容机制。
1.3 扩容机制
在进行append()并且cap不够用的时候,会触发扩容操作(copy()操作不会触发扩容)。
容量的确定:
- 如果期望容量大于当前容量的两倍就会使用期望容量;
- 如果当前切片的长度小于 1024 就会将容量翻倍;
- 如果当前切片的长度大于 1024 就会每次增加 25% 的容量,直到新容量大于期望容量;
上面所说的是一个容量的初步确定步骤,当数据类型size为1字节,8字节,或者2的倍数时,会根据内存大小进行向上取整,进行内存对齐,之后返回新的扩容大小。
内存对齐的一个重要原因是因为Go进行内存分配时是类似于伙伴系统的固定的内存块,对齐这个内存可以最大化的人利用分配到的空间。
2. map
2.1 map创建
m = make(map[int]int) // 需要注意 make(map)返回的是一个指针
2.2 数据结构
type hmap { count int flags uint8 // map当前是否处于写入状态等 B uint8 // 2的B次幂表示当前map中桶的数量(buckets的长度) noverlow uint16 // map中溢出桶的数量,当溢出桶太多时,map会进行等量扩容 hash0 uint32 //生成hash的随机数种子 buckets unsafe.Pointer //当前map对应的桶的指针 oldbuckets unsafe.Pointer // 扩容时的旧桶 nevacuate uintptr //扩容时,用于标记当前旧桶中小于nevacute的数据都已经转移到了新桶 extra *mapextra //存储map的溢出桶 }
Go中的map的数据都是存在bmap的数据结构中的,最多放8个kv对,溢出桶的设计与GC有关系,如果map为内联数据类型时,map数据结构里的指针就只有溢出桶了,这个时候就可以避免遍历map。
2.3 扩容机制
当我们插入一个k-v对时,需要确定他应该插入到bucket数组的哪一个槽中。bucket数组的长度为2^B,即2的次幂数,而2^B-1转换成二进制后一定是低位全1,高位全0的形式,因此在进行按位与操作后,一定能求得一个在[0,2^B-1]区间上的任意一个数,也就是数组中的下标位置,相较之下,能获得比取模更加优秀的执行效率。
涉及到扩容,每一次bucket数组都会变为现在的两倍,方便我们进行hash迁移。
map触发扩容的条件有两种:
- 负载因子大于6.5时(负载因子 = 键数量 / bucket数量)
- overflow的数量达到2^min(15,B)
等量扩容 所谓等量扩容,并不是扩大容量,而是bucket数量不变,重新做一遍类似增量扩容的搬迁动作,把松散的键值对重新排列一次,以使bucket的使用率更高,从而保证更快的存取速度。
3. channl
3.1 数据结构
type hchan struct { qcount uint // total data in the queue dataqsiz uint // size of the circular queue buf unsafe.Pointer // points to an array of dataqsiz elements elemsize uint16 closed uint32 elemtype *_type // element type sendx uint // send index recvx uint // receive index recvq waitq // list of recv waiters sendq waitq // list of send waiters // lock protects all fields in hchan, as well as several // fields in sudogs blocked on this channel. // // Do not change another G's status while holding this lock // (in particular, do not ready a G), as this can deadlock // with stack shrinking. lock mutex }
3.2 过程详解
channl的入队与出队操作都是都是加锁的,以此来保证并发安全。当队列满了再插入数据时,插入线程g会进入wait状态并且挂在sendq队列上,等取出元素时会将其唤醒,空队取元素同理。
到此这篇关于go语言中slice,map,channl底层原理的文章就介绍到这了,更多相关go slice,map,channl 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!