go语言map底层实现 - Go语言中文社区

社区微信群开通啦，扫一扫抢先加入社区官方微信群

社区微信群

go语言map底层实现 - Go语言中文社区

文章 (current)
Go面试题热
Go导航
Go教程
官方文档

登录
注册

go语言map底层实现

go

go语言map底层实现

笼统的来说，go的map底层是一个hash表（HashMap），表面上看map只有键值对结构，实际上在存储键值对的过程中涉及到了数组和链表。HashMap之所以高效，是因为其结合了顺序存储(数组)和链式存储(链表)两种存储结构。数组是HashMap的主干，在数组下有一个类型为链表的元素。

哈希函数会将传入的key值进行哈希运算，得到一个唯一的值。go语言把生成的哈希值一分为二，比如一个key经过哈希函数，生成的哈希值为：8423452987653321，go语言会这它拆分为84234529，和87653321。那么，前半部分就叫做高位哈希值，后半部分就叫做低位哈希值。

高位哈希值：是用来确定当前的bucket（桶）有没有所存储的数据的。

低位哈希值：是用来确定，当前的数据存在了哪个bucket（桶）

hmap(a header of map)

hmap是map的最外层的一个数据结构，包括了map的各种基础信息、如大小、bucket。首先说一下，buckets这个参数，它存储的是指向buckets数组的一个指针，当bucket(桶为0时)为nil。我们可以理解为，hmap指向了一个空bucket数组，并且当bucket数组需要扩容时，它会开辟一倍的内存空间，并且会渐进式的把原数组拷贝，即用到旧数组的时候就拷贝到新数组。

bmap(a bucket of map)

bucket（桶），每一个bucket最多放8个key和value，最后由一个overflow字段指向下一个bmap，注意key、value、overflow字段都不显示定义，而是通过maptype计算偏移获取的。

bucket这三部分内容决定了它是怎么工作的：

它的tophash 存储的是哈希函数算出的哈希值的高八位（8个）。是用来加快索引的。因为把高八位存储起来，这样不用完整比较key就能过滤掉不符合的key，加快查询速度当一个哈希值的高8位和存储的高8位相符合，再去比较完整的key值，进而取出value。当超过8个元素需要存入某个bucket时，hmap会拓展该bucket。
第二部分，存储的是key 和value，就是我们传入的key和value，注意，它的底层排列方式是，key全部放在一起，value全部放在一起。当key大于128字节时，bucket的key字段存储的会是指针，指向key的实际内容；value也是一样。这样排列好处是在key和value的长度不同的时候，可以消除padding带来的空间浪费。并且每个bucket最多存放8个键值对。
第三部分，存储的是当bucket溢出时，指向的下一个bucket的指针

hmap和bmap结构图

如图所示：

hmap存储了一个指向底层bucket数组的指针。
我们存入的key和value是存储在bucket里面中，如果key和value大于128字节，那么bucket里面存储的是指向我们key和value的指针，如果不是则存储的是值。
每个bucket 存储8个key和value，如果超过就重新创建一个bucket挂在在元bucket上，持续挂接形成链表。
高位哈希值：是用来确定当前的bucket（桶）有没有所存储的数据的。
低位哈希值：是用来确定，当前的数据存在了哪个bucket（桶）

简单结构为图：

工作流程：

查找或者操作map时，首先key经过hash函数生成hash值，通过哈希值的低8位来判断当前数据属于哪个桶(bucket)，找到bucket以后，通过哈希值的高八位与bucket存储的高位哈希值循环比对，如果相同就比较刚才找到的底层数组的key值，如果key相同，取出value。如果高八位hash值在此bucket没有，或者有，但是key不相同，就去链表中下一个溢出bucket中查找，直到查找到链表的末尾。

碰撞冲突：如果不同的key定位到了统一bucket或者生成了同一hash,就产生冲突。 go是通过链表法来解决冲突的。比如一个高八位的hash值和已经存入的hash值相同，并且此bucket存的8个键值对已经满了，或者后面已经挂了好几个bucket了。那么这时候要存这个值就先比对key,key肯定不相同啊，那就从此位置一直沿着链表往后找，找到一个空位置，存入它。所以这种情况，两个相同的hash值高8位是存在不同bucket中的。

查的时候也是比对hash值和key 沿着链表把它查出来。还有一种情况，就是目前就 1个bucket，并且8个key-value的数组还没有存满，这个时候再比较完key不相同的时候，同样是沿着当前bucket数组中的内存空间往后找，找到第一个空位，插入它。这个就相当于是用寻址法来解决冲突，查找的时候，也是先比较hash值，再比较key,然后沿着当前内存地址往后找。

go语言的map通过数组+链表的方式实现了hash表，同时分散各个桶，使用链表法+bucket内部的寻址法解决了碰撞冲突，也提高了效率。因为即使链表很长了，go会根据装载因子，去扩容整个bucket数组，所以下面就要看下扩容。

map的扩容

当链表越来越长，bucket的扩容次数达到一定值，其实是bmap扩容的加载因数达到6.5（元素个数/bucket），bmap就会进行扩容，将原来bucket数组数量扩充一倍，产生一个新的bucket数组，也就是bmap的buckets属性指向的数组。这样bmap中的oldbuckets属性指向的就是旧bucket数组。
加载因数6.5，这个是经过测试才得出的合理的一个阈值。因为，加载因子越小，空间利用率就小，加载因子越大，产生冲突的几率就大。所以6.5是一个平衡的值。
map的扩容不会立马全部复制，而是渐进式扩容，即首先开辟2倍的内存空间，创建一个新的bucket数组。只有当访问原来就的bucket数组时，才会将就得bucket拷贝到新的bucket数组，进行渐进式的扩容。当然旧的数据不会删除，而是去掉引用，等待gc回收。

版权声明：本文来源CSDN，感谢博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。
原文链接：https://blog.csdn.net/hbshhb/article/details/96472491
站方申明：本站部分内容来自社区用户分享，若涉及侵权，请联系站方删除。

发表于 2020-02-29 20:42:01

分类：Go

你可能感兴趣的文章

go语言中使用new和make创建map时的差异 933 浏览
go语言的map以及红黑树的map 1590 浏览
golang map slice 1324 浏览
Golang map源码详解 1078 浏览
golang中数组、字符串和切片-字符串 1117 浏览
Go的数组切片 & Python的列表 1611 浏览
go 数组和切片的区别 915 浏览
【GO】json转map、切片、结构体 898 浏览
PHP 与 GO - 字典里包含数组，数组里包含字典 1347 浏览

精选的优质文章

也许 Go 开发可以更简单！ 10581 浏览
如何使用 Golang 日志监控你的应用程序？ 12055 浏览
从Go语言实现模板设计模式浅谈Go的抽象能力 14105 浏览
阿里云基于 Go 的微服务架构分享 23969 浏览
java是否会被取代？Go会否给Java带来冲击？ 28493 浏览
千万级规模高性能、高并发的网络架构经验分享 30049 浏览
阿里部分面试题汇总,对想进阿里的同学非常实用 62345 浏览
实用好文：知乎实时数仓架构实践及演进 31366 浏览
支撑马蜂窝「双11」营销大战背后的技术架构 228308 浏览
想进大厂？50个多线程面试题，你会多少？（一） 23105 浏览

0 条评论

请先登录后评论

官方社群

关注公众号
—— 加入社区微信群 ——
→「Go语言教程」领取

GO教程

1.1 Go语言简介
1.2 Go语言的特性
1.3 Go语言为并发而生
1.4 哪些项目使用Go语言开发？
1.5 哪些大公司正在使用Go语言
1.6 Go语言的性能如何？
1.7 Go语言标准库强大
1.8 Go语言上手简单
1.9 Go语言代码风格清晰、简单
1.10 Go语言工程结构详述
1.11 第一个Go语言程序
1.12 Go语言历史版本

2.1 Go语言变量的声明
2.2 Go语言变量的初始化
2.3 Go语言多个变量同时赋值
2.4 Go语言匿名变量
2.5 Go语言变量的作用域
2.6 Go语言整型（整数类型）
2.7 Go语言浮点类型（小数类型）
2.8 Go语言复数
2.9 Go语言bool类型（布尔类型）
2.10 Go语言字符串
2.11 Go语言字符类型（byte和rune）
2.12 Go语言数据类型转换
2.13 Go语言指针
2.14 Go语言变量的生命周期
2.15 Go语言常量
2.16 Go语言类型别名
2.17 Go语言关键字与标识符
2.18 Go语言运算符的优先级

3.1 Go语言数组
3.2 Go语言多维数组
3.3 Go语言切片
3.4 使用append()为切片添加元素
3.5 Go语言切片复制
3.6 Go语言从切片中删除元素
3.7 Go语言range关键字
3.8 Go语言多维切片
3.9 Go语言map（映射）
3.10 Go语言遍历map
3.11 map元素的删除和清空
3.12 Go语言sync.Map
3.13 Go语言list（列表）
3.14 Go语言nil：空值/零值

4.1 Go语言分支结构
4.2 Go语言循环结构
4.4 Go语言键值循环
4.5 Go语言switch语句
4.6 Go语言goto语句
4.7 Go语言break（跳出循环）
4.8 Go语言continue

5.1 Go语言函数声明
5.2 Go语言函数变量
5.3 Go语言匿名函数
5.4 Go语言函数类型实现接口
5.5 Go语言闭包（Closure）
5.6 Go语言可变参数
5.7 Go语言defer（延迟执行语句）
5.8 Go语言递归函数
5.9 Go语言处理运行时错误
5.10 Go语言宕机（panic）
5.11 Go语言宕机恢复（recover）
5.12 Go语言计算函数执行时间
5.13 Go语言Test功能测试函数

6.1 Go语言结构体定义
6.2 Go语言实例化结构体
6.3 初始化结构体的成员变量
6.4 Go语言构造函数
6.5 类型内嵌和结构体内嵌
6.6 初始化内嵌结构体
6.7 内嵌结构体成员名字冲突
6.8 Go语言垃圾回收和SetFinalizer
6.9 Go语言链表操作
6.10 Go语言数据I/O对象及操作

7.1 Go语言接口声明（定义）
7.2 Go语言实现接口的条件
7.3 Go语言类型与接口的关系
7.4 Go语言类型断言
7.5 Go语言排序
7.6 Go语言接口的嵌套组合
7.9 Go语言接口和类型之间的转换
7.10 Go语言空接口类型
7.11 Go语言类型分支
7.12 Go语言error接口

8.1 包的基本概念
8.2 Go语言封装简介及实现细节
8.3 Go语言GOPATH
8.4 Go语言常用内置包
8.5 Go语言自定义包
8.6 Go语言package
8.7 Go语言导出包中的标识符
8.8 Go语言import导入包
8.9 Go语言sync包与锁
8.10 Go语言big包
8.11 Go语言正则表达式：regexp包
8.12 Go语言time包：时间和日期
8.13 Go语言os包用法简述
8.14 Go语言flag包：命令行参数解析
8.15 Go语言go mod包依赖管理工具
8.16 Go语言runtime包:运行时

9.1 Go语言并发简述
9.2 Go语言轻量级线程
9.3 Go语言并发通信
9.4 Go语言竞争状态
9.5 Go语言调整并发的运行性能
9.6 并发和并行的区别
9.7 goroutine和coroutine的区别
9.8 Go语言通道（chan）
9.9 示例：并发打印
9.10 Go语言单向通道
9.11 Go语言无缓冲的通道
9.12 Go语言带缓冲的通道
9.13 Go语言channel超时机制
9.14 Go语言多核并行化
9.15 互斥锁和读写互斥锁
9.16 Go语言等待组
9.17 死锁、活锁和饥饿概述
9.18 Go语言CSP：通信顺序进程简述
9.19 示例：聊天服务器

10.1 Go语言反射（reflection）
10.2 Go语言反射规则浅析
10.3 通过反射获取类型信息
10.4 通过反射获取指针指向的元素类型
10.5 通过反射获取结构体的成员类型
10.6 Go语言结构体标签
10.7 通过反射获取值信息
10.8 通过反射访问结构体成员的值
10.9 判断反射值的空和有效性
10.10 通过反射修改变量的值
10.11 通过类型信息创建实例
10.12 通过反射调用函数
10.13 Go语言inject库：依赖注入

11.1 Go语言自定义数据文件
11.2 Go语言JSON文件的读写操作
11.3 Go语言XML文件的读写操作
11.4 Go语言使用Gob传输数据
11.5 Go语言纯文本文件的读写操作
11.6 Go语言二进制文件的读写操作
11.7 Go语言自定义二进制文件的读写操作
11.8 Go语言zip归档文件的读写操作
11.9 Go语言tar归档文件的读写操作
11.10 Go语言使用buffer读取文件
11.11 Go语言文件的写入、追加、读取、复制操作
11.12 Go语言文件锁操作

12.1 go build命令
12.2 go clean命令
12.3 go run命令
12.4 go fmt命令
12.5 go install命令
12.6 go get命令
12.7 go generate命令
12.8 go test命令
12.9 go pprof命令

13.1 Go语言的深拷贝和浅拷贝
13.2 Go语言引用传递和值传递
13.3 Go语言的Socket编程

14.1 Golang Map底层实现
14.2 go语言触发异常的场景有哪些
14.3 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.4 详细说说new和make的区别
14.5 详细说说切片和数组的区别
14.6 Golang的内存模型，为什么小对象多了会造成gc压力
14.7 Data Race问题怎么解决？能不能不加锁解决这个问题
14.8 在 range 迭代 slice 时，你怎么修改值的
14.9 select可以用于什么
14.10 go语言编程的好处是什么
14.11 你是否主动关闭过http连接，为啥要这样做
14.12 recover的执行时机
14.13 说出一个避免Goroutine泄露的措施
14.14 如何跳出for select 循环
14.15 如何初始化带嵌套结构的结构体
14.16 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.17 go语言中的引用类型包含哪些
14.18 说说go语言的select机制

推荐文章

为什么要使用Go语言？Go语言的优势在哪里？
GO_strings.Reader
golang byte和rune的区别或者是string知识
清华尹成带你实战GO案例（15)Go String与Byte切片之间的转换
【转】go里面字符串转成字节slice, 字节slice转成字符串
最长回文子串（Go，LeetCode）
go ReadString() 函数分析
Go中bufio.ReadString和bufio.Read返回EOF区别
Go 垃圾回收
Golang跟踪剖析trace的使用

猜你喜欢

随便看看

Go开发工程师：迎接上升风口，踏入蓝海行业！【完结】
成都web前端前景怎么样？
利用Python爬取全国250m精度的人口数据、房价数据等数据 | CSDN博文精选
GitHub上的项目体验第二期——mall-admin-web
前端基础：技术栈简介
vue+Cesium学习笔记——wsdchong
前端可视化echarts使用理解——wsdchong
想成为前端大神秒杀群雄？收下这份2020年最新前端学习路线！
你要是还学不会，请提刀来见 Typora+PicGo+Gitee + node.js 打造个人高效稳定优雅图床
Typora+PicGo-Core+Github+jsDelivr 搭建图床(2021.1.31)

Go语言中文社区 | 联系我们 | 官方标准库 | 京ICP备18055895号-2

欢迎关注Go语言社区官方微信公众号，商务合作联系QQ：124096702

Powered By Release 20180601 ©2009-2022 coder55.com

发送私信

发给:

内容:

如果觉得我的文章对您有用，请随意打赏。你的支持将鼓励我继续创作！