分布式集群下如何做到唯一序列号？

0 条评论
分类：面试题

默认排序时间排序

1个回答

匿名 2020-03-05

分布式集群下的唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。

常见的ID生成策略方案大致如下：

1. 数据库自增长序列或字段
最常见的方式。利用数据库，全数据库唯一。

优点：
1）简单，代码方便，性能可以接受。
2）数字ID天然排序，对分页或者需要排序的结果很有帮助。

缺点：
1）在单个数据库或读写分离或一主多从的情况下，只有一个主库可以生成。有单点故障的风险。
2）在性能达不到要求的情况下，比较难于扩展。

2. Redis生成ID
当使用数据库来生成ID性能不够要求的时候，我们可以尝试使用Redis来生成ID。这主要依赖于Redis是单线程的，所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY来实现。

优点：
1）不依赖于数据库，灵活方便，且性能优于数据库。
2）数字ID天然排序，对分页或者需要排序的结果很有帮助。

缺点：
1）如果系统中没有Redis，还需要引入新的组件，增加系统复杂度。

3. UUID
常见的方式。可以利用数据库也可以利用程序生成，一般来说全球唯一。

优点：
1）简单，代码方便。
2）生成ID性能非常好，基本不会有性能问题。
3）全球唯一，在遇见数据迁移，系统数据合并，或者数据库变更等情况下，可以从容应对。

缺点：
1）没有排序，无法保证趋势递增。
2）UUID往往是使用字符串存储，查询的效率比较低。
3）存储空间比较大，如果是海量数据库，就需要考虑存储量的问题。
4）传输数据量大。
5）不可读。

4. UUID的变种
1）为了解决UUID不可读，可以使用UUID to Int64的方法。
2）为了解决UUID无序的问题，NHibernate在其主键生成方式中提供了Comb算法。保留GUID的10个字节，用另6个字节表示GUID生成的时间（DateTime）。

5. Twitter的snowflake算法
snowflake是Twitter开源的分布式ID生成算法，结果是一个long型的ID。
其核心思想是：
使用41bit作为毫秒数，10bit作为机器的ID（5个bit是数据中心，5个bit的机器ID），12bit作为毫秒内的流水号（意味着每个节点在每毫秒可以产生 4096 个 ID），最后还有一个符号位，永远是0。

6. 利用zookeeper生成唯一ID
zookeeper主要通过其znode数据版本来生成序列号，可以生成32位和64位的数据版本号，客户端可以使用这个版本号来作为唯一的序列号。
很少会使用zookeeper来生成唯一ID。主要是由于需要依赖zookeeper，并且是多步调用API，如果在竞争较大的情况下，需要考虑使用分布式锁。
因此，性能在高并发的分布式环境下，不推荐使用。

7. MongoDB的ObjectId
MongoDB的ObjectId和snowflake算法类似。它设计成轻量型的，不同的机器都能用全局唯一的同种方法方便地生成它。MongoDB 从一开始就设计用来作为分布式数据库，处理多个节点是一个核心要求。使其在分片环境中要容易生成得多。

分布式集群下如何做到唯一序列号？

1个回答

相似问题