共计 960 个字符,预计需要花费 3 分钟才能阅读完成。
不一定
自增主键可以加快行的插入速度,对于表的空间利用上有优势,碎片化不明显。
但是对一些内容,如根据 uid 的查询非常频繁的,而且比较集中的,那如果不用自增主键,而是使用 uid+id 作为复合主键,那查询效率会上去,但插入和碎片化就会增加。但如果数据库的存储类型是 ssd,那这个问题就不存在了。
所以,大部分情况来看,表有自增主键是正确的。
不一定
单表结构下,是的。
多表情况下,不一定,需要一定的策略,如设定不同的后缀,相同的间隔等。
不建议这样做。
如:表可以有自增主键,表内是具有唯一性的。在根据 id 查询和更新的时候,可以简化操作。但一般来说,和业务上存在关系,并且需要唯一性的时候,应该由业务自主去维护,如使用格式或算法,hash 生成等方式。
维护自增键区间段,服务器每次取其中的一段,乐观锁更新。这个需要额外的表或策略来维护这个字段。
基于算法 A,固定时间前缀,如:yyyyMMddHHmmss+ 表数 mod 值 + 随机数,通过位数的增加,来降低冲突的可能性。表字段存在唯一性约束(但有时候这个约束并不可靠)插入时若抛出重复字段值异常,则重新生成插入。
基于算法 B,固定时间前缀,如:yyyyMMddHHmmss+ 固定位数碰撞自增值 N + 随机数。不需要通过位数的增加来降低冲突的可能性。当插入抛出重复字段值异常时,N++,重新插入,直到不再冲突为止。此后固定使用 N 作为中缀,并且 N 缓存于服务器,重启后继续使用此中缀。若出现重复异常,再次 N ++ 执行相同操作即可。N 的 mod 值这些就不用故意提起啦。
基于中缀管理,即上报中缀到中心服务器,可以理解有地方缓存了服务器的 id 关系,动态分配中缀。
其他方法,还有很多,也没有用过,不赘述了。
算法 B,简单,通信少,而且碰撞次数有限。算法 A,存在无限次数的碰撞,尽管百分比非常非常低。但是在高并发的情况下,初始化的时候,算法 B 会比算法 A 来得更狂风暴雨一些。
区间段和中缀管理,都引入了中心节点的概念,依赖性比较强,但相对可靠,业界更为通用的实现方式。