5.docker入门到精通—安装redis集群(理论)
创始人
2025-05-31 06:40:19
0

**面试题:**1-2 亿条数据需要缓存,请问如何设计这个存储案例:

**回答:**单机单台 100%不可能,肯定是分布式存储,用 redis 如何落地?(一般业界有 3种 解决方案)

方案一、哈希取余分区

2亿条记录就是 2 亿个 k,v,我们单机不行必须要分 布式多机,假设有 3 台机器构成一个集群,用户每次读写操作都是根据公式:hash(key) % N 个机器台数,计算出哈希值,用来决定数据映射到哪一个节点上。

【优点】:

简单粗暴,直接有效,只需要预估好数据规划好 节点,例如 3 台、8 台、10 台,就能保证一段时间 的数据支撑。使用 Hash 算法让固定的一部分请求落到同一台服务器上,这样每台服务器固定处理一部分请求(并维护这些请求的信息),起到负载均衡+分而治之的作用。

【缺点】:

原来规划好的节点,进行扩容或者缩容就比较麻 烦了额,不管扩缩,每次数据变动导致节点有变 动,映射关系需要重新进行计算,在服务器个数固 定不变时没有问题,如果需要弹性扩容或故障停机 的情况下,原来的取模公式就会发生变化:

Hash(key)/3 会变成 Hash(key) /?。此时地址经过取余运算的结果将发生很大变化,根据公式获取的服 务器也会变得不可控。 某个 redis 机器宕机了,由于台数数量变化,会导致 hash 取余全部数据重新洗牌。

方案二、一致性哈希算法分区

【是什么】:一致性哈希算法在 1997 年由麻省理工学院中提出的,设计目标是为了解决 分布式缓存数据变动和映射问题,某个机器宕机 了,分母数量改变了,自然取余数不 OK 了。

【能干嘛】:提出一致性 Hash 解决方案。 目的是当服务器个数发生变动时, 尽量减少影响客户端到服务器的映射关系 。

【步骤】:

  • 算法构建一致性哈希环

  • 服务器 IP 节点映射

  • key 落到服务器的落键规则

【优点】:

  • 容错性

假设 Node C 宕机,可以看到此时对象 A、B、D 不 会受到影响,只有 C 对象被重定位到 Node D。一般 的,在一致性 Hash 算法中,如果一台服务器不可 用,则受影响的数据仅仅是此服务器到其环空间中 前一台服务器(即沿着逆时针方向行走遇到的第一 台服务器)之间数据,其它不会受到影响。简单 说,就是 C 挂了,受到影响的只是 B、C 之间的数 据,并且这些数据会转移到 D 进行存储。

  • 扩展性

数据量增加了,需要增加一台节点 NodeX,X 的位 置在 A 和 B 之间,那收到影响的也就是 A 到 X 之间 的数据,重新把 A 到 X 的数据录入到 X 上即可, 不会导致 hash 取余全部数据重新洗牌。

**【缺点】:**数据倾斜

一致性 Hash 算法在服务节点太少时,容易因为节点 分布不均匀而造成数据倾斜(被缓存的对象大部分 集中缓存在某一台服务器上)问题, 例如系统中只有两台服务器:

【小总结】

为了在节点数目发生改变时尽可能少的 迁移数据,将所有的存储节点排列在收尾相接的Hash 环上,每个 key 在计算 Hash 后会 顺时针找到临近的存储节点存放。 而当有节点加入或退出时仅影响该节点在Hash环上顺时针相邻的后续节点。

优点: 加入和删除节点只影响哈希环中顺时针 方向的相邻的节点,对其他节点无影响。

缺点: 数据的分布和节点的位置有关,因为这些节点不是均匀的分布在哈希环上的, 所以数据在进行存储时达不到均匀分布的效果。

方案三、哈希槽分区

1 为什么出现哈希槽实质就是一个数组,数组[0,2^14 -1]形成hash slot空间。解决一**致性哈希算法分区的倾斜问题****。**2 能干什么解决均匀分配的问题,在数据和节点之间又加入了一层,把这层称为哈希槽(slot),用于管理数据和节点之间的关系,现在就相当于节点上放的是槽,槽里放的是数据。

槽解决的是粒度问题,相当于把粒度变大了,这样便于数据移动。哈希解决的是映射问题,使用key的哈希值来计算所在的槽,便于数据分配。3 多少个hash槽一个集群只能有16384个槽,编号0-16383(0-2^14-1)。这些槽会分配给集群中的所有主节点,分配策略没有要求。可以指定哪些编号的槽分配给哪个主节点。集群会记录节点和槽的对应关系。解决了节点和槽的关系后,接下来就需要对key求哈希值,然后对16384取余,余数是几key就落入对应的槽里。slot = CRC16(key) % 16384。以槽为单位移动数据,因为槽的数目是固定的,处理起来比较容易,这样数据移动问题就解决了。

Redis 集群中内置了 16384 个哈希槽,redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时,redis 先对 key 使用 crc16 算法算出一个结果,然后把结果对 16384 求余数,这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽,也就是映射到某个节点上。如下代码,key之A 、B在Node2, key之C落在Node3上。

相关内容

热门资讯

python基础语法【模块 包... 模块 包 异常捕获 1.模块 python一个py文件就是一个模块 1.1 使用方法 1)前提&#x...
在recyclerview中使... 问题描述 最近在使用RecycerView的瀑布流布局,我想直接用ViewBindin...
java中Long型数据大小比... 起因 今天在做项目的时候,想构建一个树形结构,从数据库中查询出了所有数据...
智能控制 | AIRIOT智慧... 许多行业客户在智慧楼宇的建设中主要面临运营管理低效,楼宇内部各个系统相互独立ÿ...
Redis 数据结构 这里写目录标题Redis 数据结构一、String类型String数据类型的使用场景key 的设置约...
基于 MM32SPIN0280... M32SPIN0280 是灵动微电机新推出的针对电机控制市场的专用 MCU,该系列 M...
C++学习(指针、引用、结构体... 1编译软件Visual Studio2基本语法2.1指针2.1.1指针的使用//定义一个指针int ...
【UML】项目开发流程 以下模型是一个项目从启动到最终部署,逐步细化(精化)、实现...
docker-java应用部署 目录          1端口映射 2.Mysql部署 3.Tomcat部署 4.Nginx部署 5...
CentOS操作系统libc.... 使用xshell登陆Linux后查看jdk版本提示 /lib64/libc.so.6: versio...
Linux串口实现树莓派与电脑... 目录 一  串口说明 二  USB—TTL模块 ● usb-ttl模块接口  三  串口通信常用的A...
BeanPostProcess... 文章目录一、BeanPostProcessor的作用1. 源码2. 使用案例二、Spring生命周期...
2023.3.22 文章目录@13:static关键字**一:static修饰变量&...
模糊PID控制双容水箱液位控制... 资源:双容水箱液位模糊PID控制MATLAB仿真-电子商务文档类资源-CSDN文库模糊...
基于springboot家政服... 大家好✌!我是CZ淡陌。一名专注以理论为基础实战为主的技术博主,将再这里...
提升代码质量,使用插件对 ja... 目录前言一、使用maven-checkstyle-plugin插件1. maven-checksty...
VSCode配置git bas... 打开左下角齿轮图标      打开Settings 搜索框输入 terminal.integrat...
Winform控件开发(21)... 一、属性 1、Name 用于获取控件对象 2、Anchor 锚定控件对于父控件的位置 3、BackC...
【kubernetes云原生】... 目录 一、标签选择器来源 二、什么是标签选择器 2.1 标签选择器概述 2.2 标签选择器概述属性 ...
重构条件-Replace Ne... 重构条件-Replace Nested Conditional with Guard Clauses...