《系统设计面试》读书笔记(连载中)

最近在读 Alex Xu 的《System Design Interview》这本书，系统学习一下系统设计面试的相关问题。读完觉得有必要记录一些笔记，帮助自己”学而时习之”，于是记录在这里，不断更新中~

为了准备英文面试，我读的是英文版，这本书的中文版已经出版，豆瓣 8.3 分，叫做《搞定系统设计：面试敲开大厂的门》有兴趣也可以阅读。

第五章：一致性哈希

第六章：KV存储(键值对存储)

KV 存储，又叫 KV 数据库
Key 各不相同，可以是字符串，也可以是哈希值
Value 透明的对象
设计：没有完美的设计，需要权衡以下问题
- 读，写，内存使用
- 一致性，可用性
需要考虑的功能特性
- 键值对大小
- 存储大数据的能力
- 高可用
- 高扩展
- 自动扩展
- tunable consistency(可调的一致性)
- 低延时

单机 KV 存储

用哈希表实现就行，数据都放内存里
遇到空间问题可以：
- 数据压缩
- 内存只存放热数据，其他的存磁盘里
缺点：
- 即使有了优化，仍然很容易遇到单机的空间上限，数据多了一定要上大数据

分布式 KV 存储

distributed key-value store 也叫 distributed hash table (分布式哈希表)
CAP 理论：
- Consistency 一致性：同一时间，所有客户端，都返回同样的数据
- Availability 可用性：不论连接到哪个节点，都有数据返回
- Partition Tolerance 分区容忍性：系统在网络分区（即网络中断导致通信失败）的情况下仍然能够继续运行
CAP三个里最多同时满足两个，至少要牺牲一个
- CA：因为网络故障在真实世界里不可避免，所以选 CA 而放弃 P 的情况是不可能存在的
- CP：选一致性，放弃可用性。比如银行，对账户余额要求高，如果遇到问题，可以直接报错，不能返回脏数据
- AP：选可用性，放弃一致性。为了保证高可用，遇到网络故障，数据同步中断，可能返回脏节点的脏数据，等网络恢复后会同步成功

系统组件

Data Partition 数据分片
- 设计目标：
  - 数据能分布存储
  - 加减节点的时候，数据移动少
- 使用第五章介绍的一致性哈希可以解决这个问题，好处
  - 自动扩容
  - 均匀（容量越大的节点，配置越多的虚拟节点）
Data Replication 数据复制
- 为了高可用，必须吧数据复制到不同的节点
- 一般是哈希环上顺时针往后的 N 个节点，如果有虚拟节点，适当跳过，选择不同的物理节点
- 一般同一个数据中心的机器会同时发生电力/网络/自然灾难等故障，最好放到不同的数据中心，数据中心之间用高速网络连接
Consistency 一致性
- 强弱一致性定长
  - N = 副本总数
  - Q = 写操作至少需要确认的节点个数
  - R = 读操作至少需要确认的节点个数
  - 如果 W + R > N，就满足强一致性，一般 N = 3, W = R = 2
  - 如果 R = 1， W = N 就是为快速读取设计的
  - 如果 W = 1， R = N 就是为快速写入设计的
- 一致性模型
  - 强一致性：任何读写操作，都是最近数据，没有脏数据（不够高可用）
  - 弱一致性：不能保证
  - 最终一致性：给足够的时间同步数据，最终数据都是一致的（高可用的服务，一般用这种，比如 Dynamo Cassandra）
Inconsistency resolution 不一致性恢复
Handling failures 错误处理
System architecture diagram 系统架构图
Write path 读路径
Read path 写路径

词汇表

tradeoff 权衡
opaque 不透明的
sacrificing availability 牺牲可用性
unavoidable 不可避免的
immutable 不可变的
replica 复制
high

ChangeLog

24-07-01 新建文档，部分发布：第六章：KV存储

附录，中文版目录（来源于豆瓣页面）

从0到100万用户的扩展 1
1 单服务器配置 1
2 数据库 3
2.1 使用何种数据库 4
3 纵向扩展 vs. 横向扩展 5
4 负载均衡器 5
5 数据库复制 7
6 缓存 10
6.1 缓存层 10
6.2 使用缓存时的注意事项 11
7 内容分发网络 12
7.1 使用CDN时的注意事项 14
8 无状态网络层 15
8.1 有状态架构 15
8.2 无状态架构 16
9 数据中心 18
10 消息队列 20
11 记录日志、收集指标与自动化 21
11.1 添加消息队列和各种工具 21
12 数据库扩展 23
12.1 纵向扩展 23
12.2 横向扩展 23
13 用户量达到甚至超过了100万 27
封底估算 28
1 2的幂 28
2 每个程序员都应该知道的操作耗时 29
3 可用性相关的数字 31
4 案例：估算推特的QPS和存储需求 31
5 小技巧 32
系统设计面试的框架 33
1 有效的系统设计面试的四个步骤 34
1.1 第一步：理解问题并确定设计的边界 34
1.2 第二步：提议高层级的设计并获得认同 36
1.3 第三步：设计继续深入 38
1.4 第四步：总结 41
2 面试中每一步的时间分配 43
设计限流器 44
1 第一步：理解问题并确定设计的边界 45
2 第二步：提议高层级的设计并获得认同 46
2.1 在哪里实现限流器 46
2.2 流量限制算法 48
2.3 高层级架构 56
3 第三步：设计继续深入 57
3.1 流量限制规则 57
3.2 超过流量的限制 58
3.3 详细设计 58
3.4 分布式系统中的限流器 59
3.5 性能优化 61
3.6 监控 62
4 第四步：总结 63
设计一致性哈希系统 64
1 重新哈希的问题 64
2 一致性哈希 66
2.1 哈希空间和哈希环 66
2.2 哈希服务器 67
2.3 哈希键 68
2.4 查找服务器 68
2.5 添加服务器 69
2.6 移除服务器 70
2.7 两个问题 71
2.8 虚拟节点 73
2.9 找到受影响的键 74
3 总结 76
设计键值存储系统 77
1 理解问题并确定设计的边界 78
2 单服务器的键值存储 78
3 分布式键值存储 79
3.1 CAP理论 79
3.2 系统组件 81
3.3 数据分区 82
3.4 数据复制 83
3.5 一致性 84
3.6 不一致性的解决方案：版本控制 86
3.7 处理故障 89
3.8 系统架构图 94
3.9 写路径 96
3.10 读路径 97
4 总结 98
设计分布式系统中的唯一ID生成器 100
1 第一步：理解问题并确定设计的边界 101
2 第二步：提议高层级的设计并获得认同 101
2.1 多主复制 102
2.2 UUID 102
2.3 工单服务器 103
2.4 推特的雪花系统 104
3 第三步：设计继续深入 105
4 第四步：总结 106
设计URL缩短器 108
1 第一步：理解问题并确定设计的边界 108
1.1 封底估算 109
2 第二步：提出高层级的设计并获得认同 109
2.1 API端点 109
2.2 URL重定向 110
2.3 缩短URL 112
3 第三步：设计继续深入 112
3.1 数据模型 112
3.2 哈希函数 113
3.3 深入探讨URL缩短流程 116
3.4 深入探讨URL重定向流程 117
4 第四步：总结 118
设计网络爬虫 119
1 第一步：理解问题并确定设计的边界 121
2 第二步：提议高层级的设计并获得认同 122
3 第三步：设计继续深入 127
3.1 DFS vs. BFS 128
3.2 URL前线 129
3.3 HTML下载器 134
3.4 健壮性 135
3.5 可扩展性 136
3.6 检测和避免有问题的内容 137
4 第四步：总结 137
设计通知系统 139
1 第一步：理解问题并确定设计的边界 140
2 第二步：提议高层级的设计并获得认同 140
2.1 不同类型的通知 141
2.2 联系信息的收集流程 143
2.3 通知的发送与接收流程 144
3 第三步：设计继续深入 148
3.1 可靠性 148
3.2 其他组件和要考虑的因素 149
3.3 更新后的设计 151
4 第四步：总结 152
设计news feed系统 153
1 第一步：理解问题并确定设计的边界 154
2 第二步：提议高层级的设计并获得认同 154
2.1 news feed API 155
2.2 feed的发布 155
2.3 news feed的构建 156
3 第三步：设计继续深入 157
3.1 深入探讨feed的发布流程 158
3.2 深入探讨news feed的获取流程 161
3.3 缓存架构 162
4 第四步：总结 163
设计聊天系统 165
1 第一步：理解问题并确定设计的边界 165
2 第二步：提议高层级的设计并获得认同 167
2.1 轮询 168
2.2 长轮询 169
2.3 WebSocket 170
2.4 高层级设计 171
2.5 数据模型 175
3 第三步：设计继续深入 177
3.1 服务发现 177
3.2 消息流 178
3.3 显示在线状态 182
4 第四步：总结 185
设计搜索自动补全系统 187
1 第一步：理解问题并确定设计的边界 188
1.1 封底估算 189
2 第二步：提议高层级的设计并获得认同 189
2.1 数据收集服务 190
2.2 查询服务 190
3 第三步：设计继续深入 191
3.1 字典树数据结构 192
3.2 数据收集服务 197
3.3 查询服务 200
3.4 字典树操作 202
3.5 扩展存储 204
4 第四步：总结 205
设计视频分享系统 207
1 第一步：理解问题并确定设计的边界 208
1.1 封底估算 209
2 第二步：提议高层级的设计并获得认同 210
2.1 视频上传流程 211
2.2 视频流式传输流程 216
3 第三步：设计继续深入 217
3.1 视频转码 217
3.2 有向无环图模型 217
3.3 视频转码架构 219
3.4 系统优化 225
3.5 错误处理 230
4 第四步：总结 231
设计云盘 232
1 第一步：理解问题并确定设计的边界 233
1.1 封底估算 235
2 第二步：提议高层级的设计并获得认同 235
2.1 API 236
2.2 跳出单服务器设计 237
2.3 同步冲突 240
2.4 高层级设计 241
3 第三步：设计继续深入 243
3.1 块服务器 243
3.2 高一致性需求 245
3.3 元数据数据库 245
3.4 上传流程 246
3.5 下载流程 247
3.6 通知服务 249
3.7 节约存储空间 249
3.8 故障处理 250
4 第四步：总结 251
设计支付系统 253
1 第一步：理解问题并确定设计的边界 254
2 第二步：提议高层级的设计并获得认同 256
2.1 收款流程 256
2.2 复式记账系统（Double-Entry System） 258
2.3 托管支付页面 259
2.4 付款流程 265
2.5 实时卖家仪表板 265
3 第三步：设计继续深入 266
3.1 重试和幂等 267
3.2 同步支付 vs. 异步支付 271
3.3 一致性 276
3.4 处理支付失败 282
3.5 支付安全 284
4 第四步：总结 285
设计指标监控和告警系统 287
1 第一步：理解问题并确定设计的边界 287
1.1 高层级需求 288
2 第二步：提议高层级的设计并获得认同 289
2.1 基本原理 290
2.2 数据模型 290
2.3 高层级设计 293
3 第三步：设计继续深入 294
3.1 指标数据的收集 295
3.2 扩展系统 300
3.3 查询服务 303
3.4 存储层 304
3.5 告警系统 307
3.6 可视化系统 309
4 第四步：总结 310
继续学习 311
后记 313

明明如月成长笔记

Mingming's blog

《系统设计面试》读书笔记(连载中)

第五章：一致性哈希

第六章：KV存储(键值对存储)

单机 KV 存储

分布式 KV 存储

系统组件

词汇表

ChangeLog

附录，中文版目录（来源于豆瓣页面）

本文总阅读量次

关于我

良师益友

近期文章

分类目录

标签

存档

版权声明

文章导航