系统设计：WhatsApp

系统设计

类型	估计
每日活跃用户（DAU）	5000万
每秒请求数 (RPS)	24K/秒
存储（每天）	约10.2 TB
储存（10年）	~38 PB
带宽	~120 MB/s

拉取模型不可扩展，因为它会在我们的服务器上产生不必要的请求开销，并且大多数情况下响应都是空的，从而浪费我们的资源。为了最大限度地降低延迟，使用WebSocket的推送模型是更好的选择，因为这样，只要与客户端的连接处于打开状态，我们就可以立即将数据推送到客户端，而不会有任何延迟。此外，WebSocket 提供全双工通信，而服务器发送事件 (SSE)则只是单向的。

注意：了解有关长轮询、WebSockets、服务器发送事件（SSE）的更多信息。

上次出现

为了实现“上次查看”功能，我们可以使用心跳机制，客户端可以定期 ping 服务器以指示其活动状态。由于需要尽可能降低开销，我们可以将上次活动时间戳存储在缓存中，如下所示：

钥匙	价值
用户 A	2022年7月1日14:32:50
用户B	2022-07-05T05:10:35
用户C	2022-07-10T04:33:25

这将返回用户上次活动的时间。此功能将由状态服务结合Redis或Memcached作为缓存来处理。

另一种实现方法是跟踪用户的最新操作。一旦用户最近的活动超过某个阈值，例如“用户在过去 30 秒内未执行任何操作”，我们就可以将用户显示为离线，并使用最后记录的时间戳来记录上次上线时间。这更像是一种惰性更新方法，在某些情况下可能比心跳更新更有优势。

通知

一旦在聊天或群组中发送消息，我们将首先检查收件人是否处于活动状态，我们可以通过考虑用户的活动连接和上次查看来获取此信息。

如果收件人不活跃，聊天服务将向消息队列中添加一个事件，其中包含额外的元数据，例如客户端的设备平台，稍后将用于将通知路由到正确的平台。

然后，通知服务将从消息队列中消费该事件，并根据客户端的设备平台（Android、iOS、Web 等）将请求转发到Firebase 云消息传递 (FCM)或Apple 推送通知服务 (APNS)。我们还可以添加对电子邮件和短信的支持。

我们为什么要使用消息队列？

由于大多数消息队列都提供尽力排序，这确保了消息通常按照发送的顺序传递，并且消息至少传递一次，这是我们服务功能的重要组成部分。

虽然这看起来像是一个典型的发布-订阅用例，但实际上并非如此，因为移动设备和浏览器各自都有处理推送通知的方式。通常，通知是通过 Firebase 云消息传递 (FCM) 或 Apple 推送通知服务 (APNS) 在外部处理的，这与我们在后端服务中常见的消息扇出不同。我们可以使用Amazon SQS或RabbitMQ之类的服务来支持此功能。

已读回执

处理已读回执可能比较棘手，对于这种情况，我们可以等待客户端的某种确认 (ACK)来确定消息是否已送达，并更新相应的deliveredAt字段。同样，我们会将消息标记为用户打开聊天后看到的消息，并更新相应的seenAt时间戳字段。

设计

现在我们已经确定了一些核心组件，让我们开始系统设计的初稿。

详细设计

现在是时候详细讨论我们的设计决策了。

数据分区

为了扩展数据库，我们需要对数据进行分区。水平分区（又称分片）是一个很好的第一步。我们可以使用以下分区方案：

基于哈希的分区
基于列表的分区
基于范围的分区
复合分区

上述方法仍然会导致数据和负载分布不均匀，我们可以使用一致性哈希来解决这个问题。

有关更多详细信息，请参阅分片和一致性哈希。

缓存

在消息传递应用中，我们必须谨慎使用缓存，因为用户期望获取最新数据，但许多用户会请求相同的消息，尤其是在群聊中。因此，为了防止资源使用量激增，我们可以缓存较旧的消息。

有些群聊可能包含数千条消息，通过网络发送这些消息效率极低。为了提高效率，我们可以在系统 API 中添加分页功能。这项功能对于网络带宽有限的用户非常实用，因为他们无需在需要时才检索旧消息。

使用哪种缓存驱逐策略？

我们可以使用Redis或Memcached等解决方案并缓存 20% 的每日流量，但哪种缓存驱逐策略最适合我们的需求？

对我们的系统来说，最近最少使用（LRU）策略可能是一个不错的选择。在这个策略中，我们首先丢弃最近最少使用的键。

如何处理缓存未命中？

每当出现缓存未命中时，我们的服务器可以直接访问数据库并使用新条目更新缓存。

有关详细信息，请参阅缓存。

媒体访问和存储

众所周知，我们的大部分存储空间将用于存储媒体文件，例如图像、视频或其他文件。我们的媒体服务将处理用户媒体文件的访问和存储。

但是，我们可以在哪里大规模存储文件呢？嗯，对象存储就是我们想要的。对象存储将数据文件分解成称为对象的块。然后，它将这些对象存储在一个存储库中，该存储库可以分布在多个联网系统中。我们也可以使用分布式文件存储，例如HDFS或GlusterFS。

有趣的事实：一旦用户下载了媒体，Whatsapp 就会在其服务器上删除该媒体。

对于这种用例，我们可以使用Amazon S3、Azure Blob Storage或Google Cloud Storage等对象存储。

内容分发网络 (CDN)

内容分发网络 (CDN)可以提高内容可用性和冗余度，同时降低带宽成本。通常，静态文件（例如图像和视频）由 CDN 提供。对于这种情况，我们可以使用Amazon CloudFront或Cloudflare CDN等服务。

API网关

由于我们将使用多种协议，例如 HTTP、WebSocket、TCP/IP，因此为每种协议分别部署多个 L4（传输层）或 L7（应用层）类型的负载均衡器将会非常昂贵。因此，我们可以使用支持多种协议的API 网关，而不会出现任何问题。

API Gateway 还可以提供其他功能，例如身份验证、授权、速率限制、节流和 API 版本控制，这些功能将提高我们服务的质量。

对于这种用例，我们可以采用Amazon API Gateway或Azure API Gateway等服务。

识别并解决瓶颈

让我们识别并解决设计中的单点故障等瓶颈：

“如果我们的某项服务崩溃了怎么办？”
“我们将如何在组件之间分配流量？”
“我们如何才能减轻数据库的负载？”
“如何提高我们的缓存的可用性？”
“API 网关不会成为单点故障吗？”
“我们如何才能使我们的通知系统更加强大？”
“我们如何降低媒体存储成本”？
“聊天服务的责任是否太重了？”

为了使我们的系统更具弹性，我们可以执行以下操作：

运行我们每项服务的多个实例。
在客户端、服务器、数据库和缓存服务器之间引入负载平衡器。
为我们的数据库使用多个读取副本。
我们的分布式缓存有多个实例和副本。
我们可以拥有 API 网关的备用副本。
在分布式系统中，精确一次传递和消息排序是一项挑战，我们可以使用专用消息代理（如Apache Kafka或NATS）来使我们的通知系统更加健壮。
我们可以在媒体服务中添加媒体处理和压缩功能，以压缩类似Whatsapp的大文件，这将节省大量存储空间并降低成本。
我们可以创建一个独立于聊天服务的群组服务，以进一步解耦我们的服务。

本文是我在 Github 上提供的开源系统设计课程的一部分。

karanpratapsingh /系统设计

学习如何大规模设计系统并准备系统设计面试

系统设计

嘿，欢迎来到本课程。希望本课程能给您带来良好的学习体验。

这门课程也可以在我的网站上找到，也可以在leanpub上找到电子书。如果觉得有帮助，请留下⭐作为鼓励！

系统设计：WhatsApp 系统设计目录

系统设计：WhatsApp

系统设计

目录

Whatsapp 是什么？

要求

功能要求

非功能性需求

扩展要求

估计和约束

交通

数据模型设计

我们应该使用什么样的数据库？

API 设计

获取所有聊天或群组

获取消息

发送消息

加入或离开群组

高层设计

建筑学

实时消息传递

上次出现

通知

已读回执

设计

详细设计

数据分区

缓存

媒体访问和存储

内容分发网络 (CDN)

API网关

识别并解决瓶颈

karanpratapsingh /系统设计

学习如何大规模设计系统并准备系统设计面试

系统设计

目录