异地多活架构设计:如何实现 99.999% 的可用性?

异地多活架构是大厂标配,下面我重点详解异地多活架构设计@mikechen

异地多活架构

异地多活:是指在不同地理位置(如北京、上海、广州),建立两个、或多个能够独立承担业务流量的数据中心。

异地多活架构设计:如何实现 99.999% 的可用性?-mikechen

这里的异地和多活,主要是:

异地:地理位置上的物理隔离。

通常要求距离在 1000 公里以上,以规避地震、洪水、电网故障等区域性灾难。

多活:每个数据中心都在“活”着处理业务。

而不是一个主中心工作、另一个副中心只做备份(冷备/热备)。

 

异地多活架构设计

异地多活架构设计,主要会包含:

异地多活架构设计:如何实现 99.999% 的可用性?-mikechen

同城异区多活(同城多活)

业务部署在同一城市不同区域的多个机房(例如北京海淀、通州)。

用高速专线互联,延迟低、接近本地机房。

特点:

网络延迟很小(通常在毫秒级),数据同步可以做强一致或接近强一致(如 RPO ≈ 0)。

架构上可以近似当成“一个逻辑机房”来设计,是多活最容易落地的形态。

适用场景:

金融级同城双活、电商平台同城灾备、对 RTO/RPO 要求极高的系统。

 

跨城异地多活(跨城市多活)

业务部署在不同城市、不同大区的数据中心(例如北京、上海、深圳),距离通常在几百到上千公里。

异地多活架构设计:如何实现 99.999% 的可用性?-mikechen

特点:

网络延迟明显,通常在几十毫秒到百毫秒量级,强一致写入成本很高,一般采用异步或最终一致。

架构复杂度最高,需要做单元化、数据分片、冲突处理、流量路由。

适用场景:

电商、社交、大促、高并发推荐系统的“真正意义异地多活”。

如:阿里双十一多地多活、得物百万 QPS 架构。

 

跨国异地多活(全球化多活)

业务在不同国家部署数据中心(例如中国、美国、欧洲),距离远,延迟可能达几百毫秒甚至秒级。

异地多活架构设计:如何实现 99.999% 的可用性?-mikechen

特点:

网络延迟大,跨国数据同步无法满足“强实时”,一般只做弱一致、分区域读,很难做到“所有用户访问任意点都能得到完全一致响应”。

“多活”的含义更偏向“多地都提供服务”,但数据通常按区域隔离,对账 / 补偿是常态。

适用场景:

全球化 SaaS、多区域部署的电商/内容平台,面向不同国家/地区的用户服务(比如亚马逊中国 vs 美国)。

评论交流
    说说你的看法