Nginx百万并发背后技术揭秘！

在互联网业务高速发展的今天，用户访问量呈指数级增长，服务器面临的并发压力也越来越大。

一个高并发的网站，如果处理不当，可能会出现请求超时、服务器宕机、用户体验下降等问题。

Nginx 作为当前最流行的高性能 Web 服务器和反向代理服务器，以其轻量级、事件驱动、异步非阻塞的特点，成为高并发场景下的首选方案。

Nginx百万并发背后技术揭秘！-mikechen

Nginx 的轻量级架构，能够高效管理连接数。

并且，采用异步非阻塞 I/O，支持高并发。

那么 Nginx，是如何在百万并发场景下依然保持高效稳定？下面我深入解析 Nginx 在高并发环境下的技术之道。

Nginx 的架构设计

Nginx 采用模块化、非阻塞、事件驱动的架构，能够高效处理大量并发请求。

Nginx 采用Master-Worker 模型，主要包含以下进程：

Nginx百万并发背后技术揭秘！-mikechen

Master 进程

负责管理 Worker 进程，监控状态、热重载配置。

它会根据配置文件中的设置（如 worker_processes）,来决定启动多少个 Worker 进程。

除此之外，Master 进程会监控 Worker 进程的状态，如果某个 Worker 进程异常退出，Master 进程会自动重启它。

Worker 进程

Worker 进程：是 Nginx 实际执行请求处理的主力军。

它们承担着具体的负载均衡任务，当大量客户端请求涌入时，Worker 进程之间通过负载均衡机制协同处理。

依据预设的负载均衡算法，如轮询、加权轮询、IP 哈希…等。

RR 轮询（默认策略）：每个 Worker 进程依次处理请求。

Nginx百万并发背后技术揭秘！-mikechen

Least Connections（最少连接）：优先分配给当前连接数最少的 Worker。

Nginx百万并发背后技术揭秘！-mikechen

IP Hash：固定某个 IP 访问特定 Worker，提高缓存命中率。

Worker 进程能够将请求合理地分配给彼此，确保各个进程的负载相对均衡，充分利用系统资源。

同时，Worker 进程还负责代理功能，作为反向代理服务器，它能够接收客户端的请求，并将其转发到后端的真实服务器上等。

此外，Worker 进程还承担着静态资源服务的职责，对于客户端请求的静态资源，如：图片、CSS 样式表、JavaScript 脚本…等。

Worker 进程能够直接从本地磁盘读取并快速返回给客户端，大大提高了静态资源的访问速度，减轻了后端服务器的压力。

Cache 管理进程

在一些对缓存和日志管理有特定需求的场景中，Nginx 可以引入 Cache 管理进程。

Cache 管理进程主要负责管理缓存操作，它能够根据配置，对频繁访问的资源进行缓存处理。

例如，对于静态资源，Cache 管理进程可以将其缓存到内存或者磁盘中，当下次有相同的请求到来时，直接从缓存中读取并返回，减少了对后端服务器的访问，极大地提高了系统的响应速度。

Nginx事件驱动模型

Nginx 之所以能在高并发场景下表现优异，正是因为它利用了这些高效的 I/O 多路复用机制。

多路复用 I/O（epoll/kqueue），Nginx 通过 epoll（Linux）或 kqueue（BSD）高效管理大规模连接。

Nginx百万并发背后技术揭秘！-mikechen

在传统的 select/poll 方式中，每次查询就绪的 socket 需要遍历整个文件描述符集合，随着连接数增加，性能下降严重。

而 epoll/kqueue 采用事件驱动方式，在事件发生时才通知进程，从而提升效率。

Nginx 采用 Reactor 模型，每个 Worker 进程基于 epoll/kqueue 监听事件，避免阻塞等待。

异步非阻塞机制，所有连接操作均采用回调，不会阻塞主线程，提高吞吐量。

Nginx百万并发背后技术揭秘！-mikechen

Nginx 配置文件的优化

（1）优化 worker 进程数

根据服务器的 CPU 核心数合理设置工作进程数量。

例如，对于一个具有 8 个 CPU 核心的服务器，可以将 worker_processes 设置为 8 或 10。

通过这种方式，能够充分利用 CPU 资源，避免因进程过多导致的上下文切换开销过大，或因进程过少而无法充分发挥 CPU 性能。

worker_processes auto; # 让 Nginx 自动匹配 CPU 核心数
worker_cpu_affinity auto; # 绑定 CPU 核心，提高多核利用率

（2）优化并发连接数

worker_connections 65535; # 每个 Worker 支持最大连接数
multi_accept on; # 允许 Worker 进程同时接受多个新连接

（3）优化 keepalive 连接

合理设置连接超时时间，如 keepalive_timeout 和 client_body_timeout。

keepalive_timeout 用于设置客户端与服务器之间保持长连接的时间，适当缩短该时间可以避免过多的空闲连接占用资源。

client_body_timeout 用于设置读取客户端请求体的超时时间，设置合适的值能够防止因客户端异常导致的请求长时间占用资源。

keepalive_timeout 65; # 连接超时时间
keepalive_requests 10000; # 单个 keepalive 连接最大请求数

（4）Gzip 压缩优化

通过在配置文件中设置 gzip on，并合理配置 gzip_comp_level（压缩级别）等参数。

如将 gzip_comp_level 设置为 6（取值范围为 1 – 9，数值越大压缩比越高，但 CPU 开销也越大），可以在不显著增加服务器 CPU 负载的情况下，有效提升数据传输效率。

gzip on;
gzip_types text/plain application/json text/css application/javascript;
gzip_comp_level 6;

（5）TCP 连接优化

listen 80 reuseport backlog=65535;

reuseport：允许多个 Worker 共享端口，提高吞吐量。
backlog=65535：增大 TCP 连接队列，防止请求丢失。

（6）静态资源优化

缓存静态资源，减少服务器请求压力。

location /static/ {
    expires max;
    add_header Cache-Control "public, max-age=31536000";
}

通过这些优化策略，我们可以让 Nginx 在百万并发场景下保持高效稳定，最大化吞吐量！🚀

mikechen睿哥

10年+一线大厂架构实战经验，就职于阿里、淘宝等一线大厂，操盘多个亿级大厂核心项目。

mikechen睿哥

Java进阶架构师系列专题

阿里Java架构面试系列专题

阿里架构师进阶系列专题

手把手带大型项目实战落地