nginx信号集实例分析

发布时间 - 2023-05-13 00:00:00    点击率:

场景复现

下面我将使用一个原生的 nginx,在我的安装了 fedora26 的虚拟机上复现这个过程,我使用的 nginx 版本是目前最新的 1.13.4

首先启动 nginx

可以看到 master 和 worker 都已经在运行。

接着我们向 master 发送一个 sigusr2 信号,当 nginx 核心收到这个信号后,就会触发热更新。

可以看到新的 master 和该 master fork 出来的 worker 已经在运行了,此时我们接着向旧 master 发送一个 sigwinch 信号,旧 master 收到这个信号后,会向它的 worker 发送 sigquit,于是旧 master 的 worker 进程就会退出:

此时只剩下旧的 master,新的 master 和新 master 的 worker 在运行,这和当时线上运行的情况类似。

接着我们使用 stop 命令:

我们会发现,新的 master 和它的 worker 都已经退出,而旧的 master 还在运行,并产生了 worker 出来。这就是当时线上的情况了。

事实上,这个现象和 nginx 自身的设计有关:当旧的 master 准备产生 fork 新的 master 之前,它会把 nginx.pid 这个文件重命名为 nginx.pid.oldbin,然后再由 fork 出来的新的 master 去创建新的 nginx.pid,这个文件将会记录新 master 的 pid。nginx 认为热更新完成之后,旧 master 的使命几乎已经结束,之后它随时会退出,因此之后的操作都应该由新 master 接管。当然,在旧 master 没有退出的情况下通过向新 master 发送 sigusr2 企图再次热更新是无效的,新 master 只会忽略掉这个信号然后继续它自己的工作。

问题分析

更不巧的是,我们上面提到的这个 lua table,定义它的 lua 文件早在运行 init_by_lua 这个 hook 的时候,就已经被 luajit 加载到内存并编译成字节码了,那么显然旧的 master 必然没有这个 lua table,因为它加载那部分 lua 代码是旧版本的。

而索引该 table 的 lua 代码并没有在 init_by_lua 的时候使用到,这些代码都是在 worker 进程里被加载起来的,这时候项目目录里的代码都是最新的,所以 worker 进程加载的都是最新的代码,如果这些 worker 进程处理到相关的请求,就会出现 lua 运行时错误,外部表现则是对应的 http 500。

吸收了这个教训之后,我们需要更加合理地关闭我们的 nginx 服务。 所以一个更加合理的 nginx 服务启动关闭脚本是必需的,网上流传的一些脚本并没有对这个现象做处理,我们更应该参考 nginx 官方提供的脚本。

这段代码引自 nginx 官方的 /etc/init.d/nginx 。

nginx 信号集

接下来我们来全面梳理下 nginx 信号集,这里不会涉及到源码细节,感兴趣的同学可以自行阅读相关源码。

我们有两种方式来向 master 进程发送信号,一种是通过 nginx -s signal 来操作,另一种是通过 kill 命令手动发送。

第一种方式的原理是,产生一个新进程,该进程通过 nginx.pid 文件得到 master 进程的 pid,然后把对应的信号发送到 master,之后退出,这种进程被称为 signaller。

第二种方式要求我们了解 nginx -s signal 到真实信号的映射。下表是它们的映射关系:

operation signal
reload sighup
reopen sigusr1
stop sigterm
quit sigquit
hot update sigusr2 & sigwinch & sigquit
stop vs quit

stop 发送 sigterm 信号,表示要求强制退出,quit 发送 sigquit,表示优雅地退出。 具体区别在于,worker 进程在收到 sigquit 消息(注意不是直接发送信号,所以这里用消息替代)后,会关闭监听的套接字,关闭当前空闲的连接(可以被抢占的连接),然后提前处理所有的定时器事件,最后退出。没有特殊情况,都应该使用 quit 而不是 stop。

reload

master 进程收到 sighup 后,会重新进行配置文件解析、共享内存申请,等一系列其他的工作,然后产生一批新的 worker 进程,最后向旧的 worker 进程发送 sigquit 对应的消息,最终无缝实现了重启操作。

reopen

master 进程收到 sigusr1 后,会重新打开所有已经打开的文件(比如日志),然后向每个 worker 进程发送 sigusr1 信息,worker 进程收到信号后,会执行同样的操作。reopen 可用于日志切割,比如 nginx 官方就提供了一个方案:

这里 sleep 1 是必须的,因为在 master 进程向 worker 进程发送 sigusr1 消息到 worker 进程真正重新打开 access.log 之间,有一段时间窗口,此时 worker 进程还是向文件 access.log.0 里写入日志的。通过 sleep 1s,保证了 access.log.0 日志信息的完整性(如果没有 sleep 而直接进行压缩,很有可能出现日志丢失的情况)。

hot update

某些时候我们需要进行二进制热更新,nginx 在设计的时候就包含了这种功能,不过无法通过 nginx 提供的命令行完成,我们需要手动发送信号。

通过上面的问题复现,大家应该已经了解到如何进行热更新了,我们首先需要给当前的 master 进程发送 sigusr2,之后 master 会重命名 nginx.pid 到 nginx.pid.oldbin,然后 fork 一个新的进程,新进程会通过 execve 这个系统调用,使用新的 nginx elf 文件替换当前的进程映像,成为新的 master 进程。新 master 进程起来之后,就会进行配置文件解析等操作,然后 fork 出新的 worker 进程开始工作。

接着我们向旧的 master 发送 sigwinch 信号,然后旧的 master 进程则会向它的 worker 进程发送 sigquit 信息,从而使得 worker 进程退出。向 master 进程发送 sigwinch 和 sigquit 都会使得 worker 进程退出,但是前者不会使得 master 进程也退出。

最后,如果我们觉得旧的 master 进程使命完成,就可以向它发送 sigquit 信号,让其退出了。

worker 进程如何处理来自 master 的信号消息

实际上,master 进程再向 worker 进程通讯,不是使用 kill 函数,而是使用了通过管道实现的 nginx channel,master 进程向管道一端写入信息(比如信号信息),worker 进程则从另外一端收取信息,nginx channel 事件,在 worker 进程刚刚起来的时候,就被加入事件调度器中(比如 epoll,kqueue),所以当有数据从 master 发来时,即可被事件调度器通知到。

nginx 这么设计是有理由的,作为一个优秀的反向代理服务器,nginx 追求的就是极致的高性能,而 signal handler 会中断 worker 进程的运行,使得所有的事件都被暂停一个时间窗口,这对性能是有一定损失的。

很多人可能会认为当 master 进程向 worker 进程发送信息之后,worker 进程立刻会有对应操作回应,然而 worker 进程是非常繁忙的,它不断地处理着网络事件和定时器事件,当调用 nginx channel 事件的 handler 之后,nginx 仅仅只是处理了一些标志位。真正执行这些动作是在一轮事件调度完成之后。所以这之间存在一个时间窗口,尤其是业务复杂且流量巨大的时候,这个窗口就有可能被放大,这也就是为什么 nginx 官方提供的日志切割方案里要求 sleep 1s 的原因。

当然,我们也可以绕过 master 进程,直接向 worker 进程发送信号,worker 可以处理的信号有

signal effect
sigint 强制退出
sigterm 强制退出
sigquit 优雅退出
sigusr1 重新打开文件


# nginx  # 就会  # 都是  # 加载  # 是在  # 可以看到  # 线上  # 配置文件  # 自己的  # 的是  # 会有 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel如何使用模型观察者?(Observer代码示例)  nginx修改上传文件大小限制的方法  Linux安全能力提升路径_长期防护思维说明【指导】  如何在IIS中新建站点并配置端口与物理路径?  如何彻底删除建站之星生成的Banner?  如何自定义建站之星模板颜色并下载新样式?  Laravel如何获取当前用户信息_Laravel Auth门面获取用户ID  Laravel怎么创建控制器Controller_Laravel路由绑定与控制器逻辑编写【指南】  今日头条微视频如何找选题 今日头条微视频找选题技巧【指南】  网站制作价目表怎么做,珍爱网婚介费用多少?  Laravel如何创建自定义Artisan命令?(代码示例)  创业网站制作流程,创业网站可靠吗?  如何在腾讯云服务器快速搭建个人网站?  猪八戒网站制作视频,开发一个猪八戒网站,大约需要多少?或者自己请程序员,需要什么程序员,多少程序员能完成?  Laravel如何发送系统通知_Laravel Notifications实现多渠道消息通知  如何在宝塔面板中修改默认建站目录?  简历没回改:利用AI润色让你的文字更专业  教学论文网站制作软件有哪些,写论文用什么软件 ?  Claude怎样写约束型提示词_Claude约束提示词写法【教程】  在Oracle关闭情况下如何修改spfile的参数  哪家制作企业网站好,开办像阿里巴巴那样的网络公司和网站要怎么做?  用v-html解决Vue.js渲染中html标签不被解析的问题  Python高阶函数应用_函数作为参数说明【指导】  Linux系统命令中tree命令详解  如何在阿里云购买域名并搭建网站?  Laravel Eloquent模型如何创建_Laravel ORM基础之Model创建与使用教程  Laravel Admin后台管理框架推荐_Laravel快速开发后台工具  Java类加载基本过程详细介绍  佐糖AI抠图怎样调整抠图精度_佐糖AI精度调整与放大细化操作【攻略】  如何在服务器上三步完成建站并提升流量?  Laravel怎么写单元测试_PHPUnit在Laravel项目中的基础测试入门  Laravel如何实现API版本控制_Laravel API版本化路由设计策略  Laravel怎么导出Excel文件_Laravel Excel插件使用教程  中山网站制作网页,中山新生登记系统登记流程?  如何在宝塔面板中创建新站点?  在线制作视频网站免费,都有哪些好的动漫网站?  laravel怎么为应用开启和关闭维护模式_laravel应用维护模式开启与关闭方法  如何在Ubuntu系统下快速搭建WordPress个人网站?  制作网站软件推荐手机版,如何制作属于自己的手机网站app应用?  如何快速上传建站程序避免常见错误?  IOS倒计时设置UIButton标题title的抖动问题  Laravel如何构建RESTful API_Laravel标准化API接口开发指南  ,交易猫的商品怎么发布到网站上去?  Laravel数据库迁移怎么用_Laravel Migration管理数据库结构的正确姿势  手机怎么制作网站教程步骤,手机怎么做自己的网页链接?  悟空浏览器如何设置小说背景色_悟空浏览器背景色设置【方法】  香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧  微信小程序制作网站有哪些,微信小程序需要做网站吗?  高配服务器限时抢购:企业级配置与回收服务一站式优惠方案  浅谈redis在项目中的应用