如何在Linux中监控心跳 Linux systemd看门狗配置

发布时间 - 2025-08-29 00:00:00    点击率:
使用systemd看门狗可实现Linux心跳监控,通过服务定期调用sd_notify("WATCHDOG=1")发送心跳,若在WatchdogSec指定时间内未收到信号,systemd将重启服务;2. 需在代码中集成libsystemd,发送READY和WATCHDOG通知,并在systemd单元文件中配置WatchdogSec、Restart和NotifyAccess;3. 无法修改代码时可用“看门狗伴侣”进程模拟心跳;4. WatchdogSec应略大于实际心跳间隔以避免误触发。

在Linux中监控心跳,你可以使用多种方法,systemd看门狗是一种相对简单且可靠的方案。它允许你在用户空间程序出现问题时,自动重启服务。

解决方案

Systemd看门狗通过预期服务定期调用

sd_notify()
函数来工作。如果systemd在配置的时间间隔内没有收到此信号,它会认为服务已失败并采取配置的操作(通常是重启服务)。

如何配置systemd看门狗

  1. 代码集成:

    首先,你的应用程序需要包含对

    libsystemd
    的调用。这通常涉及包含头文件
    并调用
    sd_notify(0, "READY=1")
    来指示服务已启动完成。然后,定期调用
    sd_notify(0, "WATCHDOG=1")
    以保持看门狗的活跃状态。

    #include 
    #include 
    #include 
    
    int main() {
        // 初始化和启动服务...
    
        sd_notify(0, "READY=1"); // 通知 systemd 服务已准备好
    
        while (1) {
            // 执行服务的主要逻辑...
    
            // 定期发送心跳信号
            sd_notify(0, "WATCHDOG=1");
            sleep(10); // 例如,每10秒发送一次
        }
    
        return 0;
    }
  2. Systemd单元文件配置:

    编辑你的服务的systemd单元文件(通常位于

    /etc/systemd/system/
    目录下,例如
    your_service.service
    ),添加或修改以下选项:

    [Service]
    WatchdogSec=30  ; 设置看门狗超时时间为30秒
    Restart=on-failure ; 服务失败时重启
    NotifyAccess=all ; 允许服务通知systemd
    • WatchdogSec
      :指定systemd在多长时间内没有收到心跳信号时认为服务失败。
    • Restart
      :指定在服务失败时采取的措施。
      on-failure
      是一个常见的选择。
    • NotifyAccess=all
      :允许所有用户访问通知套接字,这对于非root用户运行的服务很重要。
  3. 重新加载Systemd配置并重启服务:

    sudo systemctl daemon-reload
    sudo systemctl restart your_service.service

如何确定看门狗是否正常工作?

你可以通过查看systemd日志来确认看门狗是否正常工作。使用

journalctl -u your_service.service
命令,你应该能看到周期性的 "WATCHDOG=1" 日志消息。如果服务崩溃或停止发送心跳,你应该会看到 systemd 尝试重启服务的日志。

Systemd看门狗与其他监控方案相比有什么优势?

Systemd看门狗与传统的监控脚本相比,优势在于它与systemd紧密集成,配置简单,并且能够提供更快的故障检测和恢复。传统的监控脚本可能需要更复杂的配置和维护,并且可能无法像systemd那样快速地响应服务故障。此外,systemd看门狗可以利用 systemd 的依赖关系管理,确保在服务重启之前,所有必要的依赖项都已启动。

如果我的服务无法修改代码,如何使用systemd看门狗?

如果无法修改服务的源代码来集成

sd_notify()
,你可以使用一个“看门狗伴侣”进程。这个进程可以定期检查服务的状态(例如,通过检查进程是否存在、监听端口等),并在服务无响应时调用
sd_notify()
。然后,将这个伴侣进程配置为systemd服务,并使用
WatchdogSec
Restart
选项来监控主服务。

如何调整WatchdogSec的值?

WatchdogSec
的值应该根据你的服务的正常运行情况进行调整。设置得太短可能会导致误报,而设置得太长可能会延迟故障检测。一个好的经验法则是将
WatchdogSec
设置为比服务正常心跳间隔稍长的时间,以允许一些波动。例如,如果你的服务每 10 秒发送一次心跳,你可以将
WatchdogSec
设置为 30 秒。


# linux  # access  # ai  # 自动重启  # 看门狗  # 重启  # 你可以  # 并在  # 时间内  # 你应该  # 设置为  # 是一个  # 有什么  # 是一种 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel的契約(Contracts)是什么_深入理解Laravel Contracts与依赖倒置  laravel怎么通过契约(Contracts)编程_laravel契约(Contracts)编程方法  Laravel如何处理JSON字段_Eloquent原生JSON字段类型操作教程  如何用狗爹虚拟主机快速搭建网站?  Laravel PHP版本要求一览_Laravel各版本环境要求对照  Python面向对象测试方法_mock解析【教程】  node.js报错:Cannot find module 'ejs'的解决办法  昵图网官方站入口 昵图网素材图库官网入口  DeepSeek是免费使用的吗 DeepSeek收费模式与Pro版本功能详解  Laravel如何实现用户密码重置功能?(完整流程代码)  Laravel观察者模式如何使用_Laravel Model Observer配置  深圳网站制作的公司有哪些,dido官方网站?  黑客如何通过漏洞一步步攻陷网站服务器?  javascript日期怎么处理_如何格式化输出  网站制作企业,网站的banner和导航栏是指什么?  Angular 表单中正确绑定输入值以确保提交与验证正常工作  Android 常见的图片加载框架详细介绍  Laravel如何优化应用性能?(缓存和优化命令)  Laravel如何设置自定义的日志文件名_Laravel根据日期或用户ID生成动态日志【技巧】  如何确保FTP站点访问权限与数据传输安全?  网站制作公司哪里好做,成都网站制作公司哪家做得比较好,更正规?  html文件怎么打开证书错误_https协议的html打开提示不安全【指南】  Windows11怎样设置电源计划_Windows11电源计划调整攻略【指南】  移动端手机网站制作软件,掌上时代,移动端网站的谷歌SEO该如何做?  Bootstrap CSS布局之列表  Java遍历集合的三种方式  QQ浏览器网页版登录入口 个人中心在线进入  北京的网站制作公司有哪些,哪个视频网站最好?  Laravel中DTO是什么概念_在Laravel项目中使用数据传输对象(DTO)  制作ppt免费网站有哪些,有哪些比较好的ppt模板下载网站?  Laravel如何使用Collections进行数据处理?(实用方法示例)  Laravel如何实现URL美化Slug功能_Laravel使用eloquent-sluggable生成别名【方法】  简历没回改:利用AI润色让你的文字更专业  Linux安全能力提升路径_长期防护思维说明【指导】  Android滚轮选择时间控件使用详解  Laravel如何从数据库删除数据_Laravel destroy和delete方法区别  公司门户网站制作公司有哪些,怎样使用wordpress制作一个企业网站?  phpredis提高消息队列的实时性方法(推荐)  矢量图网站制作软件,用千图网的一张矢量图做公司app首页,该网站并未说明版权等问题,这样做算不算侵权?应该如何解决?  标题:Vue + Vuex 项目中正确使用 JWT 进行身份认证的实践指南  JS中页面与页面之间超链接跳转中文乱码问题的解决办法  Android仿QQ列表左滑删除操作  北京企业网站设计制作公司,北京铁路集团官方网站?  Laravel如何发送系统通知?(Notification渠道示例)  微信小程序 HTTPS报错整理常见问题及解决方案  头像制作网站在线观看,除了站酷,还有哪些比较好的设计网站?  高防服务器:AI智能防御DDoS攻击与数据安全保障  Java垃圾回收器的方法和原理总结  Laravel如何编写单元测试和功能测试?(PHPUnit示例)  如何快速完成中国万网建站详细流程?