进程被 OOM kill 但 oom_score_adj 已调低仍被选中的隐藏规则

发布时间 - 2026-01-22 00:00:00    点击率:
OOM killer按cgroup局部决策,oom_score_adj仅在同cgroup内生效;badness得分由实际内存占用(含匿名页等)、cgroup压力系数等加权计算,-1000不等于免疫。

进程被 OOM kill 却已将 oom_score_adj 设为较低值(比如 -1000),仍被选中,往往不是因为配置没生效,而是内核在最终决策时引入了几个**不常被文档强调、但实际起决定性作用的隐藏规则**。

内存压力来源决定“谁该死”的优先级范围

OOM killer 不是全局扫描所有进程挑分最低的,而是先聚焦于**触发 OOM 的内存域(memory cgroup 或 NUMA node)内正在分配失败的进程所属的 cgroup**。即使你把某个后台服务的 oom_score_adj 调到 -1000,只要它恰好运行在当前内存紧张的 cgroup 里,而同 cgroup 内其他进程的分更高,它就可能成为备选——哪怕宿主机上还有大量空闲内存。

  • 检查方式:cat /proc//cgroup 看进程归属;cat /sys/fs/cgroup/memory//memory.oom_control 查该 cgroup 是否已触发过 OOM
  • 关键点:OOM 是按 cgroup 隔离粒度触发的,oom_score_adj 只在本 cgroup 内有效

实际内存占用 ≠ RSS,内核看的是 badness score 的完整计算逻辑

oom_score_adj 只是 badness 公式中的一个偏移项,真正得分由以下几项加权得出:

  • 进程实际使用的内存页数(包括匿名页、文件缓存脏页、swapcached 页等) —— 这比 rss 更大,尤其对 mmap 大文件、使用 tmpfs 或有大量 page cache 的进程影响显著
  • 进程的 CPU 时间权重(越老的进程权重略低) —— 但影响微弱,通常可忽略
  • 是否为 superuser 进程(uid 0)会轻微降低得分
  • oom_score_adj 值线性叠加,但有上下限(-1000 到 +1000) —— 设为 -1000 并不等于“免疫”,只是让基础分归零;若其内存占用是同类进程的 10 倍,仍可能高于其他轻量进程

某些内存类型会被“加倍惩罚”

内核对以下两类内存,在计算 badness 时会额外加重计分:

  • 不可回收的匿名页(如 malloc 分配、堆栈、mmap(MAP_ANONYMOUS)) —— 因无法写回磁盘,回收代价最高
  • 属于 m

    emcg 且超出 memory.high 限制后继续增长的内存
    —— 此时该 cgroup 已进入“压力模式”,其内进程的 badness 会被乘以一个增长系数(2x~4x),oom_score_adj 无法抵消该放大效应

例如:一个 Java 进程设了 oom_score_adj = -1000,但它的 heap 和 metaspace 占用 4GB 且全部是匿名页,同时所在 cgroup 已超 memory.high=3G,那么它的实际 badness 很可能远高于一个只占 500MB 但 oom_score_adj = 0 的 Nginx 进程。

确认是否真被 OOM killer 杀掉,而非其他机制

别默认日志里出现 “Killed process” 就是 OOM killer 所为:

  • 检查 dmesg -T | grep -i "killed process" 输出中是否有 Out of memory: Kill process 开头的完整行 —— 这才是 OOM killer 日志
  • 若只有 Memory cgroup out of memory 但无后续 kill 行,可能是 cgroup v2 的 memory.oom 控制器直接 freeze 进程,而非发送 SIGKILL
  • 某些容器运行时(如 containerd)或 systemd 服务会拦截 OOM 事件并自行重启/退出,掩盖真实原因

不复杂但容易忽略。


# java  # node  # nginx  #   # ai  # 内存占用 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: *服务器网站为何频现安全漏洞?  如何挑选高效建站主机与优质域名?  Laravel策略(Policy)如何控制权限_Laravel Gates与Policies实现用户授权  Laravel Eloquent性能优化技巧_Laravel N+1查询问题解决  Laravel如何使用Livewire构建动态组件?(入门代码)  Win11怎么关闭专注助手 Win11关闭免打扰模式设置【操作】  在centOS 7安装mysql 5.7的详细教程  laravel怎么实现图片的压缩和裁剪_laravel图片压缩与裁剪方法  ,网页ppt怎么弄成自己的ppt?  Laravel如何与Vue.js集成_Laravel + Vue前后端分离项目搭建指南  Laravel怎么生成二维码图片_Laravel集成Simple-QrCode扩展包与参数设置【实战】  合肥制作网站的公司有哪些,合肥聚美网络科技有限公司介绍?  Laravel如何监控和管理失败的队列任务_Laravel失败任务处理与监控  EditPlus中的正则表达式 实战(1)  js代码实现下拉菜单【推荐】  Mybatis 中的insertOrUpdate操作  Win10如何卸载预装Edge扩展_Win10卸载Edge扩展教程【方法】  如何安全更换建站之星模板并保留数据?  实现点击下箭头变上箭头来回切换的两种方法【推荐】  Win11应用商店下载慢怎么办 Win11更改DNS提速下载【修复】  Laravel Telescope怎么调试_使用Laravel Telescope进行应用监控与调试  极客网站有哪些,DoNews、36氪、爱范儿、虎嗅、雷锋网、极客公园这些互联网媒体网站有什么差异?  phpredis提高消息队列的实时性方法(推荐)  Edge浏览器怎么启用睡眠标签页_节省电脑内存占用优化技巧  免费的流程图制作网站有哪些,2025年教师初级职称申报网上流程?  JavaScript如何实现音频处理_Web Audio API如何工作?  Win11搜索栏无法输入_解决Win11开始菜单搜索没反应问题【技巧】  深圳网站制作公司好吗,在深圳找工作哪个网站最好啊?  使用Dockerfile构建java web环境  简单实现Android文件上传  Laravel怎么实现验证码(Captcha)功能  头像制作网站在线观看,除了站酷,还有哪些比较好的设计网站?  Laravel如何使用Seeder填充数据_Laravel模型工厂Factory批量生成测试数据【方法】  Android GridView 滑动条设置一直显示状态(推荐)  Laravel如何实现API资源集合?(Resource Collection教程)  BootStrap整体框架之基础布局组件  Laravel Vite是做什么的_Laravel前端资源打包工具Vite配置与使用  Win11怎么设置默认图片查看器_Windows11照片应用关联设置  JavaScript如何操作视频_媒体API怎么控制播放  JavaScript如何实现类型判断_typeof和instanceof有什么区别  如何快速完成中国万网建站详细流程?  利用JavaScript实现拖拽改变元素大小  Laravel项目如何进行性能优化_Laravel应用性能分析与优化技巧大全  php嵌入式断网后怎么恢复_php检测网络重连并恢复硬件控制【操作】  韩国网站服务器搭建指南:VPS选购、域名解析与DNS配置推荐  如何为不同团队 ID 动态生成多个非值班状态按钮  Laravel如何处理JSON字段的查询和更新_Laravel JSON列操作与查询技巧  php8.4header发送头信息失败怎么办_php8.4header函数问题解决【解答】  如何快速搭建个人网站并优化SEO?  Laravel如何从数据库删除数据_Laravel destroy和delete方法区别