Python pathlib.Path 如何递归获取所有 .py 文件(不使用 os.walk)
发布时间 - 2026-01-24 00:00:00 点击率:次rglob是首选方案,因其为pathlib内置递归glob方法,语义明确、跨平台稳定、内存友好且语法简洁;需配合try/except处理权限错误,用p.suffix.lower()兼容大小写,通过p.parts过滤排除目录。
pathlib.Path.rglob 为什么是首选方案
rglob 是 pathlib.Path 内置的递归 glob 方法,专为替代 os.walk 设计。它返回一个生成器,延迟遍历,内存友好,且语法简洁。不用手动处理目录层级、过滤逻辑或异常跳过——只要路径存在且可读,它就自动往下钻。
常见错误是写成 path.glob("**/*.py"):这其实也能工作,但 ** 在 glob 中不保证跨平台递归(尤其在旧版 Python 或某些文件系统上行为不一致),而 rglob 明确语义、稳定支持所有平台。
- 必须用
rglob,不是glob - 模式字符串直接写
"*.py"即可,rglob默认从当前路径向下全递归 - 如果只想搜子目录(不含当前目录),可用
path.joinpath("**").rglob("*.py"),但通常不需要
如何正确处理权限不足或符号链接循环
rglob 遇到无法访问的目录(如 PermissionError)会直接抛异常,中断整个遍历。这不是 bug,而是默认行为。实际项目中必须捕获并跳过:
from pathlib import Pathdef safe_py_files(root: Path): for p in root.rglob("*.py"): try: if p.is_file(): # 确保是文件,排除可能的 broken symlink yield p except (OSError, RuntimeError): continue # 跳过权限错误、循环软链、设备忙等
-
p.is_file()必须显式调用,因为rglob("*.py")可能匹配到同名目录(极少见但可能) - 不要依赖
ignore_errors=True——rglob没这个参数,得自己 try/except - 符号链接默认被跟随;若需跳过软链,加
if not p.is_symlink()
Windows 下大小写敏感问题怎么破
Windows 文件系统默认不区分大小写,但 rglob("*.py") 严格按字面匹配。如果目录里有 SCRIPT.PY 或 main.Py,它们不会被命中。
解决方式不是改

py_files = [p for p in root.rglob("*") if p.is_file() and p.suffix.lower() == ".py"]
- 用
"*"先拉所有文件,再用p.suffix.lower()判断,兼容所有大小写变体 - 性能略低(遍历更多条目),但比写多个模式(
"*.py", "*.PY", "*.Py"…)干净得多 - Linux/macOS 下也建议统一用这种写法,避免跨平台差异
想排除 __pycache__ 和 venv 目录怎么办
rglob 本身不支持排除路径,得靠 Python 层过滤。最简方式是检查 p.parent 名称:
excludes = {"__pycache__", "venv", ".venv", "env"}
py_files = [
p for p in root.rglob("*.py")
if p.is_file() and all(part not in excludes for part in p.parts)
]
-
p.parts返回路径各段元组(如PosixPath("/a/b/venv/lib/site.py").parts == ('/', 'a', 'b', 'venv', 'lib', 'site.py')),比用str(p)正则更可靠 - 注意
venv可能出现在任意层级,所以要检查全部part,不能只看p.parent.name - 如果项目用 Poetry 或 Pipenv,可额外加入
".poetry"、".pipenv"
实际递归找 .py 文件,核心就三件事:用对 rglob、兜住 OSError、按需处理大小写和排除目录。细节都在路径对象自己的方法里,不用引入额外模块,但每一步漏掉都可能在 CI、Docker 或 Windows 上突然出问题。
# linux
# python
# docker
# windows
# mac
# ai
# macos
# win
# cos
# 为什么
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
如何在Windows 2008云服务器安全搭建网站?
如何用PHP快速搭建高效网站?分步指南
Laravel怎么集成Vue.js_Laravel Mix配置Vue开发环境
原生JS实现图片轮播切换效果
再谈Python中的字符串与字符编码(推荐)
Laravel如何使用查询构建器?(Query Builder高级用法)
javascript和jQuery中的AJAX技术详解【包含AJAX各种跨域技术】
Laravel如何创建自定义Artisan命令?(代码示例)
php结合redis实现高并发下的抢购、秒杀功能的实例
简历没回改:利用AI润色让你的文字更专业
标题:Vue + Vuex + JWT 身份认证的正确实践与常见误区解析
LinuxShell函数封装方法_脚本复用设计思路【教程】
怎样使用JSON进行数据交换_它有什么限制
Laravel如何配置.env文件管理环境变量_Laravel环境变量使用与安全管理
如何构建满足综合性能需求的优质建站方案?
Laravel怎么为数据库表字段添加索引以优化查询
ai格式如何转html_将AI设计稿转换为HTML页面流程【页面】
php 三元运算符实例详细介绍
html5怎么画眼睛_HT5用Canvas或SVG画眼球瞳孔加JS控制动态【绘制】
Edge浏览器提示“由你的组织管理”怎么解决_去除浏览器托管提示【修复】
Laravel Session怎么存储_Laravel Session驱动配置详解
香港服务器网站测试全流程:性能评估、SEO加载与移动适配优化
Laravel如何实现API资源集合?(Resource Collection教程)
Laravel怎么进行数据库回滚_Laravel Migration数据库版本控制与回滚操作
Laravel如何实现多表关联模型定义_Laravel多对多关系及中间表数据存取【方法】
如何做网站制作流程,*游戏网站怎么搭建?
如何在阿里云完成域名注册与建站?
免费的流程图制作网站有哪些,2025年教师初级职称申报网上流程?
Midjourney怎么调整光影效果_Midjourney光影调整方法【指南】
香港服务器WordPress建站指南:SEO优化与高效部署策略
Laravel如何使用模型观察者?(Observer代码示例)
夸克浏览器网页跳转延迟怎么办 夸克浏览器跳转优化
为什么要用作用域操作符_php中访问类常量与静态属性的优势【解答】
Laravel如何安装使用Debugbar工具栏_Laravel性能调试与SQL监控插件【步骤】
济南网站建设制作公司,室内设计网站一般都有哪些功能?
如何在阿里云通过域名搭建网站?
香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧
敲碗10年!Mac系列传将迎来「触控与联网」双革新
EditPlus中的正则表达式 实战(2)
Laravel路由怎么定义_Laravel核心路由系统完全入门指南
Laravel如何实现用户密码重置功能?(完整流程代码)
如何快速搭建二级域名独立网站?
如何注册花生壳免费域名并搭建个人网站?
Laravel中的withCount方法怎么高效统计关联模型数量
JavaScript中如何操作剪贴板_ClipboardAPI怎么用
如何快速搭建高效服务器建站系统?
如何用好域名打造高点击率的自主建站?
Laravel全局作用域是什么_Laravel Eloquent Global Scopes应用指南
深圳网站制作的公司有哪些,dido官方网站?
Laravel如何实现数据库事务?(DB Facade示例)

