TEI是什么 人文研究领域的文本编码XML
发布时间 - 2026-01-29 00:00:00 点击率:次TEI是人文研究领域基于XML的文本结构化编码标准,提供540多个语义元素(如、、)显性化标注古籍残卷、诗歌韵律、戏剧对白等复杂结构,并强制要求与两大部分以支持学术元数据与可计算分析。
TEI(Text Encoding Initiative,文本编码倡议)是人文研究领域广泛采用的、基于XML的文本结构化编码标准。它不是一种编程语言或软件,

TEI的核心定位:为人文文本提供“可计算的骨架”
人文文本常含复杂结构——比如古籍的残卷标记、诗歌的分行与韵律、戏剧的角色对白、手稿的修订痕迹、多语种混排等。TEI用540多个语义明确的XML元素(如标残缺、标舞台提示、标校勘修正),把这类隐性知识显性化、结构化。这种编码既保留学术判断,又支持检索、比对、可视化和长期归档。
一个典型TEI文档的基本组成
每份合规TEI文件都包含两大部分:
-
头部(
):强制包含四大元数据区块——fileDesc(文献来源与物理描述)、encodingDesc(编码方法与依据)、profileDesc(内容特征,如语言、体裁、关键词)、revisionDesc(版本修订日志); -
正文(
):按实际文本逻辑组织,支持嵌套层级(如套再套和),并可混合使用语义标签(、、等)与格式无关的描述性标注。为什么人文学者要用TEI而不是普通XML或Markdown
因为TEI不只是“加标签”,而是承载学术惯例的编码语言:
- 它预置了200+文本类型模板(从词典、信札到碑刻、剧本),避免重复造轮子;
- 通过ODD(One Document Does it All)机制,项目可定制专属Schema,兼顾统一性与灵活性;
- 所有元素定义在公开XML Schema中,支持自动验证(如用Trafilatura或oXygen校验),确保数据可信、可交换;
- 与XSLT、Python(tei_reader)、LaTeX(ekdosis宏包)等工具链深度集成,能一键转HTML展示、PDF出版或DataFrame分析。
实际应用场景举例
不靠抽象概念,看几个真实落地方式:
- 秦汉简牍数字化:用
标模糊字迹,用补推测文字,同时保留原始图像链接; - 《莎士比亚全集》早期印刷本比对:用
(校勘 apparatus)包裹异文,内嵌(读法)与(见证手稿),支撑多版本动态对照; - 近代学者书信集:在
中结构化发信人、收信人、时间、地点,并关联CBDB人物数据库ID,实现人物关系网络自动构建。
# python
# html
# markdown
# 编码
# app
# 编程语言
# 工具
# pdf
# 为什么
# speak
# date
# xml
# 数据库
# 关键词
# 结构化
# 多个
# 两大
# 比对
# 莎士比亚
# 研究领域
# 几个
# 是一种
# 可计算
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
如何为不同团队 ID 动态生成多个非值班状态按钮
如何在橙子建站上传落地页?操作指南详解
JavaScript如何实现错误处理_try...catch如何捕获异常?
Laravel怎么实现API接口鉴权_Laravel Sanctum令牌生成与请求验证【教程】
Laravel与Inertia.js怎么结合_使用Laravel和Inertia构建现代单页应用
Laravel如何升级到最新的版本_Laravel版本升级流程与兼容性处理
JS弹性运动实现方法分析
高端智能建站公司优选:品牌定制与SEO优化一站式服务
JavaScript如何实现路由_前端路由原理是什么
详解Android——蓝牙技术 带你实现终端间数据传输
如何用AWS免费套餐快速搭建高效网站?
如何在Ubuntu系统下快速搭建WordPress个人网站?
微信小程序 配置文件详细介绍
如何在 React 中条件性地遍历数组并渲染元素
Laravel PHP版本要求一览_Laravel各版本环境要求对照
linux top下的 minerd 木马清除方法
最好的网站制作公司,网购哪个网站口碑最好,推荐几个?谢谢?
免费的流程图制作网站有哪些,2025年教师初级职称申报网上流程?
Python自动化办公教程_ExcelWordPDF批量处理案例
郑州企业网站制作公司,郑州招聘网站有哪些?
北京网站制作的公司有哪些,北京白云观官方网站?
Laravel怎么返回JSON格式数据_Laravel API资源Response响应格式化【技巧】
在线教育网站制作平台,山西立德教育官网?
Edge浏览器如何截图和滚动截图_微软Edge网页捕获功能使用教程【技巧】
简历在线制作网站免费版,如何创建个人简历?
laravel怎么为应用开启和关闭维护模式_laravel应用维护模式开启与关闭方法
Laravel如何从数据库删除数据_Laravel destroy和delete方法区别
矢量图网站制作软件,用千图网的一张矢量图做公司app首页,该网站并未说明版权等问题,这样做算不算侵权?应该如何解决?
如何快速辨别茅台真假?关键步骤解析
nodejs redis 发布订阅机制封装实现方法及实例代码
Laravel怎么多语言本地化设置_Laravel语言包翻译与Locale动态切换【手册】
Python结构化数据采集_字段抽取解析【教程】
Python进程池调度策略_任务分发说明【指导】
Android okhttputils现在进度显示实例代码
香港服务器部署网站为何提示未备案?
企业在线网站设计制作流程,想建设一个属于自己的企业网站,该如何去做?
如何确保FTP站点访问权限与数据传输安全?
深圳网站制作设计招聘,关于服装设计的流行趋势,哪里的资料比较全面?
Python高阶函数应用_函数作为参数说明【指导】
Laravel怎么实现一对多关联查询_Laravel Eloquent模型关系定义与预加载【实战】
html5如何实现懒加载图片_ intersectionobserver api用法【教程】
Laravel事件和监听器如何实现_Laravel Events & Listeners解耦应用的实战教程
Laravel如何使用Passport实现OAuth2?(完整配置步骤)
高防服务器租用首荐平台,企业级优惠套餐快速部署
Laravel Blade模板引擎语法_Laravel Blade布局继承用法
如何在宝塔面板创建新站点?
韩国服务器如何优化跨境访问实现高效连接?
Laravel如何实现全文搜索功能?(Scout和Algolia示例)
Laravel的Blade指令怎么自定义_创建你自己的Laravel Blade Directives
米侠浏览器网页背景异常怎么办 米侠显示修复

