一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

发布时间 - 2025-07-12 00:00:00    点击率:

一种全新易用的基于词间关系的命名实体识别(ner)统一模型,刷新了14种数据集并达到新的最佳表现(sota)。这篇论文名为《unified named entity recognition as word-word relation classification》,已被aaai2025收录,详细内容可通过链接https://arxiv.org/pdf/2112.10070.pdf查看。

NER任务通常分为三种类型:平面NER(flat NER)、重叠NER(overlapped NER)和不连续NER(discontinuous NER)。近期的研究致力于通过一个统一的大模型来同时解决这三种问题。现有的最佳方法主要基于span-based和seq2seq的方法,但span-based方法需要枚举所有可能的span组合,存在时间复杂度问题;而seq2seq方法则容易产生错误传播。

因此,本文提出了一种新颖的框架,通过预测词与词之间的关系(称之为W2NER)来解决所有NER问题。词间关系主要分为三种:下一邻居词关系(NNW)、尾部-头部词关系(THW-*)和无关系(NONE)。为了解决图的稀疏性问题,文章采用了一个多粒度的二维图来表示词间关系。

模型由三个主要模块组成:

  1. 编码层(Encoder Layer):通过BERT获取表示信息,然后通过LSTM获取上下文信息。

  2. 卷积层(Convolution Layer):包含一个条件层归一化(CLN)层,用于获得词j在词i前提下的表示。接着是BERT风格的网格表示层,通过BERT的三个嵌入层获得信息表示、关系位置信息表示和位置域表示,并通过MLP融合。最后通过多粒度的空洞卷积(Multi-Granularity Dilated Convolution)采样不同的信息。

  3. 共同预测层(Co-Predictor Layer):使用一个普通的MLP和一个用于变长标签预测的biaffine预测器,最后通过softmax层输出结果。

解码层(Decoder Layer)通过NNW和THW-*构建实体环,如图所示:

实验结果显示,该模型在14个公开数据集(包括中文和英文)上都取得了最佳表现,成为最新的SoTA。具体实验结果如下:

  • 英文平面数据集

  • 中文平面数据集

  • 英文重叠数据集

  • 中文重叠数据集,F1性能

  • 英文不连续数据集

与前沿最佳论文对比:

消融实验显示,F1性能:

训练速度和推理速度也得到了极大提升:

总的来说,这篇文章提出了一个简单有效的NER新框架,具有较高的应用价值和潜力。


# linux  # ai  # red  # lstm  # bert  # https  # word  # 英文  # 提出了  # 三种  # 不连续  # 已被  # 较高  # 下一  # 采用了  # 也得  # 这篇文章 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel如何配置任务调度?(Cron Job示例)  学生网站制作软件,一个12岁的学生写小说,应该去什么样的网站?  如何彻底卸载建站之星软件?  今日头条微视频如何找选题 今日头条微视频找选题技巧【指南】  进行网站优化必须要坚持的四大原则  Laravel如何实现用户密码重置功能?(完整流程代码)  如何制作公司的网站链接,公司想做一个网站,一般需要花多少钱?  Win11怎么更改系统语言为中文_Windows11安装语言包并设为显示语言  如何快速搭建高效WAP手机网站吸引移动用户?  Gemini手机端怎么发图片_Gemini手机端发图方法【步骤】  SQL查询语句优化的实用方法总结  如何在阿里云ECS服务器部署织梦CMS网站?  Android中Textview和图片同行显示(文字超出用省略号,图片自动靠右边)  如何快速生成凡客建站的专业级图册?  谷歌浏览器如何更改浏览器主题 Google Chrome主题设置教程  php增删改查怎么学_零基础入门php数据库操作必知基础【教程】  制作旅游网站html,怎样注册旅游网站?  电商网站制作多少钱一个,电子商务公司的网站制作费用计入什么科目?  浅谈redis在项目中的应用  Edge浏览器怎么启用睡眠标签页_节省电脑内存占用优化技巧  Android自定义listview布局实现上拉加载下拉刷新功能  如何在七牛云存储上搭建网站并设置自定义域名?  打开php文件提示内存不足_怎么调整php内存限制【解决方案】  Windows Hello人脸识别突然无法使用  JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)  如何在阿里云香港服务器快速搭建网站?  如何在浏览器中启用Flash_2025年继续使用Flash Player的方法【过时】  php静态变量怎么调试_php静态变量作用域调试技巧【解答】  图册素材网站设计制作软件,图册的导出方式有几种?  Android Socket接口实现即时通讯实例代码  Laravel如何使用Socialite实现第三方登录?(微信/GitHub示例)  Laravel如何实现URL美化Slug功能_Laravel使用eloquent-sluggable生成别名【方法】  家族网站制作贴纸教程视频,用豆子做粘帖画怎么制作?  高防服务器租用如何选择配置与防御等级?  标准网站视频模板制作软件,现在有哪个网站的视频编辑素材最齐全的,背景音乐、音效等?  javascript中的数组方法有哪些_如何利用数组方法简化数据处理  Laravel怎么实现搜索功能_Laravel使用Eloquent实现模糊查询与多条件搜索【实例】  Laravel如何集成微信支付SDK_Laravel使用yansongda-pay实现扫码支付【实战】  三星、SK海力士获美批准:可向中国出口芯片制造设备  今日头条AI怎样推荐抢票工具_今日头条AI抢票工具推荐算法与筛选【技巧】  如何用美橙互联一键搭建多站合一网站?  北京网页设计制作网站有哪些,继续教育自动播放怎么设置?  Angular 表单中正确绑定输入值以确保提交与验证正常工作  非常酷的网站设计制作软件,酷培ai教育官方网站?  javascript中闭包概念与用法深入理解  Laravel如何与Pusher实现实时通信?(WebSocket示例)  南京网站制作费用,南京远驱官方网站?  Laravel如何使用.env文件管理环境变量?(最佳实践)  佐糖AI抠图怎样调整抠图精度_佐糖AI精度调整与放大细化操作【攻略】  夸克浏览器网页跳转延迟怎么办 夸克浏览器跳转优化