基于多粒度和语义信息的中文关系抽取
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Chinese Relation Extraction Based on Multi-Granularity and Semantic Information
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    中文关系抽取采用基于字符或基于词的神经网络, 现有的方法大多存在分词错误和歧义现象, 会不可避免的引入大量冗余和噪音, 从而影响关系抽取的结果. 为了解决这一问题, 本文提出了一种基于多粒度并结合语义信息的中文关系抽取模型. 在该模型中, 我们将词级别的信息合并进入字符级别的信息中, 从而避免句子分割时产生错误; 借助外部的语义信息对多义词进行建模, 来减轻多义词所产生的歧义现象; 并且采用字符级别和句子级别的双重注意力机制. 实验表明, 本文提出的模型能够有效提高中文关系抽取的准确率和召回率, 与其他基线模型相比, 具有更好的优越性和可解释性.

    Abstract:

    Chinese relation extraction adopts character-based or word-based neural networks. Most of the existing methods have word segmentation errors and ambiguity, which will inevitably introduce a lot of redundancy and noise and thus affect the results of relation extraction. In order to solve this problem, this study proposes a Chinese relationship extraction model based on multi-granularity combined with semantic information. In this model, we merge word-level information into character-level information, so as to avoid errors in sentence segmentation; use external semantic information to model polysemous words to reduce the ambiguity caused by semantic words; and adopt Dual attention mechanism at character level and sentence level. The experimental results show that the model proposed in this study can effectively increase the accuracy and recall rate of Chinese relation extraction and has better superiority and interpretability than other baseline models.

    参考文献
    相似文献
    引证文献
引用本文

陈钰,张安勤,许春辉.基于多粒度和语义信息的中文关系抽取.计算机系统应用,2021,30(3):190-195

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-07-09
  • 最后修改日期:2020-08-11
  • 录用日期:
  • 在线发布日期: 2021-03-06
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号