自然场景下乌金体藏文的检测与识别
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

西藏大学研究生高水平人才培养计划(2018-GSP-020); 青海省藏文信息处理与机器翻译重点实验室/藏文信息处理教育部重点实验室开放课题(2020Z001)


Detection and Recognition of Wujin Style Tibetan Scripts in Natural Scenes
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    自然场景乌金体藏文文本信息作为高度浓缩的高层语义信息, 不仅具有较大的研究和实用价值, 而且可以用于协助藏文场景文本理解领域的研究. 目前针对自然场景下乌金体藏文的检测与识别的相关研究甚少, 本文在人工收集的自然场景乌金体藏文图像数据集的基础上, 对比了目前常见的文字检测算法在自然场景乌金体藏文上的检测性能以及在不同特征提取网络下基于序列的文字识别算法CRNN在自然场景乌金体藏文图像数据集上的识别准确率并分析了在314张真实自然场景下乌金体藏文识别出错的特殊例子. 实验表明本文在文字检测阶段采用的可微分的二值化网络DBNet在测试集上具有更好的检测性能, 该方法在测试集上的准确率、召回率、F1值分别达到了0.89、0.59、0.71; 在文字识别阶段采用MobileNetV3 Large作为特征提取网络时, CRNN算法在测试集上的识别准确率最高, 达到了0.4365.

    Abstract:

    As a highly condensed high-level semantic information, the text information of Wujin style Tibetan scripts in natural scenes not only has great research and practical value, but also can be used to assist researchers with text understanding in Tibetan scenes. At present, there are few related studies on the detection and recognition of Wujin style Tibetan scripts in natural scenes. Based on the manually collected image data set of Wujin style Tibetan scripts in natural scenes, this study compares the detection performance of common text detection algorithms on such scripts. The recognition accuracy of the sequence-based text recognition algorithm, CRNN, under different feature extraction networks is also compared on the image data set collected. Examples of recognition failure during the recognition of Wujin style Tibetan scripts in 314 real natural scenes are analyzed as well. Experiments show that the differentiable binary network, DBNet, used in the text detection stage has better detection performance on the test set. The accuracy, recall, and F1 value of this method on the test set reach 0.89, 0.59, and 0.71, respectively; when MobileNetV3 Large is used as the feature extraction network in the text recognition stage, the CRNN algorithm has the highest recognition accuracy of 0.4365 on the test set.

    参考文献
    相似文献
    引证文献
引用本文

洪松,高定国,三排才让,取次.自然场景下乌金体藏文的检测与识别.计算机系统应用,2021,30(12):332-338

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-02-09
  • 最后修改日期:2021-03-18
  • 录用日期:
  • 在线发布日期: 2021-12-10
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号