小麦品种知识图谱构建与可视化研究
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

十三五国家重点研发计划(2016YFD0300609); 河南省科技创新杰出人才(184200510008); 河南省现代农业产业技术体系(S2010-01-G04)


Construction and Visualization of Knowledge Map of Wheat Varieties
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    为探索知识图谱技术在农业智能生产中应用与落地, 解决复杂多样的农业生产数据的精准查询与可视化问题, 本研究以小麦品种知识为例, 利用爬虫技术, 爬取1852个小麦品种信息、735个微百科、102349个词条; 基于知识图谱技术, 设计品种知识图谱实体与关系, 对抓取数据进行清洗、抽取与融合, 经过实体识别、关系构造等处理, 构建实体 258484个, 关系 328933个. 在此基础上, 设计了小麦品种知识存储方式, 结构化数据存储在MySQL中, 非结构化数据存储在MongoDB中, 使用Neo4j图数据库存储知识图谱来提高知识的查询性能, 在此基础上实现小麦品种关系查询与实体识别, 提供品种数据精确表达与可视化, 表明利用知识图谱技术实现品种等信息的可视化是可行的, 该研究可以为知识图谱在农业中的应用提供技术参考和理论支撑。

    Abstract:

    In order to explore the application and implementation of knowledge mapping technology in intelligent agricultural production and realize the accurate query and visualization of complex and diverse agricultural production data, this study took wheat varieties as an example and collected the information of 1852 wheat varieties, 735 micro encyclopedias, and 102 349 entries by a crawler. Through knowledge mapping technology, this study designed the entities of variety knowledge graphs and their relationships, with data cleaned, extracted, and fused. A total of 258 484 entities were recognized and 328 933 relationships built. On this basis, the approach to storing wheat variety knowledge was worked out, with structured data stored in a MySQL, unstructured data in the MongoDB. Neo4j was employed to optimize knowledge query. In this way, the query about relationships between wheat varieties and entity recognition was made possible with variety data expressed accurately and visualized, proving the feasibility of knowledge mapping in visualization of information such as variety. This research can provide technical reference and theoretical support for the application of knowledge mapping in agriculture.

    参考文献
    相似文献
    引证文献
引用本文

许鑫,岳金钊,赵锦鹏,王亚坤,马新明,钱学霖.小麦品种知识图谱构建与可视化研究.计算机系统应用,2021,30(6):286-292

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-10-16
  • 最后修改日期:2020-11-18
  • 录用日期:
  • 在线发布日期: 2021-06-05
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号