中文深层网络的模式匹配和接口集成
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(60970018)


Schema Matching and Interface Integration for Chinese Deep Web
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    目前国内外在深层网络方面的研究几乎都围绕英文环境进行, 还没有针对中文深层网络的研究. 提出了对中文深层网络进行模式匹配和接口集成的方法. 该方法首先创建一个用来存储同义词、超义词和子义词的字典, 然后使用基于规则的分词算法将从接口中抽取的属性分成词. 对于每一个属性, 从定义的字典中找到其对应的所有同义词、超义词和子义词, 生成一条相应的记录并存储到列表中, 再从每条记录中选取出现次数最多的属性作为联合接口的属性.

    Abstract:

    Many researches about deep web focus on the deep web with English language, ignoring that with Chinese. In this paper, we present our work in schema matching and interface integration for Chinese deep web. We create a dictionary, which stores synonyms, hypernyms and hyponyms, at the very beginning. After interface extracting, we use Principle-based Segmentation algorithm to segment each attribute into words. Then, for each attribute, we look up the pre-created dictionary to find all its synonyms, hypernyms and hyponyms, form a record and store them in a list. Furthermore, we keep a counter for each attribute in the list to record times it appearing in the local interfaces. At last, we choose from each record a synonym with the largest count number as the attribute of union interface.

    参考文献
    相似文献
    引证文献
引用本文

张晶星.中文深层网络的模式匹配和接口集成.计算机系统应用,2012,21(12):203-205,185

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-04-23
  • 最后修改日期:2012-05-29
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号