新型的面向新闻评论摘要采集算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Novel News Article Comments Summarization Algorithm of Computer Engineering and Applications
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    为了让读者可以更快地获取所有新闻评论中最有代表性的观点,提出一种新的新闻评论摘要采集算法,并依此设计出评论摘要采集系统.该算法将有效地结合聚类算法和排序算法,首先,使用改进的Borderflow算法对所有评论聚类;其次,采用类PageRank算法对聚类中的评论进行排序,选出排名最前的几条评论;最后,利用MMR算法对PageRank算法选出的所有评论进行再次排序,并选取名次最高的K条评论作为评论摘要.通过仿真实验得到的NDCG和MAP数据表明,使用本文算法得到的评论摘要具有更好的有效性和准确性,更符合读者直观感觉.

    Abstract:

    In order to make the readers get the most informative and representative opinions efficiently among the news comments, this paper proposes a novel news article comments summarization algorithm and then designs an article summarization system, which combines the clustering algorithm with the ranking algorithm.First, it groups comments using the modified BorderFlow clustering algorithm.Second, for each group, it uses the similar PageRank algorithm to score and rank comments, and selects top comments in each cluster as representation.At last, it ranks the selected comments by MMR algorithm and displays the top-K comments as the comments summarization.According to the experimental statics of NDCG and MAP data, the proposed method meets the intuitive sense of readers more.Meanwhile, it shows the better effectiveness and accuracy theoretically.

    参考文献
    相似文献
    引证文献
引用本文

师昕,赵雪青.新型的面向新闻评论摘要采集算法.计算机系统应用,2017,26(1):163-167

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-04-12
  • 最后修改日期:2016-05-19
  • 录用日期:
  • 在线发布日期: 2017-01-14
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号