基于词共现和情感元素的突发话题检测算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Bursty Topic Detection Based on Word Co-Occurrence and Emotions
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    随着自媒体的迅速发展,微博中的舆情监控和舆情疏导成为一项重大的研究课题. 为了解决传统话题检测方法对于微博中大数据的分析往往具有复杂度高、实时性低、影响力小等问题,提出一种基于词共现和情感分析的突发话题检测方法. 通过研究微博中情感的突发和共现关系,从而建立情感子空间模型;通过该模型对微博中的信息流进行分类,最后对每个类别中的微博进行主题词提取,实现话题检测的目的. 在NLPIR微博内容语料库上的实验结果表明,该方法能够有效地从大规模微博信息中检测突发新闻,提高突发新闻的识别率.

    Abstract:

    With the rapid development of the We-Media, monitoring and guidance of public opinion becomes a significant research subject. Traditional topic detection methods in microblog data analytics encounters the problems of high computational complexity, low real-time and recall rate. An improved algorithm based on emotions and word co-occurrence detection is proposed in this paper aiming at solving these problems. It builds a emotional subspace model through co-occurrence relation of sentiment words in hot events, and classifies the flow of information in weibos. Finally, it gets the aim of topic detection via extracting the subject in the corresponding category. The experimental results carries out on the microblog content corpus of NLPIR and verifies that this method can effectively detect news topic from the massive microblog information and realize the news topic tracking.

    参考文献
    相似文献
    引证文献
引用本文

兰天,郭躬德.基于词共现和情感元素的突发话题检测算法.计算机系统应用,2016,25(8):101-108

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2015-12-09
  • 最后修改日期:2016-01-15
  • 录用日期:
  • 在线发布日期: 2016-08-16
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号