基于余弦相似度和实例加权改进的贝叶斯算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家科技重大专项(2012ZX10004-301-609);国家自然科学基金(61472382,61272472,61232018)


Improved Naïve Bayes Algorithm Based on Weighted Instance with Cosine Similarity
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标. 针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法. 算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类. 基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.

    Abstract:

    Many classifiers cannot get good results facing numerous sample features, bayes algorithms get poor estimate of joint probability distribution with limited samples, effective similarity measure is needed to build a local classifier. Considering these problems, an improved multinomial Naïve Bayes algorithm based on weighted instances (IWIMNB) with cosine similarity is proposed. Taking different attributes contributing differently to the classification decision weight into account this algorithm uses cosine similarity as a metric of the similarity between training and validation instances. Selected training instances weighted by cosine similarity are used to train modified Naïve Bayes model. Results of final experiments show that the average classification accuracy of the proposed IWIMNB algorithm gets significant improvement.

    参考文献
    相似文献
    引证文献
引用本文

王行甫,付欢欢,王琳.基于余弦相似度和实例加权改进的贝叶斯算法.计算机系统应用,2016,25(8):166-170

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2015-12-19
  • 最后修改日期:2016-01-28
  • 录用日期:
  • 在线发布日期: 2016-08-16
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号