基于Hub的高维数据初始聚类中心的选择策略
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Hub-Based Initialization for K-hubs
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    针对基于Hub的聚类算法K-hubs算法存在对初始聚类中心敏感的问题, 提出一种基于Hub的初始中心选择策略. 该策略充分利用高维数据普遍存在的Hubness现象, 选择相距最远的K个Hub点作为初始的聚类中心. 实验表明采用该策略的K-hubs算法与原来采用随机初始中心的K-hubs算法相比, 前者拥有较好的初始中心分布, 能够提高聚类准确率, 而且初始中心所在的位置倾向于接近最终簇中心, 有利于加快算法收敛.

    Abstract:

    K-hubs is a Hub-based clustering algorithm that is very sensitive to initialization. Therefore, this paper proposes an initialization method based on Hub to solve this problem. The initialization method takes full use of the feature of the Hubness phenomenon by selecting initial centers that are the most remote Hub points with each other. The experimental results show that compared with the random initialization of ordinary K-hubs algorithm, the proposed initialization method can obtain a better distribution of initial centers, which could enhance the clustering accuracy; moreover, the selected initial centers can appear near the cluster centers, which could speed up the convergence of the clustering algorithm.

    参考文献
    相似文献
    引证文献
引用本文

张巧达,何振峰.基于Hub的高维数据初始聚类中心的选择策略.计算机系统应用,2015,24(4):171-175

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2014-07-31
  • 最后修改日期:2014-09-28
  • 录用日期:
  • 在线发布日期: 2015-04-24
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号