聚类集成研究再突破! 山西大学人工智能研究团队取得新进展
近期,我校智能信息处理研究所人工智能研究团队在聚类集成研究方面取得重要进展,相关成果“Self-ConstrainedClusteringEnsemble”发表在人工智能领域国际顶级期刊IEEETransactionsonPatternAnalysisandMachineIntelligence(简称TPAMI,影响因子:18.6)。该论文第一作者为魏巍教授,通讯作者为梁吉业教授,第二作者为2023级博士生吴建国,合作者为2022级博士生闫京、中北大学讲师郭鑫垚。
作为人工智能的核心方向之一,无监督学习致力于让机器从未标注数据中自动发现潜在规律,是实现机器智能突破的关键。聚类分析作为该领域的基础方法,能够从复杂数据中有效挖掘内在结构、识别隐藏模式,从而为知识发现与智能决策提供重要支撑。聚类集成通过融合多个基聚类结果,可显著提升聚类效果的稳定性和鲁棒性。然而,现有方法大多采用“一次性融合基聚类”的模式,既难以动态适配复杂高维数据的非线性结构,也易受低质量基聚类的干扰。为此,研究团队首创了一种迭代式聚类集成新范式(见图1),通过动态挖掘成对约束实现度量学习与聚类集成过程的协同优化,并据此迭代生成判别性更强的基聚类,从而显著提升了复杂数据聚类的精度。研究成果可为大数据分析处理提供重要技术支撑。
在多个公开数据集上的实验验证表明,所提方法在聚类精度上优于代表性的聚类集成方法(见图2),特别是在不同集成规模下,仍保持优异聚类性能(见图3)。
图2.聚类精度(ACC)对比
图3.不同集成规模下的聚类精度(ACC)平均表现
该研究工作得到计算智能与中文信息处理教育部重点实验室、国家自然科学基金项目(62276160)、山西省基础研究计划项目(202203021211291,202303021222030)、山西省留学人员科技活动项目(20240002)等支持。
据悉,IEEETransactionsonPatternAnalysisandMachineIntelligence(TPAMI)于1979年建刊,是国际上公认的人工智能领域顶级期刊,同时也被中国计算机学会(CCF)推荐为人工智能领域的A类期刊,主要刊登人工智能领域的高质量前沿研究成果。山西大学