摘要:譜聚類算法是一種可有效學習數據流形分布和非凸狀分布的聚類算法,但其過程涉及構建相似圖、特征分解等高計算復雜度步驟,難以直接用于大規模聚類.提出一種基于二部圖的快速聚類算法(fast clustering based on bipartite graph,FCBG),通過對數據采樣降低原有數據結構規模,然后基于二部圖學習采樣數據和原有數據關系.通過對二部圖對應的拉普拉斯矩陣施加秩約束,FCBG算法可在優化二部圖的邊的權重的同時,保持二部圖的類簇結構,最終直接給出聚類結果,不依賴構圖時每條邊的初始權重分配.算法計算復雜度與數據大小呈線性關系.實驗表明,FCBG算法可有效學部圖的權重,并在較少的時間消耗下獲得高質量的聚類結果.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社