摘要:孤立點檢測是數據挖掘的重要分支之一,旨在發現一個數據集中與多數對象行為明顯不同的一些對象.針對分類型矩陣數據,通過給出一種矩陣對象自身的內聚度和該矩陣對象與其他矩陣對象之間的耦合度,定義了矩陣對象的孤立因子,提出一種面向分類型矩陣數據的孤立點檢測算法.在Marketbasket、Microsoft web和MovieLens真實數據集上的實驗結果表明,與基于共同近鄰(common-neighbor-based,CNB)算法、局部異常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效檢測分類型矩陣數據中的孤立點.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社