lunar：基于图神经网络统一局部异常检测算法

这种局部异常检测的方法，比如LOF，DBSCAN，KNN，在基于特征的非结构化的数据集上往往有不错的表现。基于神经网络的异常检测方法，由于有标注的异常点数据有限以及其主要是针对如图像数据的高维度结构化数据集的原因，在基于特征的低结构化数据集上的表现始终不尽人意。训练数据标准化至的范围。LUNAR在聚合时，并没有对k个近邻传来的信息采取统一的最大池化将其转化为一个最终信息，而是将这k个信息编码为一个

mnwl12_0

344人浏览 · 2023-08-10 10:37:07

mnwl12_0 · 2023-08-10 10:37:07 发布

2022上的论文《LUNAR: Unifying Local Outlier Detection Methods via Graph Neural Networks》提出了一种基于图神经网络进行异常检测的框架，统一了常见局部异常检测方法的同时，也一定程度上解决了局部异常检测算法超参数无法学习，难于优化的问题。

研究动机
提到异常检测算法，最常见的思路往往是基于局部近邻距离来判断样本点是否为异常点。这种局部异常检测的方法，比如LOF，DBSCAN，KNN，在基于特征的非结构化的数据集上往往有不错的表现。但是，这些算法普遍缺乏可学习的参数，这使得他们难以适应不同的数据集。同时由于异常检测算法往往是无监督学习，上述算法的超参数，比如KNN和LOF中k值的选取，很难基于表现进行调优，而这些超参数的影响又很大。因此，现有局部异常检测的方法很难在不同数据集中取得同样稳定的表现。

基于神经网络的异常检测方法，由于有标注的异常点数据有限以及其主要是针对如图像数据的高维度结构化数据集的原因，在基于特征的低结构化数据集上的表现始终不尽人意。目前缺乏一种在这一类数据的异常检测中表现优异且稳定的，具有一定可学习参数的算法模型。

解决的问题
作者首先提出了目前的局部异常检测算法在图神经网络(Graph Neural Networks)上的统一框架。之后，基于这个图神经网络的框架，作者提出了LUNAR(Learnable Unified Neighbourhood-based Anomaly Ranking)。凭借更多的可训练参数，LUNAR在多个数据集中的灵活度与适应性要强于现有的局部异常检测算法。在性能上和健壮性上，LUNAR也比传统的异常检测算法以及基于神经网络的异常检测算法表现更好。

所提的方法
引入图神经网络，将现有局部异常检测算法与图模型进行结合，从而得到一个统一的框架。

图神经网络(GNNs)