목록Research/Anomaly Detection (7)
숟가락 그만 얹어

그나마 건진 것들. 데이터셋에 따라 anomaly 종류에 따라 성능 잘 나오는 모델이 다르다. Classification approach와 reconstruction approach를 함께 활용해야 할 듯. Generalization이 잘 되면 오히려 detection 성능을 떨어뜨릴 수도 있기 때문에 여러 모델에 대해 실험을 해보고 판단하자. References [1] L. Ruff et al., A Unifying Review of Deep and Shallow Anomaly Detection, arXiv 2020

Deep SVDD의 semi-supervised setting이다. Unlabeled data는 대부분 normal인 것으로 가정하고 latent space에서 normal을 대표하는 centroid와 거리가 가까워지도록 모델을 학습한다. Centroid는 학습시킨 Autoencoder를 이용하여 training data에 대한 initial pass의 mean으로 설정한다. (왼쪽 term) Abnormal로 label된 data는 centroid에서 멀어지도록 학습한다. (중간 term) 이는 normal sample에 대해서는 entropy를 낮추는 효과가 있고 abnormal sample에 대해서는 entropy를 높이는 효과가 있다고 하는데, 사실 latent space를 Gaussian으로 가..

One-class classification, self-supervised learning, metric learning의 총집합. 1) One-class classification: 정상 데이터만으로 모델을 학습시켜 feature 공간에 투영시키는 사상. 2) Self-supervsied learning: input data에 transformation m을 가하고 어떤 m을 적용했는지 맞추는 self-supervised 모델을 학습한다. General data에 적용하기 위해 domain knowledge 기반의 transformation이 아닌, 학습되지 않는 random W와 b를 두고 Wx + b를 적용한다. Adversarial attack에 더 robust한 결과를 보여준다. (그냥 Gaus..

이상 패턴에 시계열적 특성이 (temporal dependency) 보인다면 window 방식으로 문제를 접근하는 것이 타당하다. 이때 window size를 어떻게 잡느냐에 따라 검출할 수 있는 이상 패턴이 달라지는데, 본 논문에서는 다양한 패턴을 검출하는 간단한 아이디어를 제시하였다. 예를 들어 30개의 센서 데이터에 대하여 3가지 window size를 정하고, 각각의 window에 대한 covariance matrix를 쌓는 것이다. 그러면 데이터의 차원이 time t에서 (30, 30, 3)이 되어 이미지처럼 CNN을 활용할 수 있다. t-4에서 t까지의 covariance matrix를 sequence 차원으로 쌓으면 최종 데이터의 input size는 (5, 30, 30, 3)이 되어 비디오..

PCA에서의 Explainable AI다. [1] 논문에서는 complete decomposition contribution (CDC), partial decompostition contribution (PDC), diagonal contribution (DC), reconstruction-based contribution (RBC), angle-based contribution (ABC)를 비교하고, 위 방법들에다가 relative contribution을 적용하는 방법을 제안하였다. Simulation study로 특정 센서에 임의로 fault를 일으켜 그 센서에서 contribution 값이 실제로 증가하는지를 실험/증명하였는데, CDC를 제외하고는 대체로 비슷한 성능을 보였다. CDC와 PDC만 ..

실험에 사용한 코드는 여기에... https://github.com/HanSangJun/Time-Series-Anomaly-Detection HanSangJun/Time-Series-Anomaly-Detection Time-series Anomaly Detection. Contribute to HanSangJun/Time-Series-Anomaly-Detection development by creating an account on GitHub. github.com 실험에 사용한 데이터셋은 Tennesse Eastman Process 2001이다. 이 데이터셋은 reactor, condenser, compressor, separator, stripper로 구성된 화학 공정을 모사하여 생성된 시뮬레이션 데..

데이터의 특성에 따라 anomaly detection, predictive maintenace, fault detection, one-class classification 등으로 불리는 이 문제는 정상 데이터만으로 모델링을 수행하고, 통계적 threshold를 설정하여 비정상 outlier를 검출하는 것이다. PCA로 모델링을 하면 특정 time t에서 센서 간의 관계성은 잘 반영하지만 (cross-correlation), 시간적인 변화 특성은 반영하지 못한다 (auto-correlation). 직접 실험을 해보면 이상 패턴이 연속적으로 여러 시간에 걸쳐서 나타나는 경우에는 PCA가 그리 효과가 없다. 이를 해결하기 위해 Dynamic PCA, CVA 같은 method는 covariance 계산 시 센서..