Journal of Korea Robotics Society
[ ARTICLE ]
The Journal of Korea Robotics Society - Vol. 20, No. 3, pp.388-395
ISSN: 1975-6291 (Print) 2287-3961 (Online)
Print publication date 29 Aug 2025
Received 25 Apr 2025 Revised 13 Jul 2025 Accepted 24 Jul 2025
DOI: https://doi.org/10.7746/jkros.2025.20.3.388

베이지안 필터를 활용한 시계열 변화점 탐지 기법

박성식
Change Point Detection using Bayesian Filter
Seongsik Park

Correspondence to: Assistant Professor, Corresponding author: Division of Advanced Engineering, Korea National Open University (KNOU), Seoul, Korea ( spark88@knou.ac.kr)

CopyrightⓒKROS

Abstract

This paper presents a novel Bayesian filter-based method for change point detection (CPD) in time series, targeting robotic systems operating in noisy and dynamic environments. Unlike traditional CPD methods such as PELT, Binary Segmentation, Bottom-Up, and Window-based approaches that often miss subtle or gradual transitions, the proposed method probabilistically models steady and transient states and evaluates their relative dominance using a log-posterior ratio. The method enhances signal changes by applying gradient computation, anomaly scoring based on median absolute deviation (MAD), and adaptive thresholding. Final detections are refined through clustering to suppress false positives. Extensive experiments on both synthetic (Blocks, Bumps) and real-world datasets (NAB EC2, ECG5000) confirm the method’s superior F1-score and robustness compared to baseline methods. Moreover, its lightweight and real-time-capable design enables effective deployment in embedded robotic systems.

Keywords:

Bayesian Filtering, Change Point Detection (CPD), Time Series Analysis

1. 서 론

최근 로봇 시스템의 활용 범위가 점차 확대됨에 따라, 시스템의 변화점 탐지(change point detection, CPD) 또는 이상 탐지(anomaly detection)에 대한 중요성이 크게 부각[1,2]되고 있다. 산업용 로봇, 자율주행 차량, 의료용 로봇, 드론과 같은 다양한 응용 분야에서 로봇은 복잡하고 동적인 환경 속에서도 높은 수준의 신뢰성과 안전성을 유지해야 한다. 그러나 실제 환경에서는 예기치 못한 장애, 부품의 점진적 마모, 센서 오류, 외부 충격 등 다양한 요인으로 인해 시스템 이상이 발생할 수 있다. 이러한 이상을 조기에 탐지하고 대응하는 것은 로봇 시스템의 안정적 운영과 작업 효율성 확보를 위해 필수적이다.

특히, 로봇 시스템에서는 고장이나 이상이 갑작스럽게 발생하는 경우가 많다. 센서 신호, 제어 입력, 동작 패턴 등에서 순간적인 변동이 나타나며, 이는 시스템 성능 저하나 안전 문제로 직결될 수 있다. 그러나 로봇의 동작 환경은 다양한 잡음(baseline noise)과 미세한 신호 변동을 포함하고 있어, 정상 동작과 실제 이상을 구분하는 것이 매우 어렵다. 이러한 급격한 변화(abrupt changes)를 빠르고 정확하게 탐지하기 위해서는, 단순한 threshold 기반 모니터링을 넘어, 시계열 데이터 내의 통계적 특성 변화, 즉 변화점(change point)을 정밀하게 포착할 수 있는 기법이 요구된다.

이러한 요구를 충족시키기 위해, 변화점 탐지 기술이 주목받고 있다. 변화점 탐지는 시계열 데이터 내에서 통계적 특성이 변하는 시점을 자동으로 식별하는 방법으로, 이상 징후가 발생하는 초기 변화를 포착하는 데 특히 유용하다. 로봇 시스템에서는 센서 출력, 동작 패턴, 에너지 소비량, 네트워크 통신 데이터 등 다양한 시계열 데이터에서 이상을 탐지해야 하므로, 변화점 탐지 기술의 적용 가능성은 매우 높다.

기존 CPD 기법으로는 Pruned Exact Linear Time (PELT) 알고리즘[3], 이진 분할(Binary Segmentation)[4], Bottom-Up 분할[5], 윈도우 기반(Window-Based) 방법[6], 그리고 Dynamic Programming (Dynp) 기반 방법[7] 등이 제안되어 왔다. 이들 방법은 계산 효율성, 전역 최적화, 단순성 등의 장점으로 인해 널리 사용되어 왔으나, 실제 환경에서는 다음과 같은 한계가 존재한다. 첫째, 기존 알고리즘들은 일반적으로 precision(정밀도)는 높은 반면, recall(재현율)이 낮은 경향이 있으며, 이는 실제 이상 탐지를 놓치는 경우가 많음을 의미한다. 둘째, 센서 데이터에 내재된 높은 잡음(noise), 점진적 변화(gradual drift), 복합적인 동적 특성 (dynamic variability)은 기존 방법의 탐지 민감도와 정확도를 저하시킨다. 셋째, 변화 강도가 크지 않은 이상 징후에 대해서는 탐지 실패나 오탐(false positive)이 빈번하게 발생할 수 있다.

이러한 문제점을 해결하기 위해, 본 연구에서는 베이지안 필터링(Bayesian Filtering) 기법을 기반으로 한 새로운 변화점 탐지 방법을 제안한다. 제안하는 방법은 정상 상태(steady-state)와 과도 상태(transient-state)를 경쟁시키는 확률 모델을 활용하여, 현재 신호가 어느 상태에 더 가까운지를 지속적으로 평가함으로써 변화점을 탐지한다. 또한, 본 기법은 입력 신호의 확률적 특성을 동적으로 추정하고 사전 정보(prior)를 지속적으로 갱신함으로써, 잡음이 많은 환경에서도 미세한 이상 징후에 민감하게 반응한다. 이를 통해 노이즈에는 강인하면서도 변화에는 민감한 탐지가 가능하다. 경량화된 구조와 낮은 계산 복잡도를 통해 실시간 적용이 가능하며, 자원이 제한된 임베디드 로봇 시스템에도 적합하도록 설계되었다.

본 논문에서는 다양한 공개 시계열 데이터셋을 활용하여, 제안하는 베이지안 필터 기반 CPD 기법과 기존 대표 기법들(PELT, Binary Segmentation, Bottom-Up, Window-Based 등) 간 성능 비교 실험을 수행하였다. 특히, 실제 로봇 이상 상황을 모사한 데이터셋을 포함하여, 변화 강도, 잡음 수준, 변화 패턴 다양성 등을 고려한 다각적인 실험을 설계하였다. 실험 결과, 제안하는 베이지안 필터는 기존 기법 대비 전반적으로 높은 탐지 성능을 보였으며, 특히 미세 변화 및 잡음 환경에서 강건한 특성을 나타냈다.

본 논문의 주요 기여는 다음과 같다. 첫째, 로봇 시스템의 이상 탐지에 최적화된 베이지안 필터 기반 변화점 탐지 기법을 제안하였다. 둘째, 다양한 시나리오를 고려한 체계적 실험을 통해 제안 기법의 우수성을 검증하였다. 셋째, 실시간 적용성과 경량화 측면에서 기존 CPD 기법 대비 높은 실용성을 확보하였다.

제안한 베이지안 필터 기반 변화점 탐지 기법은 제조 공정 내 로봇 시스템의 상태 감시 및 이상 진단 분야에도 효과적으로 적용될 수 있다. 예를 들어, 협동로봇의 조립 작업 중 토크, 위치, 속도 등의 센서 신호를 실시간으로 모니터링함으로써 비정상 상태나 공정 이상을 조기에 탐지하고, 정비 시점이나 제어 파라미터를 사전에 조정하는 데 활용될 수 있다. 또한, 본 방법은 사전 학습이 불필요하고 계산량이 적은 구조로 설계되어 있기 때문에, 제어기 내 실시간 내장 적용이 가능하며, 불확실성이 높은 제조 환경에서도 민감도와 신뢰도를 유지한 변화 탐지가 가능하다는 점에서 스마트팩토리 및 자율제어 기반 제조 시스템에 직접적으로 활용될 수 있다.

이 논문의 구성은 다음과 같다. 제2장에서는 실험 설정과 데이터셋 구성 방법을 설명한다. 제3장에서는 실험 결과를 분석하고, 제4장에서는 본 연구의 결론과 향후 연구 방향을 제시한다.


2. 방 법

본 연구에서는 베이지안 필터링(Bayesian Filtering) 기법을 기반으로 한 새로운 변화점 탐지 방법을 [Fig. 1]과 같이 제안한다. 제안하는 방법은 정상 상태(steady-state)와 과도 상태(transient-state)를 경쟁시키는 확률 모델을 활용하여, 현재 신호가 어느 상태에 더 가까운지를 지속적으로 평가함으로써 변화점을 탐지한다. 또한, 본 기법은 입력 신호의 확률적 특성을 동적으로 추정하고 사전 정보(prior)를 지속적으로 갱신함으로써, 잡음이 많은 환경에서도 미세한 이상 징후에 민감하게 반응한다. 이와 같은 구조는 잡음에는 강인하면서도 변화에는 민감하게 반응할 수 있는 탐지를 가능하게 한다. 또한 동일한 하드웨어 환경에서 여러 알고리즘을 반복 실행해본 결과, 제안한 기법은 타 방법에 비해 상대적으로 적은 연산 자원을 사용하면서도 실시간 처리에 적합한 실행 속도를 보여주었다.

[Fig. 1]

Overall pipeline comprising Bayesian filtering with transient and steady-state filters, estimation of their probabilistic difference, and post-processing to produce the final CPD detection output

2.1 Bayesian filter

Bayesian filter는 표면 근전도 신호의 기저 잡음으로부터 발화만을 정확하게 감지하기 위해, 신호를 입력으로 받아 서로 다른 확률 모델을 기반으로 한 두 개의 Bayesian 필터를 구성하여 각각 신호의 전이 상태(transient)와 정상 상태(steady)를 추정[8]한다. 두 필터는 동일한 Bayesian 업데이트 구조를 따르되, steady 필터는 확산 방정식을 기반으로 하여 시간에 따라 점진적으로 퍼지는 분포 ptsteady(x)를 따르며, transient 필터는 여기에 추가적으로 균등 분포 항을 포함시켜 급격한 신호 변화를 반영한 pttrans(x)를 따른다. 이로 인해 steady 필터는 완만한 신호 변화를 상쇄하나 급격한 전이에는 느리게 따라가는 양상을 보이는 반면, transient 필터는 급격한 전이 발생 시 빠른 반응을 보인다. 이러한 차이는 [Fig. 2]에서도 확인할 수 있다.

[Fig. 2]

Detection of change points based on the moment a significant difference emerges between transient and steady-state filter responses

ptsteadyxt=α2ptsteadyxx2pttransxt=α2pttrans (x)x2+βUx-pttransxx^tsteady=argmaxptsteadyxx^ttrans=argmaxpttransx(1) 

두 필터는 각각 사전 확률(prior)과 관측 우도(likelihood)를 이용해 사후 확률(posterior)을 계산한다. 이렇게 계산된 두 필터의 사후 확률 값 간의 비율(log-posterior ratio)은 현재 시점의 신호가 전이 상태에 가까운지를 나타내는 척도로 정의된다. 이 확률비가 양수일수록 transient 상태가 우세하며, 음수일수록 steady 상태가 우세함을 의미한다. 제안된 확률 기반 지표는 단일 시점에서도 온라인으로 계산이 가능하며, 추가적인 학습 없이도 변화점을 실시간으로 감지할 수 있다.

2.2 Bayesian filter 기반의 변화점 탐지

앞서 언급한 Bayesian 필터링 기반 기법은 원래 근전도의 발화(onset) 탐지를 위해 개발되었으나, 본 연구에서는 이를 변화점(change point) 탐지 목적으로 확장하여 적용하였다. 제안하는 방법은 입력 신호에 대해 transient 상태와 steady 상태를 확률적으로 분리 모델링한 두 개의 Bayesian 필터를 적용하고, 이들 필터의 사후 확률 간의 로그 비율(log-posterior ratio) rt을 계산함으로써 신호의 상태 전이를 정량화한다.

rt=logpttransx^ttrans+ϵptsteadyx^tsteady+ϵ(2) 

변화점 탐지를 위한 후처리 단계는 다음과 같은 세 가지 주요 처리 과정으로 구성되며 [Fig. 3]은 각 단계별 결과물을 보여주고 있다. 첫째, 구한 log-posterior ratio 시퀀스에 대해 시간에 따른 1차 미분(gradient)을 수행하고, 그 절댓값을 취함으로써 신호의 국소적인 급격한 변화 정도를 gt로 수치화한다. 이 연산은 작은 신호 차이보다는 순간적인 변화율의 크기를 강조하여 민감한 구간을 부각시키는 역할을 한다.

[Fig. 3]

Values computed at each stage of the method and the corresponding final output

gt=drtdtrT-rt-1(3) 

둘째, 이렇게 얻어진 변화율 시퀀스에 대해 relative madness 함수 MAD(g)를 적용한다. 이는 전체 시계열에서의 변화율의 상대적 이상도(anomalous fluctuation)를 계량화하는 방식으로, median absolute deviation (MAD)을 기반으로 정규화된 이상 탐지 지표이다. 결과적으로 각 시점마다 변화율이 주변 구간과 비교해 얼마나 튀는지를 표현한 척도가 생성된다.

mt=gt-g~tMADg+ϵ(4) 
g~=mediang(5) 
MADg=mediangt-g~(6) 

셋째, 계산된 이상도 값들 중 상위 2% 수준의 adaptive threshold θ를 기준으로 하여, 임계값을 초과하는 구간을 잠재적인 변화점 후보로 선택한다. Treshold를 일정하게 고정하여 이 설정값에 탐지 결과가 민감하게 반응하는 것을 방지하기 위하여, 고정된 값이 아닌 시계열의 통계적 분포에 따라 자동 조정되므로 다양한 데이터 특성에 대해 유연하게 대응할 수 있다. 상위 2%로 설정한 기준은 이론적 근거에 기반한 것은 아니고 다양한 실험을 통해 경험적으로 설정한 값임을 밝힌다.

θ=percentilemt window,98(7) 
S=tmt>θ(8) 

마지막으로, 선택된 스파이크(spike) 지점들 S는 군집화되어, 공간적으로 인접하거나 중복되는 탐지 결과를 하나의 의미 있는 변화점 C로 통합한다. 이 과정을 통해 false positive를 억제하고, 연속적인 이상 구간을 구조적으로 정제하여 단일한 변화 이벤트로 표현할 수 있도록 한다.

C=clusterS(9) 

이러한 일련의 후처리 과정은 Bayesian 확률 기반 지표, 변화율 기반 민감도 강조, 이상도 기반 탐지 기준 설정, 그리고 군집 기반 정제 전략을 통합하여, 신호의 크기나 노이즈 수준과 무관하게 변화의 구조적 의미를 강조하는 방식으로 설계되었다. 결과적으로, 제안한 방법은 미세한 동적 변화나 단발성 이상에 민감하게 반응하면서도, 안정적인 오탐 억제와 실시간 적용 가능성을 모두 만족시키는 강건한 변화점 탐지 성능을 기대할 수 있다.

2.3 비교 대상 변화점 탐지 기법

비교 대상으로 설정된 변화점 탐지 기법으로는 PELT (Pruned Exact Linear Time), Binary Segmentation, Bottom-Up Segmentation, 그리고 윈도우 기반 방법(window-based methods)이 있다. PELT는 비용 함수와 변화점 수에 대한 패널티 항을 기반으로 전체 구간에서 최적의 변화점 조합을 탐색하며, pruning 기법을 적용하여 효율적인 계산을 가능하게 한다. Binary Segmentation은 전체 신호 구간에서 가장 큰 변화가 발생한 지점을 탐지한 후, 이를 기준으로 구간을 분할하고 동일한 과정을 반복하는 방식으로 동작한다. 변화점이 명확히 분리되어 있는 경우 빠르게 탐지가 가능하지만, 다중 변화점 간의 상호작용을 반영하지 못하는 한계가 있다. Bottom-Up Segmentation은 초기 신호를 매우 작은 세그먼트 단위로 분할한 뒤, 인접한 세그먼트를 병합해가며 구조를 재구성하는 방식이다. 세밀한 변화 탐지에는 유리하지만 계산 비용이 상대적으로 크다. 윈도우 기반 방법은 고정 또는 슬라이딩 윈도우 내에서 통계량의 변화를 비교함으로써 변화점을 감지하는 방식으로, 구현이 간단하고 직관적이라는 장점이 있지만 윈도우 크기에 따라 성능이 민감하게 달라질 수 있다.


3. 실 험

3.1 실험 설정

본 연구에서는 제안하는 베이지안 필터 기반 변화점 탐지 기법(Bayesian Filter)의 성능을 다양한 시계열 환경에서 검증하고, 기존의 대표적인 CPD(변화점 탐지) 알고리즘과 비교 평가하였다. 사용된 데이터셋은 크게 두 범주로 구분된다. 첫째, Blocks와 Bumps 데이터는 비정상성을 포함한 인공 시계열로, 특정 위치에 변화점이 존재하도록 설계되어 있어 정량적 평가에 적합하다. 둘째, UCR의 EC2와 UCR ECG5000[9]은 실제 이상 탐지 시나리오를 반영한 실세계 시계열 데이터로, 아마존 EC2 서버 인스턴스에서 측정된 시스템 지표나 성능 상태 변화 데이터 및 실제 심장 박동으로부터 측정한 심전도(ECG) 의료 데이터로 각각 이루어져 있으며, 노이즈와 복잡한 패턴이 혼재되어 있어 알고리즘의 일반화 성능을 검증하기에 적합하다.

모든 기법은 동일한 사전 설정 하에 평가되었으며, 성능 평가지표로는 Precision, Recall, F1-score를 사용하였다. 변화점과 실제 이상이 ±5 프레임 내에서 일치할 경우 정탐(True Positive)으로 간주하였고, 탐지 개수가 적거나 과도한 경우에 대한 분석도 함께 수행하였다.

3.2 성능 비교 결과

[Table 1]은 데이터셋별로 다섯 가지 변화점 탐지 기법의 Precision, Recall, F1-score를 비교한 결과이다. 특히 F1-score는 Precision과 Recall의 조화 평균으로, 실질적인 탐지 효율을 판단하는 데 가장 중요한 기준으로 사용된다.

Comparison of CPD performance across different datasets and detection methods

3.2.1 Blocks 및 Bumps(인공 시계열)

Blocks 데이터는 계단형 전이(step-like change)가 명확히 존재하는 이상 구조를 가지고 있다. 대부분의 기법이 높은 Recall을 기록했지만, 제안 기법은 Precision 0.500, Recall 1.000, F1-score 0.667로 탐지율과 정확도 간 균형을 가장 안정적으로 확보하였다. Binseg는 모든 변화점을 정확히 맞추어 F1-score 1.000을 기록했으나, 이는 변화점 수가 고정되어 있어 조정이 쉬운 단순 구조에서 유리하게 작동하는 결과로 해석된다.

Bumps는 짧은 주기로 변화가 연속적으로 발생하는 패턴을 가지며, 상대적으로 전이 감지가 어려운 환경이다. 제안 기법은 F1-score 0.722로 가장 높은 성능을 기록하였으며, 이는 transient 상태를 빠르게 포착하는 베이지안 필터 구조의 강점을 잘 보여준다. 반면, PELT와 Bottom-Up은 변화점의 개수가 많아질수록 Precision은 높게 유지되나 Recall이 급격히 감소하여 탐지 누락이 빈번하였다.

3.2.2 UCR EC2 및 ECG5000(현실 기반 시계열)

UCR EC2는 AWS 서버 모니터링 로그 기반의 실제 시계열 데이터로, 이상 징후가 잡음에 의해 희석되는 경향이 있다. 제안 기법은 Precision 0.515, Recall 0.531, F1-score 0.523로, 기존 방법에 비해 안정적인 탐지 성능을 유지하였다. 특히, Binseg는 해당 데이터에서 완전히 실패(0점)하였으며, 이는 계단형이 아닌 점진적 전이 변화에 민감하지 못한 구조에서 기인한다.

ECG5000은 의료용 심전도 데이터로, 극히 희소한 이상 구간을 포함한다. 모든 알고리즘에서 낮은 Recall이 공통적으로 관찰되었고, 이는 변화 강도가 미미하거나 전이 구간이 짧은 이상 구조가 탐지하기 어렵기 때문으로 보인다. 그럼에도 제안 기법은 Recall 0.055를 기록하며 의미 있는 이상 구간을 일부 포착하였다.

3.3 평균 성능 분석

[Fig. 4]는 모든 데이터셋을 종합하여 계산한 평균 성능을 나타낸다. 제안 기법은 Precision 0.563, Recall 0.551, F1-score 0.502로 Precision과 Recall 간 균형이 가장 우수한 성능을 나타냈다. 반면, 기존 기법들은 Precision은 높게 유지되었으나, Recall이 낮아 실제 이상 탐지 누락이 빈번했다. 예를 들어, PELT는 평균 Precision 0.680에도 불구하고 Recall은 0.462에 불과하여 과잉 필터링에 의한 과소 탐지 경향이 강하게 나타났다.

[Fig. 4]

Summary of average precision, recall, and F1-score evaluated over the full dataset (sorted by F1-score in descending order)

이는 제안 기법이 확률 기반으로 transient와 steady 상태를 실시간 비교하여, 미세한 전이 변화에 대해 상대적으로 민감하게 반응하기 때문이며, 동시에 adaptive thresholding과 군집화 후처리를 통해 오탐지 가능성을 효과적으로 억제하였음을 의미한다.

3.4 분석 및 고찰

[Fig. 5]와 [Fig. 6]은 각각 UCR EC2 및 ECG5000 데이터셋에 대해 실제 변화점(Ground Truth)과 각 탐지 기법에 의해 식별된 변화점을 시계열 상에 시각화한 예시를 보여준다. 이들 그림은 정량적 지표로는 확인하기 어려운 탐지 위치의 정렬 품질, 민감도, 그리고 오탐지 여부 등을 직관적으로 파악할 수 있는 근거를 제공한다.

[Fig. 5]

Visualization of ground truth change points (red) and detected change points by each method (green) on the time series – UCR EC2 dataset

[Fig. 6]

Visualization of ground truth change points (red) and detected change points by each method (green) on the time series – UCR ECG5000 dataset

[Fig. 5]에 제시된 UCR EC2 데이터셋은 실제 서버 운영 환경에서 수집된 시계열로, 점진적인 변화와 높은 노이즈 수준이 복합적으로 나타나는 특성을 가진다. 이러한 환경에서는 탐지 알고리즘의 민감도와 정렬 정확도가 동시에 요구되며, 기존 기법들은 변화점을 과도하게 탐지하거나 실제 변화점과의 정렬이 불완전한 경우가 다수 발생하였다. 특히 Binary Segmentation과 Bottom-Up 방법은 탐지 개수가 과도하거나 위치가 일관되지 않았고, PELT는 변화점 수는 적절하였으나 일정한 위치 오차가 관찰되었다. 반면, 제안한 Bayesian filter는 실제 변화점과 근접한 위치에서 안정적으로 탐지되었으며, 불필요한 오탐지를 최소화하면서 변화의 구조적 전이를 포착하였다. 이는 transient와 steady 상태 간의 확률적 비교를 기반으로 하여, 변화율에 대한 민감도를 강화한 설계가 잡음 환경에서도 효과적으로 작동함을 시사한다.

[Fig. 6]은 ECG5000 데이터셋을 대상으로 하며, 이는 심전도 기반 이상 탐지용 시계열로 변화점이 극히 희소하고 미세한 전이로 나타나는 것이 특징이다. 대부분의 기존 탐지 알고리즘은 본 데이터셋에서 유의미한 탐지를 거의 수행하지 못하거나, 산발적인 오탐지만을 생성하는 경향을 보였다. Bayesian filter 또한 모든 실제 변화점을 포착하지는 못했으나, 일부 변화점에 대해서는 근접 탐지를 수행하였고, 불필요한 탐지를 억제함으로써 비교적 우수한 탐지 품질을 보여주었다. 이는 로그 가능도 비율의 시간 변화율을 기반으로 한 민감도 강조와, MAD 기반의 이상도 정량화 기법이 미세한 이상이나 전이가 발생하는 구간에서 효과적으로 작용했기 때문으로 해석된다. 그러나 ECG 5000과 같이 이상 구조가 희소하고 불명확한 데이터셋에 대해서는, 탐지 민감도를 보완하기 위한 후처리 기법의 개선 또는 다중 해석 스케일(multiscale analysis) 도입 등이 필요하다.

이러한 시각적 분석은 정량 지표(F1-score 등)만으로는 드러나지 않는 탐지 결과의 정렬 정확도 및 탐지의 일관성을 평가하는 데 유용하며, 제안 기법이 구조적 변화 탐지에서 기존 방법들 대비 우수한 성능을 보인다는 점을 뒷받침한다. 정성적 관찰에 따르면 기존 기법들은 특정 형태의 변화 패턴에 과도하게 반응하거나, 일정한 구조 이외의 전이 유형에 대해 민감하게 반응하지 못하는 경향이 있다. 특히 Binary Segmentation과 Bottom-Up 방식은 탐지 개수나 분할 구조가 고정되어 있어 잡음이나 이상치에 대한 적응력이 떨어지는 것으로 확인되었다. 반면, 제안 기법은 전처리 없이도 사후 확률의 비교 및 시간적 변화율 분석을 기반으로 이상 시점을 정의함으로써, 다양한 형태의 이상 구조에 대해 유연하게 대응하는 구조적 강점을 가진다. 이는 불확실성이 내재된 실제 응용 환경에서의 신뢰성 있는 변화 탐지를 위한 효과적인 접근 방식으로 평가될 수 있다.

3.5 오탐지 사례에 대한 분석

[Fig. 7]은 제안한 Bayesfilter 기법이 생성한 오탐지(false positive) 사례들을 시계열 상에 시각화한 예시를 보여준다. 이 그림은 정량적 성능 지표로는 식별하기 어려운, 잘못된 변화점 탐지의 양상과 원인을 직관적으로 이해하는 데 도움을 준다.

[Fig. 7]

Examples of false detections produced by the proposed method

분석 결과, 오탐지는 주로 두 가지 유형에서 발생하는 경향을 보였다. 첫째, 신호의 급격한 진폭 변화 또는 잡음의 국소적 증가가 발생한 시점에서 transient-state 필터가 과도하게 반응하여 log-posterior ratio가 일시적으로 증가하고, 이로 인해 adaptive threshold를 초과하는 이상도로 잘못 분류되는 경우이다. 이러한 오탐지는 주로 고주파 잡음이나 진폭 이상이 짧게 나타나는 환경에서 빈번히 발생하였다. 둘째, 다중 변화점이 인접해 있는 구간에서는 후처리 과정의 군집화(clustering)가 충분히 이루어지지 않거나, MAD 기반 이상도 정량화 과정에서 일부 미세한 변화가 독립된 변화점으로 분리되어 탐지되는 사례도 확인되었다.

이러한 오탐지들은 시스템의 안정성과 탐지 신뢰도에 부정적인 영향을 줄 수 있기 때문에, 향후 개선이 필요한 핵심 영역으로 간주된다. 특히 단발성 이상이 과도하게 강조되는 구조적 민감도를 완화하기 위한 보정 전략으로, 후처리 단계에서의 스무딩 기법, 이중 임계값(double-thresholding), 또는 다중 해석 스케일 기반 필터링(multiscale filtering) 등의 적용 가능성이 제기된다. 또한 오탐지를 실제 시스템 경보로 연결하기 전에, 이들 탐지 결과에 대한 후속 검증 단계(예: 도메인 기반 의미 필터링)를 도입하는 것도 유효한 방안으로 고려될 수 있다.

[Fig. 7]은 제안 기법의 한계와 향후 개선 방향을 시각적으로 제시함으로써, 변화 탐지 알고리즘 설계에서 민감도와 특이도 간 균형의 중요성을 다시금 환기시킨다.


4. 결 과

본 연구에서는 베이지안 필터링 기법을 기반으로 한 새로운 변화점 탐지 방법을 제안하고, 이를 다양한 시계열 데이터셋에 적용하여 로봇 시스템에서의 이상 탐지 성능을 정량적으로 분석하였다. 제안하는 기법은 정상 상태와 과도 상태를 각각 확률적으로 모델링하고, 두 상태 간의 경쟁 구조를 통해 변화점을 평가함으로써 기존의 변화점 탐지 알고리즘들이 놓치기 쉬운 미세한 변화나 점진적 이상도 효과적으로 탐지할 수 있도록 설계되었다.

다양한 공개 시계열 데이터셋(Blocks, Bumps, UCR EC2, ECG5000)을 활용한 실험 결과, 본 기법은 PELT, Binary Segmentation, Bottom-Up, Window-Based 방법 등 기존 대표 알고리즘들과 비교하여 전반적으로 우수한 탐지 성능을 나타냈다. 특히 변화 강도와 전이 형태가 다양하거나 잡음이 많은 환경에서도 높은 민감도와 강건성을 동시에 확보하였으며, 인공 및 현실 기반 데이터셋 모두에서 F1-score 기준으로 가장 안정적인 성능을 보였다. 이는 베이지안 필터 기반 구조가 신호의 절대 크기보다는 상태 전이의 구조적 특성에 민감하게 반응하도록 설계된 결과로 해석할 수 있다.

또한, 제안 기법은 사전 학습 없이도 실시간 탐지가 가능하며, 자원이 제한된 임베디드 로봇 시스템과 같은 환경에서도 효과적으로 적용될 수 있음을 실험적으로 입증하였다. 이러한 특성은 로봇 제어, 센서 기반 이상 탐지, 시계열 진단 시스템 등 다양한 실시간 환경에서의 활용 가능성을 뒷받침한다. 향후 연구에서는 고차원 시계열 데이터에 대한 확장, 멀티 센서 융합 기반의 변화 탐지, 하이퍼파라미터의 자동 조정 기법 등을 통해 제안 기법의 실용성과 일반화를 더욱 강화할 계획이다.

Acknowledgments

This research was supported by Korea National Open University Research Fund.

References

  • S. Salimpour, J. P. Queralta, and T. Westerlund, “Self-calibrating anomaly and change detection for autonomous inspection robots,” 2022 Sixth IEEE International Conference on Robotic Computing (IRC), Italy, pp. 207-214, 2022. [https://doi.org/10.1109/IRC55401.2022.00042]
  • A. Arunan, Y. Qin, X. Li, and C. Yuen, “A change point detection integrated remaining useful life estimation model under variable operating conditions,” Control Engineering Practice, vol. 144, Mar., 2024. [https://doi.org/10.1016/j.conengprac.2023.105840]
  • R. Killick, P. Fearnhead, and I. A. Eckley, “Optimal detection of changepoints with a linear computational cost,” Journal of the American Statistical Association, vol. 107, no. 500, pp. 1590-1598, 2012. [https://doi.org/10.1080/01621459.2012.737745]
  • P. Fryzlewicz, “Wild binary segmentation for multiple change-point detection,” The Annals of Statistics, vol. 42, no. 6, pp. 2243-2281, Dec., 2014. [https://doi.org/10.1214/14-AOS1245]
  • E. Keogh, S. Chu, D. Hart, and M. Pazzani, “An online algorithm for segmenting time series,” 2001 IEEE International Conference on Data Mining, San Jose, CA, USA, pp. 289-296, 2001. [https://doi.org/10.1109/ICDM.2001.989531]
  • K. S. Riedel, “Detection of abrupt changes: theory and application,” Technometrics, vol. 36, pp. 326-327, 1994. [https://doi.org/10.1080/00401706.1994.10485821]
  • I. E. Auger and C. E. Lawrence, “Algorithms for the optimal identification of segment neighborhoods,” Bulletin of Mathematical Biology, vol. 51, no. 1, pp. 39-54, Jan., 1989. [https://doi.org/10.1007/BF02458835]
  • S. Park and K. Kim, “Bayesian onset measure of sEMG for fall prediction,” Journal of Korea Robotics Society, vol. 19, no. 2, pp. 213-220, May, 2024. [https://doi.org/10.7746/jkros.2024.19.2.213]
  • H. A. Dau, A. Bagnall, K. Kamgar, C.-C. M. Yeh, Y. Zhu, S. Gharghabi, C. A. Ratanamahatana, and E. Keogh, Abdullah and Batista, Gustavo, and Hexagon-ML, “The UCR time series classification archive,” IEEE/CAA Journal of Automatica Sinica, vol. 6, no. 6, pp. 1293-1305, Nov., 2019. [https://doi.org/10.1109/JAS.2019.1911747]
박 성 식

2010 서울대학교 기계항공공학(학사)

2019 POSTECH 기계공학(박사)

2020~2023 동국대학교 조교수

2023~현재 한국방송통신대학교 조교수

관심분야: 머신 러닝, 신호 처리, 로봇 제어, 컴퓨터 비전

[Fig. 1]

[Fig. 1]
Overall pipeline comprising Bayesian filtering with transient and steady-state filters, estimation of their probabilistic difference, and post-processing to produce the final CPD detection output

[Fig. 2]

[Fig. 2]
Detection of change points based on the moment a significant difference emerges between transient and steady-state filter responses

[Fig. 3]

[Fig. 3]
Values computed at each stage of the method and the corresponding final output

[Fig. 4]

[Fig. 4]
Summary of average precision, recall, and F1-score evaluated over the full dataset (sorted by F1-score in descending order)

[Fig. 5]

[Fig. 5]
Visualization of ground truth change points (red) and detected change points by each method (green) on the time series – UCR EC2 dataset

[Fig. 6]

[Fig. 6]
Visualization of ground truth change points (red) and detected change points by each method (green) on the time series – UCR ECG5000 dataset

[Fig. 7]

[Fig. 7]
Examples of false detections produced by the proposed method

[Table 1]

Comparison of CPD performance across different datasets and detection methods

Dataset Method Precision Recall F1
Blocks
(artificial)
Bayes (ours) 0.500 1.000 0.667
PELT 0.300 1.000 0.462
BottomUp 0.300 1.000 0.462
Binseg 1.000 1.000 1.000
Window 0.300 1.000 0.462
Bumps
(artificial)
Bayes (ours) 0.867 0.619 0.722
PELT 1.000 0.476 0.645
BottomUp 1.000 0.476 0.645
Binseg 1.000 0.524 0.688
Window 0.700 0.333 0.452
UCR EC2
(real world)
Bayes (ours) 0.515 0.531 0.523
PELT 0.500 0.313 0.385
BottomUp 0.500 0.313 0.385
Binseg 0.000 0.000 0.000
Window 0.650 0.406 0.500
ECG5000
(real world)
Bayes (ours) 0.368 0.055 0.095
PELT 0.920 0.060 0.113
BottomUp 0.760 0.050 0.093
Binseg 0.667 0.078 0.140
Window 0.520 0.034 0.064
Average Bayes (ours) 0.563 0.551 0.502
PELT 0.680 0.462 0.401
BottomUp 0.640 0.460 0.396
Binseg 0.667 0.401 0.457
Window 0.543 0.443 0.369