“왜 멈췄을까?” 대신 “곧 멈춘다” AI 설비 이상 감지 전환의 효과

트렌드
2026-02-02

“왜 멈췄을까?” 대신 “곧 멈춘다” AI 설비 이상 감지 전환의 효과

설비 이상은 설비가 정상 상태에서 벗어나는 모든 상황을 의미합니다. 이는 고장으로 발전하기 직전의 신호입니다. 진동 증가, 온도 상승, 소음 변화, 진동 패턴의 변형 같은 것들이 이상 신호입니다. 이상 감지와 고장 예측의 차이를 이해하는 것이 중요합니다. 이상 감지는 현재 상태가 정상 범위를 벗어났음을 알립니다. 고장 예측은 언제쯤 실제 고장이 발생할 것인지를 추정합니다. 이상 감지가 더 빠르고 광범위한 신호를 포착합니다.

제조 기업에서 설비 이상은 즉시 대응해야 할 문제입니다. 이상 신호를 무시하고 운영을 계속하면 작은 문제가 급속도로 악화됩니다. 설비가 갑자기 고장나면 생산이 중단되고 고객 납기에 차질이 생깁니다. 비용도 급증합니다. 사전에 이상을 감지하면 작은 규모의 수리로 문제를 해결할 수 있습니다.


기존 이상 감지 방식의 한계

설비 이상 감지의 전통적 방식은 인간의 감각에 의존합니다. 현장 작업자나 유지보수 담당자가 설비의 소리, 진동, 냄새를 통해 이상을 감지합니다. 경험이 많은 담당자는 미세한 변화도 포착할 수 있습니다. 그러나 이 방식에는 여러 한계가 있습니다.

첫째, 주관성이 강합니다. 같은 신호도 사람마다 다르게 해석합니다. 한 사람은 정상이라고 판단하고 다른 사람은 이상이라고 판단할 수 있습니다. 둘째, 지속적인 모니터링이 불가능합니다. 사람이 직접 설비를 살피려면 시간과 인력이 필요합니다. 24시간 감시할 수 없습니다. 셋째, 무증상 진행 설비도 있습니다. 외부로 드러나는 신호 없이 내부적으로 손상이 진행되는 경우가 있습니다. 인간의 감각으로는 이를 감지할 수 없습니다.

인공지능 기반 설비 이상 감지는 이러한 한계를 극복합니다. 객관적이고 일관된 판단을 제공하며 24시간 지속적으로 모니터링합니다.

다중 센서 신호의 통합 분석

설비 이상 감지의 기초는 다양한 종류의 센서로부터 수집되는 신호입니다. 진동 센서는 설비의 기계적 상태를 가장 직접적으로 반영합니다. 베어링 손상, 정렬 오류, 불균형 같은 문제가 특정한 주파수 대역의 진동을 생성합니다. 온도 센서는 설비 내부의 열 상태를 추적합니다. 마찰 증가, 냉각 시스템 불량, 과부하 상태가 온도 변화를 유발합니다.

음향 센서는 초음파 대역의 신호를 포착합니다. 매우 미세한 결함도 초음파 신호를 방출하므로 조기 감지가 가능합니다. 전류 센서는 모터나 펌프의 부하를 측정합니다. 효율성 저하나 과부하 상황을 감지합니다. 압력 센서는 유압 시스템의 압력을 지속적으로 모니터링합니다. 누수나 펌프 성능 저하를 파악합니다.

이러한 센서들로부터 나오는 신호는 서로 다른 특성을 가집니다. 시간 스케일이 다르고 주파수 범위가 다르며 물리적 의미도 다릅니다. 인공지능의 역할은 이 모든 신호를 통합하여 설비의 전체적인 건강 상태를 판단하는 것입니다.

▲ 단일 센서만으로는 정확한 이상 감지가 어렵습니다.

▲ 여러 센서의 신호를 조합하면 거짓 알람을 줄이고 정확도를 높일 수 있습니다.

신호 통합에는 여러 기술이 사용됩니다. 먼저 신호 동기화가 필요합니다. 각 센서에서 나오는 신호의 시간 기준을 맞춰야 합니다. 다음으로 신호 정규화가 이루어집니다. 센서마다 측정 단위와 범위가 다르므로 이를 통일합니다. 그 다음 신호 특징 추출이 진행됩니다. 각 센서 신호에서 의미 있는 특징을 추출합니다.


신호 처리와 특징 추출 기술

센서로부터 들어오는 원본 신호는 노이즈가 많아서 직접 사용하기 어렵습니다. 환경 소음, 전자파 간섭, 센서 자체의 불안정성이 원하지 않는 신호를 섞입니다. 이상 감지를 위해서는 노이즈를 제거하고 진정한 신호를 추출해야 합니다.

필터링은 기본적인 신호 처리입니다. 저역통과 필터는 저주파 성분만 추출합니다. 고주파 노이즈를 제거할 때 사용됩니다. 고역통과 필터는 고주파 성분을 강조합니다. 미세한 이상 신호가 높은 주파수에 나타날 때 유용합니다. 대역통과 필터는 특정 주파수 범위만 통과시킵니다. 특정 설비에서 예상되는 이상 신호의 주파수 범위를 미리 알면 효과적입니다.

주파수 분석도 중요합니다. 푸리에 변환을 사용하면 신호의 주파수 구성을 파악할 수 있습니다. 어떤 주파수에서 에너지가 비정상적으로 증가했는지를 볼 수 있습니다. 웨이블릿 변환은 시간과 주파수 정보를 동시에 제공합니다. 신호가 시간에 따라 어떻게 변하는지를 추적할 수 있습니다.

특징 추출은 신호로부터 의미 있는 정보를 뽑아내는 과정입니다. 진동 신호에서는 피크 값, 평균값, 표준편차, 첨도 같은 통계적 특징을 추출합니다. 시계열 신호에서는 자기상관, 추세, 계절성 같은 구조적 특징을 추출합니다. 이렇게 추출된 특징들이 머신러닝 모델의 입력이 됩니다.

정상 범위의 정의와 이상 판정

이상 감지의 핵심은 무엇이 정상이고 무엇이 이상인지를 정의하는 것입니다. 정상 범위를 너무 좁게 설정하면 거짓 경보가 많아집니다. 정상 범위를 너무 넓게 설정하면 실제 이상을 놓칩니다. 이 균형을 맞추는 것이 중요합니다.

정상 범위는 고정적이지 않습니다. 설비의 나이, 환경 조건, 운영 방식에 따라 정상 신호의 특성이 달라집니다. 새로운 설비와 사용 중인 설비의 신호는 다릅니다. 겨울과 여름의 환경 온도가 다르면 정상 신호도 달라집니다. 부하가 높을 때와 낮을 때의 신호도 다릅니다.

따라서 조건부 정상 범위(conditional normal range) 개념이 사용됩니다. 설비의 나이, 환경 온도, 부하 수준 같은 조건을 입력하면 그 조건에서의 정상 신호 범위를 동적으로 계산합니다. 이를 통해 정상적인 변동과 이상 신호를 정확히 구분할 수 있습니다.

통계적 방법도 사용됩니다. 정상 상태의 대량 데이터를 수집하여 그 분포를 파악합니다. 정규분포를 가정하고 평균에서 표준편차의 일정 배수를 벗어나면 이상으로 판정합니다. 비정규분포의 경우 백분위수 방법을 사용합니다.

▲ 머신러닝 기반 방법은 더욱 정교합니다.

▲ 정상 신호로만 훈련한 모델이 정상 패턴을 학습한 후 그 범위를 벗어나는 신호를 이상으로 간주합니다.


머신러닝 모델의 구축과 훈련

설비 이상 감지에 사용되는 머신러닝 모델은 비정상 탐지(anomaly detection) 문제로 접근합니다. 정상 데이터는 충분하지만 이상 데이터는 매우 드물기 때문입니다. 따라서 정상 신호로만 모델을 훈련합니다.

자기 인코더(autoencoder)는 이상 감지에 널리 사용됩니다. 신경망이 정상 신호를 입력받아 압축했다가 복원합니다. 정상 신호에는 정확하게 복원되지만 이상 신호에는 복원 오차가 큽니다. 이 오차가 크면 이상으로 판정합니다.

격리 포레스트(isolation forest)도 효과적입니다. 정상 데이터는 많은 트리로 구분되지만 이상 데이터는 적은 트리로 분리됩니다. 이 특성을 이용하여 이상을 감지합니다.

시계열 모델도 중요합니다. 장단기 메모리 신경망(LSTM)은 시간에 따른 신호의 변화 패턴을 학습합니다. 정상적인 변화 추이를 학습한 후 그 추이에서 벗어나면 이상으로 판정합니다.

모델 훈련에는 양질의 정상 데이터가 필수적입니다. 설비가 정상적으로 운영되는 다양한 조건에서 수집한 데이터가 필요합니다. 부하가 다르고, 환경이 다르며, 계절이 다른 상황의 데이터를 모두 포함해야 합니다.

설비 유형별 이상 신호의 차이

다양한 유형의 설비는 서로 다른 이상 신호를 보입니다. 회전 기계인 모터나 펌프는 진동과 소음이 주된 신호입니다. 베어링 손상, 불균형, 정렬 오류가 특정한 주파수의 진동을 생성합니다. 선형 운동 기계인 컨베이어는 소음과 전류 변화가 중요합니다. 압축기나 블로어 같은 유체 기계는 압력과 유량의 변화를 모니터링합니다.

전열 기계인 히터나 보일러는 온도와 압력이 주된 신호입니다. 온도 상승이 빨라지거나 압력이 불안정해지면 이상입니다. 펌프와 밸브는 압력과 유량을 동시에 모니터링합니다. 압력이 증가하는데 유량이 줄어들면 펌프 성능 저하를 의미합니다.

따라서 각 설비 유형에 맞는 센서 선택과 신호 처리 방법이 필요합니다. 일반적인 이상 감지 모델을 적용하기보다는 각 설비의 특성을 반영한 맞춤형 모델을 구축하는 것이 더 정확합니다.


실시간 모니터링 시스템의 구축

설비 이상을 효과적으로 감지하려면 실시간 모니터링이 필수입니다. 센서로부터 나오는 신호가 지속적으로 수집되고 분석되어야 합니다. 임계값을 벗어난 신호가 감지되면 즉시 알림이 발생합니다.

실시간 시스템의 핵심은 지연을 최소화하는 것입니다. 센서 데이터 수집, 신호 처리, 모델 추론, 알림 발송까지의 전체 과정이 밀리초 단위로 진행되어야 합니다. 산업용 컴퓨터가 설비 근처에 배치되어 엣지 컴퓨팅을 수행합니다.

클라우드와의 통신도 고려됩니다. 실시간 판정은 로컬에서 하고 더 정교한 분석이 필요한 데이터는 클라우드로 전송합니다. 이를 통해 빠른 대응과 심층 분석을 동시에 달성합니다.

알림 시스템도 체계적으로 설계됩니다. 이상 정도에 따라 경고, 주의, 긴급의 세 단계로 나눕니다. 경고 단계에서는 담당자에게 정보성 알림을 보냅니다. 주의 단계에서는 즉시 점검을 권고합니다. 긴급 단계에서는 설비 운영 중단을 포함한 조치를 강력하게 권고합니다.

거짓 경보 감소 전략

이상 감지 시스템의 가장 큰 문제 중 하나는 거짓 경보입니다. 실제 이상이 아닌데 이상으로 판정하는 경우가 발생합니다. 거짓 경보가 많으면 현장 담당자들이 시스템을 신뢰하지 않게 됩니다.

거짓 경보를 줄이기 위해 여러 방법이 사용됩니다. 첫째, 신호 검증입니다. 한 센서의 신호만 이상을 보이는 것은 센서 오류일 가능성이 높습니다. 여러 센서의 신호가 함께 이상을 보일 때만 진정한 이상으로 간주합니다.

둘째, 지속성 검사입니다. 일시적 스파이크는 무시하고 일정 시간 이상 계속되는 신호만 이상으로 판정합니다. 셋째, 맥락 분석입니다. 설비의 운영 상태, 환경 조건, 최근 유지보수 이력 등을 고려합니다. 유지보수 직후에는 신호가 일시적으로 변할 수 있으므로 이를 반영합니다.

넷째, 임계값의 동적 조정입니다. 고정된 임계값보다는 상황에 맞게 변하는 임계값을 사용합니다. 시간대, 계절, 부하 수준 등에 따라 임계값을 조정합니다.

근본 원인 분석과 해결 방안 제시

이상을 감지한 것으로 끝나면 안 되고, 이상이 발생한 원인을 파악하여 해결 방안을 제시해야 합니다. 이상 신호의 특성으로부터 원인을 추론합니다. 진동의 주파수 특성으로부터 베어링 손상인지 불균형인지를 구분합니다. 온도 상승의 속도로부터 심각도를 평가합니다.

전문가 시스템이 도움이 됩니다. 수십 년의 설비 관리 경험을 규칙 기반으로 체계화합니다. 예를 들어 "3000~6000Hz 대역의 진동이 증가하고 온도도 상승하면 베어링이 손상된 상태"라는 규칙을 만듭니다. 머신러닝 모델과 규칙 기반 시스템을 결합하면 더욱 정확한 진단이 가능합니다.

해결 방안도 제시합니다. 원인이 파악되면 권장 조치를 제시합니다. 경미한 이상이면 운영 조건 조정으로 해결할 수 있지만 심각한 이상이면 부품 교체나 설비 수리가 필요하기 때문에 적절한 시점을 추천합니다.

조직의 데이터 문화 형성

설비 이상 감지 시스템을 제대로 운영하려면 조직의 문화가 변해야 합니다. 과거에는 설비가 고장나면 대응하는 사후 대응이 주였습니다. 이상 감지 시스템이 경고하면 사전에 조치하는 사전 대응으로 바뀝니다. 현장 담당자들은 시스템의 알림을 진지하게 받아들여야 합니다. 거짓 경보를 줄이고 신뢰도를 높여야 담당자들이 시스템을 신뢰합니다. 또한 데이터 기반 의사결정 문화를 형성합니다. 설비 관리 판단을 경험과 직감에만 의존하지 않고 데이터를 바탕으로 합니다. 이를 위해 조직 전체에 데이터 리터러시 교육을 실시합니다.

이전글
이전글
다음글
다음글
목록보기