화면의 완벽함도 속일 수 없다? ‘고해상도’ 디스플레이 공격 대응 방법

트렌드

2026-04-15

고해상도 디스플레이 공격의 등장 배경

최근 디스플레이 기술의 발전으로 매우 높은 해상도의 화면을 통해 위조 영상을 재생하는 공격이 가능해지고 있습니다. 과거의 저해상도 이미지 기반 공격과 달리, 고해상도 OLED나 고급 LCD 디스플레이를 이용하면 실제 인물과 거의 구분이 불가능한 수준의 영상을 재생할 수 있습니다. 이러한 공격은 얼굴인식 시스템에 새로운 도전을 제시하고 있습니다. 스마트폰, 태블릿, 노트북 등 고해상도 화면을 갖춘 기기가 널리 보급됨에 따라, 이를 악용한 공격이 증가할 가능성이 있습니다. 은행 시스템에서는 원격 신원 확인 프로세스 중에 미리 녹화된 고화질 영상을 재생하는 방식의 공격도 보고되고 있습니다. 이는 단순 프린트 공격을 넘어 더욱 정교한 위협이 되고 있습니다.

‍

화면 재생 공격의 기술적 원리

‍

화면 재생 공격은 저장된 영상을 고해상도 디스플레이를 통해 재생하여 카메라에 입력되도록 하는 방식입니다. 공격자는 합법적 사용자의 영상을 사전에 녹화하여 저장해두었다가, 인증 시점에 이를 화면에 띄워 재생합니다. 고해상도 디스플레이는 영상의 세부 정보를 충분히 표현할 수 있어, 이러한 공격의 성공 가능성을 높입니다. 특히 사용자가 특정 동작을 수행하도록 요구하는 능동형 인증의 경우, 사전에 녹화된 동작 영상으로도 충분히 속일 수 있다는 점이 문제입니다. 공격의 성공 여부는 디스플레이의 화질, 카메라의 성능, 인증 시스템의 정교함 등 여러 요소가 복합적으로 작용합니다. 이러한 기술적 발전은 보안 시스템의 근본적인 재검토를 요구하고 있습니다.

‍

화면 공격과 기존 라이브니스의 한계

‍

기존의 수동형 라이브니스 검증은 피부 질감, 빛 반응, 미세 움직임 등을 분석하는 방식으로 작동합니다. 그러나 고해상도 화면을 통한 재생 공격의 경우, 이러한 신호들이 상당히 자연스럽게 표현될 수 있습니다. 특히 눈 깜박임, 입술 움직임, 미소 짓기 등 자연스러운 생체 신호까지 사전 녹화 영상에 포함될 수 있으므로, 단순한 신호 분석만으로는 탐지가 어려울 수 있습니다. 고품질 영상의 등장으로 이전에는 탐지 가능했던 노이즈나 불완전함이 감소하면서, 공격의 난이도와 성공 확률이 동시에 높아지고 있습니다. 따라서 기존 라이브니스 기술만으로는 부족하며, 추가적인 방어 메커니즘이 필수적입니다.

‍

시간 분석을 통한 위조 탐지

▲ 비디오 프레임 간 불일치: 연속 프레임의 시간 차이 분석 ▲ 루프 패턴 감지: 반복되는 움직임이나 표정의 주기성 확인 ▲ 깜빡임 아티팩트: 디스플레이 새로고침에 따른 미묘한 변화 탐지

‍

시간 축 분석은 고해상도 공격을 탐지하는 핵심 방법입니다. 영상이 디스플레이를 통해 재생될 때, 프레임 간의 미묘한 시간적 불일치가 나타날 수 있습니다. 예를 들어, 화면의 새로고침 주기에 따른 아티팩트나 루프 구간의 미세한 불연속성을 감지할 수 있습니다. 실제 인물의 경우 연속적인 자연스러운 움직임을 보이지만, 사전 녹화 영상은 완벽하게 연속되지 않을 가능성이 있습니다. 카메라가 여러 프레임을 수집하여 시간적 패턴을 분석하면, 정지 영상이나 반복 영상의 특징을 찾아낼 수 있습니다. 이러한 분석 기술은 고해상도 공격에 효과적인 방어 메커니즘이 될 수 있습니다.

‍

적외선과 편광 기반 탐지

‍

멀티 스펙트럼 분석을 통해 화면과 실제 얼굴의 광학적 특성 차이를 탐지할 수 있습니다. 적외선 카메라는 실제 피부의 열 신호를 감지하지만, 디스플레이가 방출하는 적외선 특성은 다릅니다. 편광 필터를 사용한 분석도 효과적인데, 실제 피부와 디스플레이 표면의 반사 특성이 다르기 때문입니다. 다양한 파장의 빛을 사용하여 촬영한 영상을 비교 분석하면, 합성 영상의 미묘한 차이점을 발견할 수 있습니다. 이러한 기술은 고해상도 공격에 대한 강력한 방어선이 될 수 있습니다. 다만 이러한 추가 센서와 분석 복잡도가 시스템 비용을 증가시킬 수 있다는 점이 과제입니다.

‍

다중 모달리티 생체인식 통합

고해상도 공격에 효과적으로 대응하기 위해 얼굴인식에만 의존하지 않고 음성, 지문, 홍채 등 다양한 생체 정보를 결합하는 방식이 있습니다. 얼굴 영상과 음성을 함께 분석하면, 입술 움직임과 음성의 동기화 여부를 확인할 수 있습니다. 음성 신호만으로는 쉽게 위조되지 않으므로, 이를 추가 검증 계층으로 활용할 수 있습니다. 지문이나 홍채 인식은 카메라를 통한 평면적 공격에 훨씬 강합니다. 여러 생체 정보를 동시에 검증해야만 접근이 가능하도록 설계하면, 공격자가 모든 신호를 동시에 위조하기는 매우 어렵습니다. 이러한 통합 접근은 보안성을 크게 향상시킵니다.

‍

머신러닝 기반 화면 공격 탐지

‍

현대의 AI 기술은 화면 재생 공격의 미묘한 특징을 자동으로 학습할 수 있습니다. 대규모 데이터셋에서 실제 얼굴과 화면 재생 공격을 구분하도록 훈련된 신경망은 인간의 눈으로 감지하기 어려운 차이점까지 식별할 수 있습니다. 다양한 디스플레이 종류, 해상도, 조명 조건에서의 공격 사례를 학습하면, 새로운 형태의 고해상도 공격에도 대응할 수 있습니다. 합성곱 신경망(CNN)은 이미지의 픽셀 수준의 미묘한 패턴까지 분석할 수 있습니다. 다만 공격 기법이 진화하면 모델도 함께 업데이트되어야 하므로, 지속적인 연구와 개선이 필요합니다.

‍

입출력 무결성 검증

시스템이 받는 영상 신호 자체의 조작 여부를 확인하는 방식도 중요합니다. 카메라로부터 시스템에 입력되는 데이터가 중간에 변조되지 않았는지 검증하는 기술입니다. 암호화된 통신 채널을 사용하여 영상 신호를 보호하고, 디지털 서명이나 해시값을 통해 무결성을 확인할 수 있습니다. 하드웨어 수준에서의 보안 강화도 필요한데, 신뢰할 수 있는 카메라와 처리 장치만 사용하여 공급망 차원의 위협을 차단합니다. 이러한 접근은 화면 공격뿐 아니라 다양한 형태의 신호 조작 공격을 방어할 수 있습니다.

‍

환경 맥락 정보의 활용

‍

고해상도 공격을 탐지하는 데 주변 환경 정보도 중요한 역할을 합니다. 카메라 주변의 조명 조건, 배경 요소, 기타 신체 부위의 움직임 등을 분석하면 조작 여부를 판단할 수 있습니다. 화면을 통한 영상 재생과 실제 인물 촬영 간의 환경적 특성 차이를 감지할 수 있습니다. 예를 들어 조명이 불일치하거나, 배경 요소의 움직임이 부자연스러운 경우 의심 신호로 작동합니다. 여러 카메라 각도에서 동시에 촬영하면, 3차원 구조와 일관성을 확인할 수 있어 더욱 강력한 방어가 가능합니다.

‍

도전 과제와 균형 유지

‍

고해상도 공격 방어를 위한 강화된 기술은 사용자 편의성과의 균형을 맞추어야 합니다. 과도하게 복잡한 검증 절차는 합법적 사용자의 포기율을 높일 수 있습니다. 처리 시간도 중요한데, 실시간 인증이 필요한 금융 거래에서 검증 시간이 너무 길면 실용성이 떨어집니다. 다양한 환경(조명, 카메라 종류, 사용자 특성 등)에서 공정하게 작동하도록 설계하기가 기술적으로 어렵습니다. 또한 강화된 보안 요구사항은 시스템 구축 비용 증가로 이어질 수 있습니다. 이러한 여러 제약 조건 속에서 최적의 보안 수준을 찾아야 합니다.

‍

업계 협력과 표준화의 중요성

‍

고해상도 디스플레이 공격에 대한 효과적 대응은 기술 업체, 보안 전문가, 규제 기관의 협력이 필수적입니다. 국제 표준을 통해 프레젠테이션 공격 탐지 기술의 성능을 객관적으로 평가할 수 있습니다. 검증된 기술만 도입하도록 하는 정책적 지원도 중요합니다. 업계 간 정보 공유를 통해 새로운 공격 기법을 조기에 발견하고 대응할 수 있습니다. 표준화는 또한 서로 다른 솔루션을 공정하게 비교할 수 있게 하여, 시장에서의 신뢰도를 높입니다. 이러한 생태계 구축이 장기적으로 보안을 강화하는 핵심입니다.

‍

‍

목록보기