
스마트폰과 결제 시스템에 안면인식 기술이 빠르게 도입되면서 사용자들은 지문이나 비밀번호 없이 얼굴만으로 결제를 진행할 수 있는 편의성을 누리게 되었지만, 동시에 AI 기술의 발전으로 인해 정교한 가짜 얼굴을 만들어내는 딥페이크 기술도 함께 진화하고 있으며 이는 결제 보안에 심각한 위협을 가하고 있습니다. 안면인식 결제 시스템이 처음 도입되었을 때는 단순한 2D 이미지 인식 수준이었지만 시간이 지나면서 3D 얼굴 인식, 홍채 인식, 피부 혈관 패턴 인식 같은 보다 고도의 생물측정 기술로 발전했고, 이에 따라 딥페이크 공격도 이러한 다층적 생물측정 시스템을 우회하기 위해 더욱 정교해지고 있습니다.
딥페이크 기술을 활용한 공격자들은 원본 사진이나 동영상으로부터 깊은 학습 신경망을 통해 매우 정교한 가짜 얼굴을 생성하거나 실제 사람의 얼굴에 다른 사람의 표정과 움직임을 합성하는 방식으로 안면인식 결제 시스템을 속일 수 있으며, 이는 단순히 고정된 사진을 카메라에 보여주는 것보다 훨씬 정교하고 탐지하기 어렵습니다. 과거의 스프핑 공격(사진이나 동영상 재생)은 깜빡임, 눈 움직임 같은 생리적 신호의 부재로 쉽게 적발되었지만 딥페이크 기술로 생성된 영상은 자연스러운 얼굴 움직임, 피부 질감의 변화, 눈 깜빡임의 패턴까지 정확하게 복제할 수 있습니다.
더욱 위협적인 것은 GAN(생성적 적대 신경망) 기술이 발전하면서 완전히 존재하지 않는 가짜 얼굴을 만들어낼 수 있다는 점이며, 이러한 합성 얼굴도 대부분의 안면인식 시스템에서 실제 얼굴로 인식될 수 있다는 데 있어서 보안의 심각성을 드러냅니다.
• 얼굴 스왑: 원본 동영상에서 한 사람의 얼굴을 다른 사람의 얼굴로 교체하는 기술
• 표정 전이: 특정 사람의 표정과 입 모양을 다른 사람의 얼굴에 합성하는 방식
• 완전 생성: 신경망 기술로 완전히 새로운 가짜 얼굴을 생성하는 기법
• 음성 동기화: 가짜 얼굴의 입 움직임을 조작된 음성과 동기화하는 기술
• 신체 움직임 복제: 팔 제스처, 머리 움직임 같은 신체 언어까지 정교하게 복제
• 얼굴의 기하학적 특성: 눈 사이 거리, 코의 형태, 턱의 윤곽 같은 고정적 특성
• 피부 질감 분석: 미세한 주름, 모공 패턴, 피부 반사율 같은 미세한 특성
• 동적 특성: 눈 깜빡임의 빈도, 눈동자의 움직임, 얼굴 표정 변화의 자연성
• 홍채 패턴: 홍채의 고유한 혈관 패턴과 색소 분포의 특이성
• 3D 깊이 정보: 얼굴의 3차원 형태와 표면 곡률

생성적 적대 신경망 기술이 급속도로 발전하면서 딥페이크의 품질이 인간의 눈으로는 구분하기 불가능한 수준에 도달했으며, 동시에 안면인식 알고리즘도 이러한 정교한 딥페이크를 탐지하기 위해 역시 빠르게 진화하고 있지만 공격 기술의 발전 속도가 방어 기술보다 더 빠르다는 점이 결제 보안의 근본적인 취약성을 드러냅니다. 새로운 GAN 모델이 개발되어 더욱 정교한 합성 얼굴을 생성할 수 있게 되면 결제 시스템의 방어 알고리즘이 이에 대응하기 위해 수주에서 수개월의 시간이 필요하며, 이 시간 동안 공격자들은 시스템을 악용할 수 있습니다.
또한 딥페이크 생성 도구가 점점 더 대중화되고 있어서 고도의 기술 지식 없이도 정교한 가짜 얼굴 영상을 만들 수 있게 되었다는 점도 위협의 범위를 확대시킵니다.

결제 시스템들이 딥페이크를 탐지하기 위해 시도하는 여러 기술적 접근법들이 있으며, 이는 주로 얼굴의 생리적 특성과 동적 특성을 분석하는 방식으로 작동하지만 각각의 방식마다 딥페이크에 우회당할 가능성을 항상 가지고 있습니다. 예를 들어 눈 깜빡임의 빈도를 분석하는 방식은 이론적으로 견고해 보이지만 딥페이크 기술이 발전하면서 자연스러운 깜빡임 패턴을 정확하게 복제할 수 있게 되었습니다.
피부 질감 분석도 마찬가지로 초기에는 효과적이었지만 최신 딥페이크 기술은 매우 미세한 피부 주름과 모공 패턴까지 복제할 수 있게 되었으며, 3D 깊이 정보 분석도 정교한 3D 애니메이션 기술 앞에서는 완벽한 방어가 되지 못하고 있습니다.

딥페이크 공격으로부터 안면인식 결제 시스템을 보호하기 위해 많은 서비스들이 단일 생물측정 기술에만 의존하지 않고 얼굴 인식과 홍채 인식, 음성 인식, 지문 인식을 동시에 사용하는 다중 생물측정 인증 방식으로 전환하고 있으며, 이는 공격자가 여러 생물측정 신호를 동시에 정교하게 위조해야 한다는 점에서 보안을 강화합니다. 하지만 여러 생물측정 정보를 종합적으로 위조할 수 있는 기술도 점점 발전하고 있으며, 특히 음성 합성 기술이 매우 빠르게 진화하면서 음성 인증도 더 이상 완벽한 방어 수단이 되지 못하고 있습니다.
또한 다중 생물측정 인증은 사용자 입장에서 결제 과정을 더욱 복잡하게 만들고 소요 시간을 늘리므로 편의성과 보안 사이의 트레이드오프 관계를 만드는 문제가 있습니다.
라이브니스 감지는 결제 시스템 앞에서 실시간으로 촬영되는 영상이 실제 사람인지 사전 녹화된 영상이나 딥페이크인지를 판별하려는 기술이며, 고개 돌림, 눈 깜빡임, 특정 동작 요청에 대한 반응 같은 동적 특성을 분석함으로써 작동합니다. 이 기술은 스푼 공격과 초기 수준의 딥페이크를 효과적으로 탐지할 수 있지만, 딥페이크 기술이 발전하면서 실시간으로 생성되는 고품질의 합성 영상 앞에서는 한계를 드러내고 있습니다.
특히 문제가 되는 것은 라이브니스 감지를 위해 사용자에게 특정 동작(고개 돌림, 얼굴 인식 등)을 요청하는 방식인데, 딥페이크 기술이 이러한 동작까지 자연스럽게 수행할 수 있게 되면서 이 방식도 우회당하고 있습니다.

기계 학습 알고리즘을 사용하여 딥페이크와 실제 얼굴을 구분하는 방식은 훈련 데이터에 다양한 딥페이크 샘플이 포함되어 있을수록 탐지 정확도가 높아지지만, 동시에 이 데이터 자체가 딥페이크 생성자들에게 중요한 학습 자료가 될 수 있다는 양면성을 가지고 있습니다. 결제 시스템이 공개적으로 자신의 딥페이크 탐지 알고리즘을 학습시키기 위해 사용한 데이터나 방식에 대해 알려주면 공격자들은 이 정보를 바탕으로 더욱 정교한 우회 기법을 개발할 수 있습니다.
따라서 많은 결제 시스템들이 자신의 딥페이크 탐지 기술을 비공개로 유지하려고 하며, 이는 산업 전체의 보안 개선을 어렵게 만듭니다.
최근 개발된 실시간 생성 딥페이크 기술은 결제 과정에서 카메라를 통해 들어오는 실시간 영상을 즉각적으로 변조하는 방식으로 작동하므로, 사전 녹화본을 감지하는 라이브니스 감지나 과거 데이터셋으로 학습한 기계 학습 알고리즘으로는 탐지가 매우 어려워집니다. 이 기술을 사용하면 공격자는 결제 요청 순간에 임시로 아들의 얼굴을 위조된 얼굴로 변경하고 결제를 진행한 후 즉시 원래 얼굴로 복원할 수 있으며, 이 모든 과정이 수초 내에 완료되므로 시스템이 이를 감지하기 어렵습니다.
또한 실시간 생성 기술은 각 결제 순간마다 조금씩 다른 합성 영상을 만들어내므로 고정된 탐지 알고리즘으로는 대응할 수 없으며, 매번 새로운 공격 패턴에 적응해야 합니다.
생물측정 기술 자체가 가지는 근본적인 문제는 인증에 사용되는 신호들이 모두 복제 가능하고 위조 가능한 물리적 특성이라는 점이며, 이는 아무리 고도의 기술을 사용한다 하더라도 완벽한 보안을 보장할 수 없다는 의미입니다. 지문은 남겨질 수 있고 홍채 패턴은 사진으로 복제될 수 있으며 얼굴은 마스크나 수술로 변경될 수 있고 음성은 합성될 수 있습니다.
따라서 앞으로의 결제 보안은 단순한 생물측정 인증에만 의존할 수 없으며, 거래 맥락을 분석하는 행동 패턴 인식, 거래의 비정상 여부를 판단하는 AI 기반 부정 거래 탐지, 다양한 레벨의 인증을 상황에 따라 요구하는 적응형 인증 시스템 같은 다층적 접근이 필수적입니다.
