"AI 모델용 원천 데이터가 없다면" 금융권 AX 전환을 위한 AI 학습데이터 구축

트렌드

2026-06-19

AI 전환 시대의 금융 학습데이터의 역할

금융기관의 인공지능 전환(AI Transformation)은 단순히 특정 업무에 AI를 도입하는 것을 넘어 전체 운영 방식을 AI 기반으로 전환하는 근본적인 변화입니다. 기존에는 명시적인 규칙과 정책에 따라 의사결정을 했습니다. "신용도가 700점 이상이면 대출 승인", "거래 금액이 일정 수준 이상이면 수동 검토" 같은 규칙들이 있었습니다. AI 전환 이후에는 이러한 규칙을 AI가 학습한 패턴으로 대체합니다. AI는 과거의 모든 거래 데이터로부터 신용도, 소득, 자산, 거래 이력, 행동 패턴 같은 복합적인 요소를 종합하여 더 정교한 판단을 합니다. 이러한 전환을 가능하게 하려면 단순한 거래 데이터를 넘어 업무의 모든 측면을 포괄하는 통합된 학습데이터가 필수적입니다. 정형 데이터, 비정형 데이터, 도메인 지식이 모두 포함되어야 합니다.

‍

정형과 비정형 데이터의 통합 구축

‍

금융기관의 AI 전환에는 정형 데이터와 비정형 데이터의 동시 활용이 필요합니다. 정형 데이터는 거래 기록, 고객 정보, 계좌 잔액 같은 구조화된 데이터입니다. 이는 데이터베이스에 정리되어 있고 분석하기 쉽습니다. 비정형 데이터는 고객 상담 기록, 금융 문서, 이미지, 음성 같은 비구조화 데이터입니다. 이는 AI가 이해하기 위해 전처리가 필요합니다. AI Transformation을 위해서는 이 두 유형의 데이터를 통합해야 합니다. 고객의 정형 데이터(소득, 자산)와 비정형 데이터(상담 기록의 감정 상태, 문서의 작성 내용)를 함께 고려하면 더욱 정교한 신용도 평가가 가능합니다. 거래 패턴(정형)과 거래 목적의 설명(비정형)을 함께 분석하면 이상 거래 탐지가 더욱 정확해집니다. 이러한 통합 학습데이터 구축이 AI 전환의 성공을 결정합니다.

‍

도메인 지식의 명시적 인코딩

AI가 금융 업무를 수행하려면 금융 도메인의 깊은 지식이 필요합니다. 단순히 과거 데이터로부터 패턴을 학습하는 것만으로는 부족합니다. 금융 규제, 거래 법칙, 리스크 관리 원칙 같은 도메인 지식을 명시적으로 학습데이터에 인코딩해야 합니다. 신용 심사에 사용할 수 있는 요소와 차별적인 요소를 명확히 정의합니다. 금융규제에서 허용하는 심사 기준과 금지하는 기준을 명시합니다. 거래 프로세스의 논리도 인코딩합니다. "대출 신청 → 서류 검토 → 신용 조사 → 심사 → 승인 또는 거절"이라는 순서와 각 단계의 목적을 명시합니다. 리스크 개념도 정의합니다. 신용 리스크, 시장 리스크, 유동성 리스크 같은 다양한 리스크 유형과 각각의 관리 방법을 학습데이터에 포함시킵니다. 이러한 도메인 지식의 명시화가 있어야 AI는 단순한 통계적 패턴 인식을 넘어 금융의 논리를 이해합니다.

‍

금융권 AX 학습데이터의 핵심 구성

정형 데이터 통합: 거래 기록 수집, 고객 정보 정리, 계좌 데이터 통합, 시계열 데이터 구성, 이상 거래 표시
비정형 데이터 처리: 상담 기록 수집, 금융 문서 스캔, 음성 데이터 변환, 이미지 정보 추출, 이메일 및 채팅 기록
도메인 지식 인코딩: 금융 규제 명시화, 업무 프로세스 정의, 리스크 분류, 개념 관계도 작성, 금융 용어 표준화
프로세스 자동화 데이터: 반복 작업 시나리오, 규칙 기반 의사결정, 예외 상황 처리, 워크플로우 정의, 상태 전이 기록
예측 모델 학습데이터: 역사적 사건과 결과, 부도 사례와 상환 사례, 이탈 고객과 유지 고객, 거래 증감 사례, 성공 사례와 실패 사례

‍

과거 의사결정의 기록과 분석

‍

AI가 의사결정을 하기 위해서는 과거의 의사결정이 어떻게 이루어졌고 그 결과가 어떻게 됐는지를 알아야 합니다. 금융기관의 모든 주요 의사결정 기록을 수집하고 정리합니다.

대출 심사 결정: 어떤 기준으로 승인했거나 거절했는지, 그 후 대출금이 잘 상환되었는지.
거래 모니터링 결정: 어떤 거래를 의심했는지, 그것이 실제 부정거래였는지.
고객 추천 결정: 어떤 고객에게 어떤 상품을 추천했는지, 고객이 구매했는지.
리스크 판정: 어떤 거래를 높은 리스크로 판정했는지, 실제로 문제가 발생했는지.

이러한 기록들이 학습데이터가 되어 AI는 과거의 의사결정 패턴을 학습합니다. 다만 과거 의사결정이 항상 정확했던 것은 아닙니다. 판단 오류가 있었을 수도 있습니다. 이러한 오류를 식별하고 AI가 같은 실수를 반복하지 않도록 학습데이터에서 명시적으로 처리합니다.

‍

실시간 데이터 수집과 동적 학습

AX의 고도화된 단계에서는 학습데이터가 정적이지 않습니다. 실시간으로 새로운 데이터가 수집되고 학습에 반영됩니다. 새로운 거래가 발생하면 즉시 데이터에 추가됩니다. 고객의 행동이 변하면 그것이 포착됩니다. 시장 상황이 변하면 그 영향이 기록됩니다. 규제가 변경되면 새로운 규정이 학습데이터에 반영됩니다. 이러한 실시간 업데이트를 통해 AI의 모델은 항상 최신 상황을 반영합니다. 수년 전의 데이터에만 의존하지 않습니다. 다만 실시간 업데이트는 시스템에 큰 부담을 줍니다. 데이터 수집, 전처리, 저장, 동기화가 모두 실시간으로 이루어져야 합니다. 따라서 견고한 인프라와 자동화된 프로세스가 필수적입니다.

‍

데이터 품질의 지속적 검증

‍

AX를 위한 학습데이터는 매우 높은 품질을 요구합니다. 데이터의 정확성, 일관성, 완전성이 모두 중요합니다.

정확성 검증: 입력된 데이터가 실제를 반영하는지 확인합니다. 거래 금액이 실제 거래 금액과 일치하는지, 고객 정보가 최신인지를 검증합니다.
일관성 검증: 같은 데이터가 여러 곳에 기록될 때 일치하는지 확인합니다. 거래 기록이 은행 시스템과 회계 시스템에서 동일하게 기록되어 있는지를 확인합니다.
완전성 검증: 필요한 정보가 모두 포함되어 있는지 확인합니다. 대출 심사에 필요한 모든 정보가 수집되었는지를 확인합니다.

이러한 검증이 자동화되어야 합니다. 매일 수백만 건의 데이터 항목을 모두 수동으로 검증할 수는 없으므로 자동화된 품질 검사 시스템을 구축합니다. 문제가 있는 데이터는 자동으로 플래그되어 검토 대상이 됩니다.

‍

데이터 다양성과 편향 제거

AX의 학습데이터가 편향되면 AI도 편향된 의사결정을 합니다. 데이터의 다양성을 확보하고 편향을 제거하는 것이 매우 중요합니다. 고객 다양성: 모든 고객층이 적절히 포함되어야 합니다. 특정 지역, 특정 직업, 특정 나이의 고객만 포함되면 안 됩니다. 거래 다양성: 모든 유형의 거래가 포함되어야 합니다. 일반적인 거래만 학습하면 특이한 거래에서 오류가 발생합니다. 시간 다양성: 다양한 시기의 데이터가 포함되어야 합니다. 특정 시기의 데이터만 학습하면 다른 시기의 환경 변화에 대응하지 못합니다. 편향 식별: 정기적으로 AI의 의사결정이 특정 그룹에 편향되지 않았는지 검증합니다. 특정 나이대, 특정 지역, 특정 성별에 대해 부공정한 대우를 하지 않는지 확인합니다. 편향 보정: 발견된 편향을 보정합니다. 데이터 균형을 조정하거나 모델의 의사결정 규칙을 수정합니다.

‍

규제 준수와 윤리 기준의 통합

‍

금융 AI는 규제를 준수해야 합니다. 학습데이터 구축 단계부터 규제 요구사항이 반영되어야 합니다. 금융감독 규정: 신용도 평가 기준, 공시 의무, 거래 보고 기준 등이 학습데이터에 명시됩니다. 개인정보보호법: 고객 정보의 수집, 보관, 사용이 법적 기준을 따릅니다. 차별 금지법: AI가 성별, 인종, 종교 등을 이유로 차별하지 않도록 설계됩니다. 윤리 기준: 규제를 넘어 윤리적 기준도 고려합니다. 불공정한 약탈적 거래(predatory lending)를 하지 않도록 설계합니다. 취약 고객에 대한 보호 기준을 설정합니다. 이러한 규제와 윤리 기준이 학습데이터에 명시적으로 인코딩되면 AI는 자동으로 규제를 준수하고 윤리적으로 행동합니다.

‍

조직 역량과 인재 개발

‍

AX를 위한 학습데이터를 구축하려면 조직의 역량이 필요합니다. 데이터 과학자, 데이터 엔지니어, 도메인 전문가, 데이터 관리자 같은 인재들이 함께 일해야 합니다. 이들 사이의 협력과 소통이 중요합니다. 데이터 과학자는 AI 모델 개발에 필요한 데이터를 정의합니다. 데이터 엔지니어는 대규모 데이터를 효율적으로 수집하고 처리합니다. 도메인 전문가는 금융 지식을 데이터로 인코딩합니다. 데이터 관리자는 데이터 품질과 거버넌스를 담당합니다. 이러한 인재들의 부족이 많은 금융기관의 AI Transformation을 제약합니다. 따라서 조직 내 역량을 지속적으로 개발해야 합니다. 교육 프로그램, 외부 전문가 채용, 대학과의 협력 같은 다양한 방법을 통해 인재를 확보합니다.

‍

‍

목록보기