
엣지 케이스는 소프트웨어나 시스템이 일반적인 동작에서 벗어나는 예외적인 상황을 뜻합니다. 이는 주로 입력값이나 조건이 경계 부근에 위치할 때 발생하여 예상치 못한 결과를 초래하며 엣지 케이스를 무시하면 프로그램이 예상치 못한 상황에서 오동작할 수 있습니다. 사용자 경험을 저하시키고 심지어 보안 문제로 이어지므로 이러한 예외적인 상황을 미리 고려하고 처리하는 것이 중요합니다.
모델이 특정 케이스에서 성능이 떨어지는 것이 확인되었다면 데이터셋이 불균형하거나 편향된 것이 그 원인일 수 있습니다.
엣지 케이스 데이터를 찾아내는 능력이 자율주행 기술의 성패를 가르는 핵심이 되고 있습니다.
단순히 주행 데이터를 많이 모으는 것만으로는 모델의 성능을 한계 이상으로 끌어올리기 어렵습니다. 낮은 빈도로 등장하지만 모델의 치명적인 약점을 유발할 수 있는 엣지 케이스 데이터를 찾아내는 능력이 자율주행 기술의 성패를 가르는 핵심이 되고 있으며 데이터 활용의 초점은 단순 가공에서 모델의 성능을 직접적으로 좌우하는 데이터 인텔리전스로 이동하고 있습니다. 얼마나 많은 데이터를 처리했는지가 아니라 얼마나 가치 있는 데이터를 찾아내고 분석하고 모델에 학습시켰는지가 기업의 기술 경쟁력이 됩니다.

방대한 원시 데이터 속에서 특정 시나리오나 객체가 포함된 데이터를 검색할 수 있도록 데이터베이스화합니다.
고객이 보유한 원시 데이터를 검색하고 분석해 제안하는 프로세스를 통해 무작위로 수집된 데이터를 기업의 자산으로 만듭니다.
검색된 데이터의 분포와 편향성을 분석해 인공지능 모델이 어떤 부분에 취약점을 보일 수 있는지 정확하게 식별합니다. 모델이 정상적으로 동작하기 어려울 수 있는 상황을 분석하고 시각화하며 이러한 분석 결과를 바탕으로 모델 성능을 개선하기 위해 어떤 데이터를 우선적으로 학습시켜야 하는지 최적의 데이터셋 구성을 제안할 수 있습니다. 개발자들이 인공지능 기술을 개발할 때 개인의 감에 의존하지 않고 데이터에 기반해 모델의 취약점을 정확히 찾아내고 개선할 수 있습니다.
합성 데이터는 실제 시나리오에서 사람이 캡처한 데이터와 달리 소프트웨어에 의해 생성됩니다.
컴퓨터 프로그램은 일반적인 사람이 수집한 데이터가 나타낼 수 없는 드문 사례와 특정한 실제 시나리오를 조정해 사용 사례의 격차를 메울 수 있습니다.


엣지 케이스는 인공지능이 처리할 준비가 되어 있지 않을 수 있는 극단적이고 악몽 같은 시나리오입니다. 예를 들어 재난이나 범죄는 모두 데이터 수집이 어려운 시나리오이며 위험 없이 시뮬레이션할 수 있지만 합성 데이터를 실제 데이터와 함께 사용해 격차를 줄이고 가능한 모든 시나리오에 대해 총체적이고 포괄적인 데이터 세트를 보장해야 합니다. 엣지 케이스는 예상되는 상황이지만 일반적인 사용 시나리오에서는 발생할 가능성이 상대적으로 낮거나 드문 경우를 가리킵니다.
자체 개발한 파운데이션 모델 기반 인공지능 모델이 원시 데이터의 대부분을 다양한 자율주행 작업의 라벨을 가공합니다.
데이터 확보와 가공 그리고 관리는 머신러닝 개발 프로젝트 기간 전체와 서비스 운영 기간 전체에 걸쳐 반복되어야 합니다.
엣지 케이스는 경계 값에서 동작을 테스트하는 것을 의미합니다.
예를 들어 배열의 길이가 정해진 값인데 범위를 벗어난 요소에 접근하는 경우 엣지 케이스가 될 수 있습니다.

엣지 케이스는 예상하기 어려운 경우가 많기 때문에 다양한 사용 사례를 분석해 발생 가능성을 점검해야 합니다.
모델이 배포된 이후에라도 데이터 드리프트에 노출될 가능성이 있습니다. 머신러닝 컨텍스트에서 모델 성능 저하를 초래하는 입력 데이터의 변경 내용을 말하며 이로 인한 성능 저하가 발생할 수도 있고 이 경우에는 데이터셋과 모델이 지속적으로 업데이트되어야 하고 성능을 유지하기 위한 재학습이 필요합니다. 예측 불가능한 위험을 유발하는 데이터를 선제적으로 방어하고 모델의 안정성을 극대화합니다.

은행 계좌에 잔액이 부족한 상황에서 인출하려고 시도하는 경우가 코너 케이스에 해당합니다.
국내 도로 환경에서 구축한 비식별화된 인공지능 학습용 데이터셋을 일반에 공개하고 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 합니다. 국내 주요 도로변에 설치된 센서 등 엣지 인프라와 자율주행차를 통해 획득했으며 사람과 차량 그리고 자전거 등 움직이는 동적 객체와 신호등과 표지판 등 정적 객체를 인지 및 판단할 수 있는 데이터셋입니다. 국내 환경에 적합한 자율주행 인공지능 모델 개발과 학습에 활용할 수 있습니다.
엣지 케이스 데이터셋 구축 기술은 지속적으로 고도화될 것으로 전망됩니다. 자율주행과 로봇 그리고 드론 등 공간 지능을 개발하는 많은 기업들이 모두 겪고 있는 유사한 데이터 문제를 해결하고 인공지능 개발 과정에 없어서는 안 될 핵심 인프라가 되는 것을 목표로 고도화를 진행하고 있으며 합성 데이터를 통해 기업은 기존 인공지능 데이터의 한계에서 벗어날 수 있습니다. 인간이 수집한 데이터와 함께 합성 데이터를 사용하면 데이터 및 노동 비용 절감과 데이터 수집 속도 향상 그리고 엣지 케이스에 대한 액세스와 보다 포괄적이고 편향되지 않은 데이터 세트를 포함해 상당한 이점을 제공할 수 있습니다.
