
현대의 AI 시스템은 중앙 데이터센터에서만 작동하지 않습니다. 스마트폰, IoT 센서, 자동차 내 컴퓨터, 산업용 카메라 등 다양한 엣지 디바이스에서도 AI 모델이 실행되어야 합니다. 이러한 엣지 디바이스들은 클라우드 서버와 다른 제약 조건을 가집니다. 메모리가 제한적이고 CPU 성능이 낮으며 전력 소비가 중요한 고려 사항입니다. 따라서 클라우드 환경에 최적화된 데이터 포맷과 모델을 그대로 엣지 디바이스에 옮겨서는 안 되며, 엣지 환경 특성에 맞는 별도의 데이터 포맷이 필요합니다. 이러한 포맷은 데이터 크기를 최소화하면서도 추론 정확도를 최대한 유지해야 하는 복잡한 요구사항을 반영합니다.
AI 모델이 엣지 디바이스에서 빠르게 작동하기 위해서는 모델의 가중치와 활성화 값을 더 단순한 형식으로 표현해야 합니다. 양자화(quantization)는 부동소수점 32비트(float32) 숫자를 8비트 정수나 16비트 부동소수점으로 변환하는 기술입니다. 이를 통해 모델 크기를 4분의 1 또는 2분의 1로 줄일 수 있습니다. 양자화된 모델은 메모리 사용량이 적으므로 엣지 디바이스의 제한된 저장 공간에 효율적으로 배포될 수 있습니다. 또한 정수 연산은 부동소수점 연산보다 빠르므로 추론 속도가 향상됩니다. 다만 양자화 과정에서 정밀도가 손실되므로 이를 최소화하는 것이 중요합니다. 양자화 후에도 모델의 정확도를 어느 수준 이상 유지할 수 있는지는 원본 데이터의 품질에 따라 달라질 수 있습니다.

엣지 디바이스에서 수집되는 센서 데이터와 이미지 데이터는 다양한 형식과 범위를 가집니다. 데이터 정규화는 이러한 다양한 범위의 데이터를 0~1 또는 -1~1과 같은 표준화된 범위로 변환하는 과정입니다. 정규화된 데이터는 서로 다른 엣지 디바이스에서 일관된 방식으로 처리될 수 있으므로 호환성을 보장합니다. 또한 정규화는 모델 학습과 추론의 안정성을 높입니다. 정규화되지 않은 원본 데이터는 극단값에 영향을 받기 쉬우므로 이상 값이 모델 성능에 미치는 영향이 클 수 있습니다. 엣지 환경에서 수집된 데이터는 노이즈가 많을 가능성이 높으므로 일관된 정규화 방식이 특히 중요합니다. 따라서 포맷 표준에서는 정규화 방법을 명확하게 정의하여 모든 디바이스가 동일하게 적용할 수 있도록 합니다.

엣지 디바이스는 메모리가 제한적이므로 데이터를 최대한 효율적으로 저장해야 합니다. 희소 데이터 표현(sparse data representation)은 0이 아닌 값들만 저장하여 메모리 사용량을 크게 줄일 수 있습니다. 예를 들어 대부분의 값이 0인 행렬에서는 0이 아닌 값의 위치와 값만 저장하면 됩니다. 이러한 희소 표현은 특히 텍스트 데이터나 그래프 데이터에서 효과적입니다. 다만 희소 표현은 데이터 접근 방식이 복잡해질 수 있으므로 엣지 디바이스의 연산 특성에 맞춰 설계해야 합니다. 순차 접근이 많은 환경에서는 희소 표현이 성능 저하를 초래할 가능성이 있으므로 신중하게 선택해야 합니다.

엣지 디바이스에서 데이터 처리 방식은 크게 두 가지로 나뉩니다. 배치 처리는 일정량의 데이터를 모아서 한 번에 처리하는 방식이고, 스트리밍 처리는 데이터가 들어오는 대로 즉시 처리하는 방식입니다. 배치 처리의 경우 데이터를 연속된 블록으로 저장하는 포맷이 효율적이며, 스트리밍 처리의 경우 개별 샘플 단위로 빠르게 읽을 수 있는 포맷이 필요합니다. 같은 모바일 기기라도 오프라인 추론을 위해서는 배치 포맷이 적합하고, 실시간 카메라 피드 처리를 위해서는 스트리밍 포맷이 적합합니다. 따라서 엣지 디바이스 데이터 포맷 표준은 두 가지 처리 방식을 모두 지원하도록 설계되어야 합니다.
• 양자화 지원 부동소수점과 정수 표현을 유연하게 지원합니다
• 메모리 효율성 데이터 크기를 최소화하면서 정확도를 유지합니다
• 표준화된 정규화 모든 디바이스에서 일관된 데이터 처리를 보장합니다
• 희소 표현 지원 0이 아닌 값만 저장하여 저장 공간을 절감합니다
• 배치 및 스트리밍 두 처리 방식을 모두 지원합니다
• 메타데이터 포함 데이터 처리에 필요한 정보를 함께 저장합니다
• 버전 관리 포맷의 호환성을 유지하면서 개선합니다
• 검증 기능 데이터 무결성을 자동으로 확인합니다

데이터를 효율적으로 저장하고 읽기 위해서는 명확한 컨테이너 포맷이 필요합니다. 헤더 부분에는 데이터의 메타정보(차원, 데이터 타입, 정규화 범위 등)를 저장하고 본체 부분에는 실제 데이터를 저장합니다. 이러한 구조를 통해 엣지 디바이스는 데이터를 읽기 전에 어떤 형식인지 먼저 파악할 수 있습니다. 헤더는 간결해야 하므로 필수 정보만 포함시킵니다. 또한 유연성을 위해 선택적 메타데이터를 추가할 수 있는 확장 영역을 포함합니다. 이러한 설계를 통해 포맷이 진화하면서도 기존 디바이스와의 호환성을 유지할 수 있습니다. 실제로 많은 엣지 AI 프레임워크들이 이러한 헤더 구조를 채택하고 있으므로 표준화의 기반이 될 수 있습니다.
엣지 디바이스는 중앙 서버와 지속적으로 통신해야 하는 경우가 많습니다. 모델 업데이트, 새로운 데이터 전송, 추론 결과 송신 등의 과정에서 네트워크 대역폭이 제한될 수 있으므로 데이터 압축이 중요합니다. 손실 압축을 사용하면 데이터 크기를 극도로 줄일 수 있지만 정보 손실이 발생합니다. 무손실 압축은 정보는 유지하지만 압축률이 낮을 수 있습니다. 엣지 환경에서는 두 방식을 상황에 따라 선택하여 적용할 수 있는 유연성이 필요합니다. 예를 들어 실시간 카메라 피드는 약간의 손실을 감수할 수 있지만 중요한 센서 데이터는 무손실 압축을 사용해야 합니다. 포맷 표준에 이러한 선택지를 명시하면 각 애플리케이션이 자신의 요구사항에 맞게 설정할 수 있습니다.

엣지 디바이스에서 생성되는 많은 데이터는 시계열 특성을 가집니다. 여러 센서로부터 데이터가 들어올 때 정확한 타임스탐프 없으면 데이터의 순서가 뒤바뀔 수 있으며 이는 모델의 추론 결과에 영향을 미칩니다. 따라서 엣지 데이터 포맷은 정밀한 타임스탐프를 저장할 수 있어야 합니다. 또한 여러 엣지 디바이스에서 수집된 데이터를 통합할 때 각 디바이스의 시간이 정확히 동기화되어 있어야 합니다. 이를 위해 포맷에는 시간 동기화 정보를 포함시킬 수 있는 공간이 필요합니다. 또한 데이터 손실이 발생한 경우를 표시할 수 있는 메커니즘도 필요합니다. 연속된 타임스탐프에 갭이 있으면 그 사이에 데이터 손실이 있었다는 것을 나타냅니다.
엣지 디바이스는 다양한 하드웨어 특성을 가집니다. 고급 스마트폰은 높은 성능을 제공하지만 단순한 IoT 센서는 매우 제한적입니다. 데이터 포맷이 다양한 하드웨어에서 효율적으로 작동하려면 각 디바이스의 특성을 고려한 최적화가 필요합니다. 예를 들어 GPU가 있는 디바이스는 SIMD 연산에 최적화된 포맷을 선호하고 CPU만 있는 디바이스는 순차 접근에 최적화된 포맷을 선호합니다. 메모리 대역폭도 중요한 고려 사항입니다. 메모리 접근이 많은 디바이스에서는 메모리 캐시 크기에 맞춘 데이터 청킹이 성능을 크게 향상시킬 수 있습니다. 포맷 표준에서 이러한 최적화 옵션을 선택적으로 지원하면 각 디바이스가 최적의 성능을 얻을 수 있습니다.
