
자율주행 AMR은 인간의 개입 없이 스스로 주변을 인식하고 안전하게 움직여야 합니다. 이는 단순한 프로그래밍으로는 불가능한 과제입니다. 물류 센터의 환경은 끊임없이 변하고, 예상치 못한 상황들이 계속 발생하기 때문입니다. 새로운 장애물, 시간에 따른 조명 변화, 센서의 오류, 다른 로봇과의 상호작용 같은 것들은 규칙으로 모두 정의할 수 없습니다.
이 문제를 해결하는 핵심은 데이터입니다. 대량의 센서 데이터와 현실의 경험들을 기계학습 모델에 학습시키면, 모델은 복잡한 패턴을 스스로 발견합니다. 프로그래머가 규칙을 정의하지 않아도 데이터로부터 의사결정의 원칙을 배웁니다.
데이터 학습 구조는 단순히 많은 데이터를 모으는 것을 의미하지 않습니다. 어떤 데이터를 모을 것인가, 어떻게 라벨을 붙일 것인가, 어떻게 검증할 것인가, 어떻게 지속적으로 개선할 것인가 하는 전체 체계를 포함합니다. 이 체계가 잘 구축되면 AMR의 성능은 급격히 향상됩니다.
자율주행 AMR 개발의 첫 번째 단계는 다양한 실제 운영 환경에서 센서 데이터를 대량으로 수집하는 것입니다.
수집 환경의 다양성이 매우 중요합니다. 한 물류 센터에서만 데이터를 모으면 그곳의 특성에 맞춘 모델이 됩니다. 다른 센터로 옮기면 성능이 크게 떨어질 수 있습니다. 따라서 다양한 시간대, 다양한 계절, 다양한 조명 조건, 다양한 물품 종류에서 데이터를 수집해야 합니다. 온습도가 높은 환경, 직사광선이 들어오는 환경, 야간의 어두운 환경 같은 극단적인 상황도 포함됩니다.
센서 설치의 일관성도 필수입니다. 카메라의 위치와 각도, LiDAR의 높이와 방향, 센서 간의 거리가 모든 데이터 수집에서 동일해야 합니다. 센서가 조금 다르면 수집된 데이터가 일관성을 잃고 학습의 질이 떨어집니다.
메타데이터 기록은 각 센서 데이터와 함께 수집 시간, 위치, 환경 조건, 발생한 이벤트 같은 정보를 저장하는 것입니다. 나중에 데이터를 분석할 때 이 정보가 매우 유용합니다. "이 상황에서는 왜 실패했는가?"를 추적할 수 있기 때문입니다.

수집한 원시 데이터는 그 자체로는 학습에 사용할 수 없습니다. 정답을 붙여야 하는데, 이를 라벨링 또는 주석이라고 부릅니다.
이미지 라벨링은 사진에 "여기 장애물이 있다", "여기 사람이 있다", "여기 팔레트가 있다" 같은 정보를 붙입니다. 더 정교한 라벨링은 각 물체의 정확한 경계를 그립니다. 바운딩 박스(직사각형)를 물체 주변에 그리거나, 세그멘테이션(정확한 모양을 따라 그리기)을 합니다. 이 작업은 상당한 시간과 인력이 필요하지만 모델의 성능을 직접 좌우합니다.
포인트 클라우드 라벨링은 LiDAR 데이터의 각 점을 분류하는 것입니다. "이 점은 바닥", "이 점은 벽", "이 점은 장애물"이라고 표시합니다. 3D 데이터이므로 2D 이미지보다 더 복잡합니다.
라벨링의 정확도 검증은 여러 사람이 같은 데이터를 독립적으로 라벨링한 후 결과를 비교하는 것입니다. 의견이 다르면 검토 회의를 열어서 올바른 라벨을 결정합니다. 이런 상호 검증(inter-annotator agreement)이 높을수록 라벨링의 품질이 높습니다.

수집하고 라벨링한 데이터를 어떻게 나눌 것인가는 학습의 성공을 크게 좌우합니다. 훈련 세트는 모델이 실제로 학습하는 데 사용되는 데이터입니다. 보통 전체 데이터의 60~70%를 할당합니다. 이 데이터로 모델의 가중치를 조정합니다.
검증 세트는 학습 과정 중에 모델의 성능을 평가하는 데 사용됩니다. 보통 10~20%를 할당합니다. 훈련이 진행되면서 검증 세트의 성능이 더 이상 개선되지 않으면 훈련을 멈춥니다. 이렇게 하면 과적합(학습 데이터에만 맞춰지는 현상)을 방지할 수 있습니다.
테스트 세트는 모델이 처음 보는 데이터입니다. 10~20%를 할당합니다. 훈련과 검증이 완전히 끝난 후에만 이 데이터로 최종 성능을 평가합니다. 이 세트의 성능이 실제 환경에서 모델이 어떻게 작동할 것인가를 보여줍니다.
분할 방식도 중요합니다. 시간 기준 분할은 시간순으로 나누는 것으로, 과거 데이터로 학습해서 미래를 예측하는 실제 상황을 모방합니다. 공간 기준 분할은 다른 물류 센터의 데이터를 테스트 세트로 사용해서 모델의 일반화 능력을 평가합니다.

실제 환경에서 수집 가능한 데이터의 양은 제한적입니다. 특히 드문 상황(극한 환경, 특정 실수)의 데이터는 거의 없을 수 있습니다. 데이터 증강은 기존 데이터를 변형해서 새로운 데이터를 만드는 기법입니다. 이미지를 회전시키거나, 밝기를 조정하거나, 작은 노이즈를 더합니다. 포인트 클라우드는 회전, 스케일 변경, 노이즈 추가를 합니다. 이렇게 하면 실제로 더 많은 데이터를 수집한 효과를 얻습니다. 다만 현실성을 잃지 않도록 주의해야 합니다. 예를 들어 로봇이 절대 반대로 뒤집힐 수 없다면 180도 회전은 현실적이지 않습니다.
수집된 데이터에서 정상 상황은 99%인데 위험 상황은 1% 미만일 수 있습니다. 모델은 자동으로 많은 데이터에 맞춰지므로 드문 상황을 잘 학습하지 못합니다. 이를 해결하기 위해 여러 방법이 있습니다. 드문 클래스의 데이터를 증강해서 늘릴 수 있고, 학습 중에 드문 클래스에 더 큰 가중치를 줄 수 있으며, 오버샘플링(드문 데이터를 반복해서 사용)이나 언더샘플링(흔한 데이터를 줄여 사용)을 할 수 있습니다.
실제 데이터 수집이 불가능하거나 매우 비싼 경우, 컴퓨터로 만든 가상 데이터를 사용합니다.
시뮬레이션 환경은 Gazebo, CARLA, Webots 같은 소프트웨어로 만든 가상 물류 센터입니다. 여기서 로봇은 가상 센서로 데이터를 수집합니다. 극단적인 상황도 쉽게 만들 수 있습니다. 폭우, 안개, 야간, 대규모 정전 같은 위험한 상황도 시뮬레이션에서 안전하게 경험할 수 있습니다.
도메인 무작위화는 시뮬레이션과 현실의 차이를 줄입니다. 시뮬레이션의 조명, 카메라 성질, 물체의 재질을 무작위로 변경하면서 학습하면, 모델이 이런 변화에 견딜 수 있게 됩니다. 예를 들어 벽의 색을 다르게 해서 학습하면, 현실의 다양한 색 벽에도 대응합니다.
하이브리드 접근은 시뮬레이션 데이터와 실제 데이터를 섞어서 사용합니다. 시뮬레이션의 효율성과 실제 데이터의 현실성을 결합합니다.

개발 단계의 학습이 끝나도, 배포 후에도 학습은 계속됩니다. 온라인 학습은 배포된 로봇이 실제 운영 중에 마주한 새로운 상황에서 배우는 방식입니다. 로봇이 매일 새로운 데이터를 수집하고, 이를 중앙 시스템에 보냅니다. 중앙에서는 주기적으로 새로운 모델을 학습시켜 다시 배포합니다. 이렇게 하면 시간이 지날수록 모델이 점점 개선됩니다.
오프라인 재학습은 일정 기간(예: 한 달)의 데이터를 모아서 처음부터 다시 학습하는 방식입니다. 온라인 학습보다 더 체계적으로 할 수 있고, 나쁜 데이터를 필터링할 수 있습니다. 피드백 루프는 모델의 실패 사례를 기록하고 분석해서 다음 학습에 반영하는 구조입니다. "왜 이 상황에서 실패했는가?", "비슷한 다른 상황에서도 실패할까?"를 추적합니다.
학습한 모델이 실제로 작동하는가를 검증해야 합니다. 메트릭 정의는 "모델이 잘 작동한다"를 어떻게 측정할 것인가를 정의하는 것입니다. 장애물 감지라면 정밀도(보고한 장애물 중 실제인 비율), 재현율(실제 장애물 중 감지한 비율), F1 스코어(둘의 조화 평균) 같은 지표를 사용합니다. 길을 찾는 문제라면 도착 성공률, 평균 이동 거리, 충돌 횟수 같은 지표를 봅니다.
테스트 환경은 다양한 조건에서의 성능을 평가합니다. 최적의 조건뿐 아니라 나쁜 조건(극도로 어두운 환경, 많은 노이즈)도 포함합니다. 극한 환경에서의 성능이 안정적이어야 신뢰할 수 있는 모델입니다. A/B 테스트는 새로운 모델과 기존 모델을 동시에 실행해서 비교합니다. 실제 환경에서 새 모델이 정말 더 나은가를 확인합니다.
AMR에는 여러 센서가 있으므로, 이들을 함께 처리하는 모델을 학습해야 합니다.
초기 융합은 센서의 원시 데이터를 함께 신경망의 입력으로 제공합니다. RGB 이미지와 포인트 클라우드를 직접 함께 처리합니다. 이렇게 하면 신경망이 두 정보의 상관관계를 학습합니다.
중간 융합은 각 센서의 데이터를 각각 처리한 후 그 결과를 결합합니다. 이미지 처리 신경망의 출력과 포인트 클라우드 처리 신경망의 출력을 합칩니다. 이 방식이 더 안정적이고 각 센서에 최적화된 구조를 사용할 수 있습니다.
후기 융합은 각 센서로부터 최종 예측을 받아서 결합합니다. 카메라는 "70% 확신으로 장애물", LiDAR는 "90% 확신으로 장애물"이라고 하면 둘을 합쳐서 최종 결정을 합니다.
