
로봇이 다양한 물체를 집을 수 있도록 학습하기 위해서는, 단순히 물체의 이미지만이 아니라 물체의 위치, 크기, 질감, 재질, 그리고 로봇 팔의 다양한 그리핑 시도와 그 결과를 모두 기록한 멀티모달 데이터셋이 필요하며, 이러한 데이터셋을 체계적으로 구축하는 것이 로봇의 작업 성능을 결정하는 매우 중요한 요소가 됩니다. 예를 들어 원통형 물체를 집으려 할 때, 로봇이 어느 높이에서 접근하고, 어느 각도로 집어야 하며, 어느 정도의 손가락 힘으로 집어야 하는지를 배우기 위해서는, 수백 번의 성공과 실패 경험을 담은 데이터가 축적되어야 합니다. 따라서 대규모 데이터셋 구축은 고도로 자율적인 로봇 시스템 개발의 필수 기초가 되며, 이 기초가 튼튼할수록 최종적인 로봇의 작업 성공률도 높아질 수 있습니다.
로봇 물체 집기 데이터셋을 구축할 때 일반적인 RGB 카메라만이 아니라 깊이 정보를 제공하는 RGB-D 카메라를 함께 사용하면, 물체의 3차원 위치와 형태 정보를 함께 수집할 수 있게 되므로, 로봇이 물체를 집을 때 필요한 정보를 더욱 정확하게 학습할 수 있게 됩니다. RGB 카메라만으로는 물체의 정확한 거리와 높이를 파악하기 어렵지만, RGB-D 카메라를 통해 획득된 깊이 정보는 로봇의 팔 길이와 그리핑 포인트의 계산에 직접 활용될 수 있습니다. 또한 3차원 정보는 물체의 표면 특성과 그리핑 가능 영역을 식별하는 데도 매우 유용하므로, 데이터셋의 정보 밀도를 크게 높일 수 있습니다.
• RGB 이미지: 물체의 시각적 특성과 배경 정보
• 깊이 맵: 물체와 배경의 3차원 거리 정보
• 물체 위치: 이미지 좌표와 3차원 공간상의 위치
• 그리핑 포인트: 로봇이 물체를 집기에 최적의 위치
• 그리핑 방향: 손가락이 접근해야 할 방향과 각도
• 그리핑 결과: 성공 또는 실패 여부와 그 이유
• 물체 속성: 크기, 무게, 재질, 취약점 등의 메타데이터

실제 산업 환경에서 로봇이 마주칠 수 있는 다양한 상황을 반영하기 위해, 크기가 작은 부품부터 크고 무거운 물체까지, 단단한 금속 물체부터 부드러운 직물 물체까지, 평평한 표면부터 불규칙한 형태까지를 모두 포함하는 데이터를 수집해야 하므로, 데이터셋 구축 과정은 상당한 시간과 노력이 필요하게 됩니다. 또한 조명 조건, 배경의 복잡도, 물체 간의 겹침 정도 같은 환경 변수도 함께 변화시키면서 데이터를 수집해야 로봇이 다양한 상황에서 강건하게 작동할 수 있게 됩니다. 이러한 다양성 있는 데이터 수집은 초기에는 시간이 많이 소요되지만, 결과적으로 훨씬 더 범용적이고 적응력 높은 로봇 시스템을 만들어냅니다.


원시 데이터로부터 로봇 학습에 필요한 정보를 추출하기 위해서는 각 이미지에서 물체의 위치, 크기, 그리핑 포인트 같은 정보를 표시하는 라벨링 작업이 필요한데, 초기에는 인간이 직접 라벨링하고, 이렇게 수집된 라벨링된 데이터로 머신러닝 모델을 학습시킨 후, 그 모델이 새로운 이미지의 라벨링을 자동으로 수행하도록 함으로써, 전체 라벨링 비용을 크게 절감할 수 있게 됩니다. 예를 들어 처음 1,000개의 이미지는 인간이 직접 라벨링하지만, 이를 바탕으로 학습된 모델이 다음 9,000개의 이미지를 자동으로 라벨링할 수 있으므로, 인력 비용을 90%까지 절감할 수 있습니다. 다만 자동 라벨링의 정확도가 떨어지는 부분에 대해서는 인간이 검수하고 수정하는 품질 관리 단계가 필수적입니다.

로봇 학습 데이터셋에서 흔히 발생하는 문제는 그리핑 성공 사례만 과도하게 많이 포함되는 것인데, 로봇이 실제 환경에서 마주할 수 있는 다양한 실패 상황도 함께 학습해야만 그 상황을 피하거나 극복할 수 있는 능력을 갖출 수 있으므로, 성공과 실패의 비율을 적절하게 조정하여 균형잡힌 데이터셋을 구성하는 것이 중요합니다. 예를 들어 100개의 그리핑 시도 중 70개가 성공하고 30개가 실패했다면, 학습 데이터셋도 비슷한 비율로 성공과 실패 사례를 포함하도록 구성해야 로봇이 현실적인 성공률을 가질 수 있게 됩니다. 또한 실패의 원인(물체 미끄러짐, 불안정한 위치, 손가락 간섭 등)을 분석하고 분류하는 것도 데이터셋의 정보 가치를 크게 높입니다.
서로 다른 로봇 팔은 손가락의 개수, 그리핑 력, 움직임의 자유도가 모두 다르므로, 같은 물체를 집을 때도 로봇 팔의 특성에 따라 최적의 그리핑 전략이 달라지게 되며, 따라서 특정 로봇 팔을 위한 데이터셋을 구축할 때는 그 로봇의 고유한 특성을 충분히 반영해야 합니다. 예를 들어 3개의 손가락을 가진 로봇 팔과 5개의 손가락을 가진 로봇 팔에서는 같은 원통형 물체를 집는 방식이 완전히 다르므로, 각각에 맞는 별도의 데이터셋이 필요하게 됩니다. 손의 촉각 센서가 있는지 없는지에 따라서도 학습 전략이 달라지므로, 로봇의 센서 구성을 명확히 파악하고 이에 맞는 데이터를 수집하는 것이 중요합니다.

구축된 로봇 물체 집기 데이터셋을 학계나 산업계에 공개하면, 전 세계의 연구자들이 그 데이터셋을 활용하여 더욱 정교한 로봇 학습 알고리즘을 개발할 수 있게 되며, 이는 로봇 기술의 전반적인 발전 속도를 크게 가속화할 수 있게 합니다. 예를 들어 대규모의 공개 데이터셋이 존재하면, 개별 기업이나 연구소가 자신의 데이터를 수집하는 데 들어갈 시간과 비용을 크게 줄일 수 있으며, 그 대신 더욱 혁신적인 알고리즘 개발에 집중할 수 있게 됩니다.
