수억 개의 점으로 가상 세계에 재현하는, 3D 포인트 클라우드 학습 데이터 구축법

트렌드
2026-06-07

포인트 클라우드의 정의와 로봇 응용



포인트 클라우드는 3차원 공간의 각 점이 가지는 좌표와 특성을 나타내는 데이터 형식입니다. 라이다(LiDAR) 센서나 깊이 카메라로부터 수집되며, 각 점은 X, Y, Z 좌표로 표현되고 색상, 강도, 반사율 같은 추가 정보를 포함할 수 있습니다. 포인트 클라우드는 로봇이 3차원 환경을 인식하고 이해하는 데 매우 유용합니다. 카메라 영상이 2차원 투영이라면 포인트 클라우드는 실제 3차원 공간 정보를 직접 제공합니다. 따라서 로봇이 물체의 깊이, 형태, 공간 위치를 정확하게 파악할 수 있습니다. 로봇의 조작 작업, 네비게이션, 환경 매핑 등 다양한 응용 분야에서 포인트 클라우드 데이터가 핵심적인 역할을 합니다.

라이다 센서와 깊이 카메라의 데이터 특성

포인트 클라우드는 두 가지 주요 센서로부터 생성됩니다. 라이다는 레이저 펄스를 발사하고 반사되어 돌아오는 신호의 시간을 측정하여 거리를 계산합니다. 라이다는 장거리 측정에 강하고 야외 환경에서도 작동하며 매우 정확한 거리 측정을 제공합니다. 반면 깊이 카메라는 적외선이나 구조광을 사용하여 가까운 거리의 깊이를 측정합니다. 깊이 카메라는 실내 환경에 적합하고 상대적으로 저렴하지만 측정 범위가 제한적입니다. 두 센서로부터 생성된 포인트 클라우드는 밀도, 정확도, 노이즈 수준에서 차이가 있을 수 있습니다. 로봇 응용에 따라 어떤 센서가 더 적합한지 선택해야 하며, 때로는 두 센서를 결합하여 사용합니다.

포인트 클라우드의 노이즈와 전처리



센서로부터 수집된 원본 포인트 클라우드는 항상 깨끗하지 않습니다. 센서의 측정 오류, 주변 광원의 간섭, 동적 객체의 이동 등으로 인해 노이즈가 포함될 수 있습니다. 노이즈가 있는 포인트 클라우드로 모델을 학습하면 인식 성능이 저하될 가능성이 있습니다. 따라서 학습 전에 노이즈를 제거하고 데이터를 정제하는 전처리 단계가 필요합니다. 외리어 제거 필터링은 비정상적으로 먼 거리의 포인트나 겹친 포인트를 제거합니다. 다운샘플링은 과도하게 밀집된 영역의 포인트 개수를 줄여 처리 효율을 높입니다. 이러한 전처리 작업이 적절하게 이루어지면 모델의 학습 효율과 성능이 크게 향상될 수 있습니다.

포인트 클라우드의 저장 형식과 데이터 구조

포인트 클라우드를 효율적으로 저장하고 처리하기 위해 다양한 파일 형식이 사용됩니다. PCD, PLY, LAS 같은 표준 형식은 포인트의 좌표와 속성을 구조화된 방식으로 저장합니다. PCD 형식은 Point Cloud Library에서 표준적으로 사용되며 이진과 텍스트 형식을 모두 지원합니다. PLY 형식은 색상 정보를 잘 보존하므로 컴퓨터 그래픽스 분야에서 널리 사용됩니다. LAS 형식은 대규모 라이다 데이터 저장에 특화되어 있습니다. 저장 형식의 선택은 데이터 크기, 처리 속도, 호환성 등을 고려하여 결정해야 합니다. 같은 데이터를 여러 형식으로 저장하면 파일 크기가 몇 배 차이날 수 있으므로 신중하게 선택해야 합니다.

포인트 클라우드의 레이블링과 세분화

포인트 클라우드를 로봇 학습에 사용하려면 각 포인트에 의미 있는 라벨이 부여되어야 합니다. 포인트별 분류는 각 포인트가 어떤 객체나 표면에 속하는지 표시하는 작업입니다. 예를 들어 실내 환경의 포인트 클라우드에서 각 포인트를 "벽", "바닥", "가구", "사람" 등으로 분류합니다. 세분화(segmentation)는 연관된 포인트들을 그룹으로 묶어 개별 객체를 식별합니다. 이러한 레이블링 작업은 수작업으로는 매우 시간이 오래 걸릴 수 있습니다. 수백만 개의 포인트를 하나하나 표시하는 것은 비현실적입니다. 따라서 자동 레이블링이나 반자동 방법이 필요하며, 일부 기존 모델의 출력을 초기 레이블로 사용한 후 인간이 검증하고 수정하는 방식이 효율적일 수 있습니다.

■ 3D 포인트 클라우드 학습 데이터의 핵심 특성

• 센서 유형별 특성 라이다와 깊이 카메라의 특성을 고려합니다

• 공간 좌표 정보 X, Y, Z 좌표로 3차원 위치를 표현합니다

• 추가 속성 색상, 강도, 반사율 등의 정보를 함께 저장합니다

• 가변적 밀도 측정 거리에 따라 포인트의 밀도가 변합니다

■ 포인트 클라우드 데이터 처리 및 준비 단계

• 노이즈 제거 센서 오류로 인한 이상 포인트를 제거합니다

• 다운샘플링 처리 효율을 높이기 위해 포인트 개수를 조절합니다

• 정렬 및 정규화 좌표계를 통일하고 스케일을 맞춥니다

• 레이블 생성 각 포인트의 클래스 또는 의미를 표시합니다

포인트 클라우드의 기하학적 특징 추출



딥러닝 모델이 포인트 클라우드를 효과적으로 처리하려면 유의미한 특징이 추출되어야 합니다. 각 포인트 주변의 기하학적 관계, 곡률, 표면 법선 벡터 같은 특징들이 중요합니다. 예를 들어 모서리 부분의 포인트는 높은 곡률을 가지며 평면 표면의 포인트는 낮은 곡률을 가집니다. 이러한 기하학적 특징은 포인트 클라우드 기반 신경망의 학습을 촉진할 수 있습니다. 또한 포인트 간의 거리 관계, 근처 포인트의 분포 패턴도 중요한 정보입니다. 이러한 특징들을 미리 계산하여 데이터에 추가하면 모델의 학습 효율이 향상될 가능성이 있습니다. 다만 특징 추출 과정이 추가 계산을 요구하므로 처리 시간과 저장 공간의 증가를 고려해야 합니다.

동적 포인트 클라우드와 시계열 데이터 처리

로봇이 움직이는 환경에서는 포인트 클라우드도 시간에 따라 변합니다. 연속된 포인트 클라우드 프레임들은 시계열 데이터를 형성하며, 이를 통해 로봇이 환경의 동적 변화를 학습할 수 있습니다. 예를 들어 사람의 움직임, 다른 로봇의 이동, 환경 구조의 변화를 인식해야 합니다. 동적 포인트 클라우드 데이터에서는 프레임 간의 대응 관계(어떤 포인트가 다음 프레임에서는 어디로 이동했는지)를 파악해야 합니다. 이는 정적 포인트 클라우드보다 처리가 복잡하며 더 정교한 모델이 필요합니다. 또한 저장 데이터량도 상당히 증가하므로 효율적인 압축 기법을 사용해야 할 가능성이 있습니다.

포인트 클라우드의 스케일 변화와 정규화



서로 다른 센서에서 수집된 포인트 클라우드나 서로 다른 환경에서 수집된 포인트 클라우드는 좌표 스케일이 다를 수 있습니다. 일부 데이터는 미터 단위로 표현되고 다른 데이터는 센티미터 단위로 표현될 수 있습니다. 또한 센서의 원점이 다르므로 좌표계 정렬이 필요합니다. 이러한 불일치를 해결하기 위해 정규화 과정이 필수적입니다. 데이터 정규화는 모든 포인트 클라우드를 동일한 좌표계로 변환하고 통일된 스케일로 조정합니다. 정규화가 제대로 이루어지지 않으면 모델이 학습 데이터의 스케일에만 의존하여 새로운 스케일의 데이터에 대응하지 못할 가능성이 있습니다.

포인트 클라우드의 회전 불변성과 증강

포인트 클라우드는 회전되어도 동일한 객체를 나타냅니다. 로봇이 같은 물체를 다양한 각도에서 봐도 인식해야 하므로 회전 불변성이 중요한 특성입니다. 학습 데이터에서 회전 변화를 포함시키기 위해 회전 변환을 적용하여 데이터를 증강합니다. 예를 들어 같은 물체의 포인트 클라우드를 여러 각도로 회전시켜 여러 버전을 생성합니다. 또한 노이즈 추가, 점의 개수 변화, 부분적 폐색 같은 다른 형태의 증강도 강건한 모델 학습에 도움이 될 수 있습니다. 다만 과도한 증강은 비현실적인 데이터를 만들 수 있으므로 증강 정도를 신중하게 조절해야 합니다.

대규모 포인트 클라우드 데이터셋의 구축과 관리

실제 로봇 응용에 필요한 포인트 클라우드 데이터는 상당한 규모입니다. 수천 개 이상의 포인트 클라우드 샘플, 다양한 환경과 조건, 정확한 라벨이 필요합니다. 대규모 데이터셋을 구축하고 관리하기 위해서는 체계적인 파이프라인이 필요합니다. 센서 캘리브레이션, 일관된 데이터 수집, 품질 검증, 메타데이터 기록 등이 모두 중요합니다. 또한 데이터 버전 관리와 추적성 확보도 필수적입니다. 어떤 데이터가 어떤 환경에서 언제 수집되었는지 명확하게 기록해야 합니다. 대규모 데이터셋의 저장과 처리는 상당한 컴퓨팅 자원을 요구하므로 클라우드 스토리지나 분산 저장소 활용을 검토해야 할 가능성이 있습니다.

이전글
이전글
다음글
다음글
목록보기