최근 AI 산업의 관심은 생성형 AI를 넘어 현실 세계에서 직접 움직이고 행동하는 피지컬 AI(Physical AI)로 확장되고 있습니다.

글로벌 시장 규모도 빠르게 성장하고 있습니다. 골드만삭스는 전 세계 휴머노이드 로봇 시장 규모를 2035년 380억 달러(약 55조 원)로 전망하며 기존 예측 대비 6배 이상 상향 조정했으며, 모건스탠리는 장기적으로 휴머노이드 생태계가 최대 5조 달러 규모까지 성장할 수 있다고 전망하고 있습니다.
생성형 AI가 디지털 데이터를 이해하고 생성하는 데 집중했다면, 피지컬 AI는 현실 세계를 이해하고 행동하는 AI입니다. 하지만 피지컬 AI 경쟁력은 모델만으로 결정되지 않습니다. 현실 세계를 학습하는 AI 일수록 더 많은 데이터가 필요하며, 그 데이터를 얼마나 효율적으로 수집·검증·통합할 수 있는지가 새로운 경쟁력으로 떠오르고 있습니다.
피지컬 AI 시대의 경쟁력은 결국 ‘데이터 인프라’에서 시작됩니다.
피지컬 AI는 현실 세계를 인식하고 판단하며 직접 행동하는 인공지능입니다. 단순히 질문에 답하거나 콘텐츠를 생성하는 AI를 넘어, 실제 환경 속에서 주변 상황을 이해하고 행동까지 수행하는 것이 특징입니다.
대표적인 활용 분야는 다음과 같습니다.
- 휴머노이드 로봇
- 제조 현장 협동 로봇
- 물류 자동화 시스템
- 자율주행 차량
- 스마트팩토리
- 산업 안전 솔루션
최근 엔비디아를 비롯한 글로벌 기업들이 피지컬 AI를 차세대 AI 산업의 핵심 영역으로 주목하는 이유도 여기에 있습니다.
피지컬 AI를 이해하기 위해서는 WFM과 RFM, 그리고 VLA 개념을 함께 살펴볼 필요가 있습니다.
WFM은 AI가 공간 구조를 파악하고, 물체의 상태를 인식하며, 환경 변화와 물리 법칙을 학습하도록 돕는 모델입니다. 쉽게 말해 ‘세상이 어떻게 움직이는지’를 학습하는 모델입니다.
- 공간 구조 이해
- 물체 상태 인식
- 환경 변화 예측
- 물리 법칙 학습
RFM는 로봇이 어떤 작업을 어떤 순서로 수행해야 하는지, 특정 상황에서 어떤 행동을 선택해야 하는지를 학습합니다.
- 작업 수행 방법 학습
- 행동 전략 최적화
- 다양한 환경 적응
WFM이 세상을 이해하는 모델이라면, RFM은 그 이해를 실제 행동으로 연결하는 모델입니다.
WFM, RFM과 함께 시각(Vision)·언어(Language)·행동(Action)을 하나로 연결하는 VLA 모델이 피지컬 AI의 핵심 기술로 주목받고 있습니다.
- 기존 Rule-based 시스템: 정해진 규칙에 따라서만 동작
- VLA 모델: LLM 기반으로 상황을 스스로 추론하고 판단, 데이터 학습을 통해 스스로 행동하는 '지능형 존재'로 진화
.png)
예를 들어, 제조 현장에서 로봇에게 “컨베이어 벨트 위의 부품을 집어 지정된 위치에 놓아라” 라는 작업이 주어졌다고 가정해보겠습니다. 먼저 WFM이 카메라와 센서를 통해 주변 공간 구조와 물체의 위치, 환경 변화를 인식하고 현재 상황을 파악합니다.
VLA는 이 환경 인식 정보를 바탕으로 작업 지시를 이해하고, 어떤 행동을 수행할지 계획을 수립합니다. 이후 RFM은 실제로 물체를 집고 이동시키는 행동을 수행하며, 작업 결과를 학습 데이터로 축적합니다. 즉, VLA가 인식·이해·행동의 전체 흐름을 연결한다면, WFM은 현실 세계를 이해하는 역할을, RFM은 실제 행동을 수행하는 역할을 담당합니다.
그리고 이 VLA 모델이 제대로 작동하려면 ‘양질의 대규모 학습 데이터’가 전제되어야 합니다.
미국과 중국도 막 시작한 최첨단 AI 기술이라 평가받는 피지컬 AI. 그 경쟁에서 가장 먼저 부딪히는 현실적인 장벽은 모델 설계나 하드웨어 성능이 아닙니다. 바로 학습에 쓸 수 있는 데이터의 부족입니다. 기존 생성형 AI는 인터넷에 축적된 방대한 텍스트와 이미지 데이터를 활용할 수 있었습니다. 반면, 피지컬 AI는 현실 세계에서 직접 데이터를 만들어야 합니다.
예를 들어 로봇이 물체를 집고 옮기는 작업 하나를 학습하더라도, 물체의 크기와 형태, 위치, 조명 환경, 작업 공간의 구조에 따라 수많은 변수가 발생합니다. 로봇이 성공적으로 작업한 사례 뿐 아니라 실패하고 다시 시도하는 과정까지 모두 학습 데이터가 됩니다.
제조 현장의 장비 움직임, 물류 창고의 동선, 사람과 로봇이 함께 작업하는 환경 역시 마찬가지입니다. 이처럼 피지컬 AI 데이터는 실제 현장에서 직접 생성하고 검증해야 하는 데이터입니다.

① 멀티모달 센서 데이터: 카메라, LiDAR, IMU 등 다양한 센서에서 동시에 수집되는 데이터
② 행동-결과 데이터: 로봇이 실제 작업을 수행하며 누적되는 성공·실패 경험 데이터
③ 도메인 갭 데이터: 시뮬레이션 환경과 현실 환경 간의 간극을 메우는 데이터
④ 실환경 데이터: 제조 현장, 물류 환경 등 실제 운영 현장에서 수집한 데이터
이 모든 것을 현실에서 직접 만들어내야 한다는 점이 생성형 AI와 근본적으로 다른 부분입니다.
여기서 더 큰 문제가 생깁니다. 바로 데이터의 분산입니다. 피지컬 AI 개발에는 실제 산업 현장에서 수집한 Real-world Data와 시뮬레이션 환경에서 생성한 Synthetic Data가 모두 필요합니다. 하지만 이 데이터들은 서로 다른 형식과 저장소에 분산되어 있으며, 수집 주체 또한 다양합니다.
따라서 피지컬 AI 개발에서는 데이터를 확보하는 것 뿐만 아니라, 모델이 활용할 수 있도록 데이터를 체계적으로 관리하고 연결하는 과정까지 역시 중요합니다.
피지컬 AI 개발에는 아래 두 가지 데이터가 함께 활용됩니다.
Real-world Data는 실제 제조 현장, 물류센터, 도로, 산업 설비에서 수집되기 때문에 현장성과 신뢰도가 높습니다. 현실의 복잡한 변수와 예외 상황을 그대로 반영할 수 있다는 것이 가장 큰 강점입니다.
Synthetic Data는 실제로 수집하기 어렵거나 반복 실험이 필요한 상황을 시뮬레이션으로 만들어낼 수 있습니다. 특정 조건을 반복적으로 생성하고 다양한 시나리오를 빠르게 확장할 수 있어, Real-world Data만으로는 채우기 어려운 학습 범위를 넓혀줍니다.
이때 중요한 것은 데이터를 하나의 흐름으로 연결하는 것입니다. 데이터는 수집 환경, 센서 종류, 저장 방식, 품질 기준에 따라 서로 다른 형태로 존재할 수 있습니다. 이를 학습에 활용하려면 데이터를 정제하고, 표준화하고, 품질을 검증하는 과정이 필요합니다.
그래서 필요한 것이 데이터 통합 플랫폼입니다.

데이터 플랫폼은 단순한 저장소가 아닙니다.
- 다양한 환경에서 생성되는 데이터 수집
- 데이터 정제 및 표준화
- 학습 데이터 품질 검증
- Real-world Data와 Synthetic Data 통합 관리
- WFM·RFM 학습을 위한 데이터셋 공급
이렇게 전 과정을 연결하는 E2E(End-to-End) 데이터 파이프라인 역할을 수행합니다. 즉, 피지컬 AI 데이터 플랫폼은 다양한 환경에서 만들어지는 데이터를 학습 가능한 자산으로 바꾸는 기반입니다.
결국 피지컬 AI 시대의 경쟁력은 데이터를 얼마나 많이 보유했는가 보다는, 데이터를 얼마나 효율적으로 연결하고 활용할 수 있는가에서 결정됩니다. 그래서 데이터 통합 플랫폼은 피지컬 AI를 움직이는 핵심 인프라로 주목받고 있습니다.
알체라는 과학기술정보통신부와 IITP가 추진하는 ‘피지컬 AI 선도기술개발’ 사업에 공동연구기관으로 참여하고 있습니다.
LG전자가 주관하는 총 340억 원 규모의 이번 사업은 WFM과 RFM 핵심 기술 개발을 목표로 추진되고 있으며, 산·학·연 10개 기관이 함께 참여하고 있습니다.
알체라는 이 컨소시엄에서 피지컬 AI 데이터 수집 통합 플랫폼 구축과 핵심 데이터 공급 역할을 담당합니다.

- 피지컬 AI 데이터 수집·정제·품질 검증
- E2E 데이터 통합 플랫폼 구축
- WFM·RFM 개발을 위한 핵심 데이터 공급
알체라가 이 역할을 수행할 수 있는 배경에는 10년간 쌓아온 현실 기반 AI 데이터 구축 역량과 다양한 산업 현장에서 검증해 온 실증 경험이 있습니다.
- 비전 AI 분야 데이터 (얼굴 인식, 이상행동 감지, 화재 감지)
- 자율주행 분야 데이터
현실 환경에서 수집되는 데이터는 실험실 데이터와 다릅니다. 조명, 각도, 움직임, 장애물, 예외 상황처럼 통제하기 어려운 변수가 많습니다. 알체라는 이러한 데이터를 수집하고 검증하며 AI 학습에 활용 가능한 형태로 만드는 경험을 쌓아왔습니다. 이제 알체라는 이 역량을 바탕으로 휴머노이드 로봇과 제조 영역으로 사업을 확장하며, 피지컬 AI 데이터 인프라 전문 기업으로 자리매김하고 있습니다.
피지컬 AI는 모델과 하드웨어만으로 완성되지 않습니다. 실제 환경 데이터와 시뮬레이션 데이터를 연결하고, 다양한 산업 현장에서 생성되는 데이터를 AI가 활용할 수 있는 형태로 공급하는 데이터 인프라가 함께 구축되어야 합니다.
결국 피지컬 AI 시대의 경쟁력은 데이터를 얼마나 효과적으로 연결하고 활용할 수 있느냐에 달려 있습니다.
알체라는 이번 국책 과제를 통해 피지컬 AI 데이터 통합 플랫폼 구축을 주도하며, 데이터 수집부터 관리·연계·공급까지 이어지는 데이터 인프라를 구축하고 있습니다. 피지컬 AI가 산업 전반으로 확대될수록 데이터를 연결하는 플랫폼의 역할은 더욱 중요해질 것입니다.
알체라는 피지컬 AI 생태계의 데이터 허브로서, 로봇 시대를 움직이는 보이지 않는 인프라를 만들어가고 있습니다.
