엔비디아, ‘물리적 AI’ 구축 지원하며 로보틱스 생태계 강화 추신
엔비디아가 고급 훈련, 시뮬레이션, 추론 등 세 가지 컴퓨터 시스템을 통해 차세대 AI 기술로 불리는 ‘물리적 AI’ 구축을 지원하며, 이를 통해 로보틱스 생태계 강화에 나선다고 밝혔다.
챗GPT(ChatGPT)로 시작된 생성형 AI는 콘텐츠 제작, 고객 서비스, 소프트웨어 개발, 지식 근로자를 위한 비즈니스 운영 등 디지털 업무를 혁신하는 데에 도움을 주고 있다. 그러나 휴머노이드, 공장, 기타 산업 시스템 내 장치 등에서 인공지능을 구현하는 물리적 AI는 아직 획기적인 전환점을 경험하지 못했으며 교통, 모빌리티, 제조, 물류, 로보틱스와 같은 산업이 제약을 받아왔다는 것이 엔비디아의 시각이다. 엔비디아는 고급 훈련, 시뮬레이션, 추론을 결합한 3가지 컴퓨터 시스템을 통해 이러한 상황에 변화를 가져올 수 있을 것으로 보고 있다.
대규모 언어 모델(LLM)은 문자나 단어와 같은 모드에서 다음 토큰을 예측할 수 있는 1차원적인 모델이다. 이미지와 비디오 생성 모델은 다음 픽셀을 예측할 수 있는 2차원 모델이다. 하지만 이러한 모델들은 3차원 세계를 이해하거나 해석할 수 없다.
엔비디아는 물리적 AI 모델이 생성형 AI를 통해 물리적 세계를 인식하고, 이해하고, 상호 작용하고, 탐색할 수 있다고 밝혔다. 가속 컴퓨팅을 기반으로 한 멀티모달 물리적 AI의 혁신과 대규모 물리 기반 시뮬레이션을 통해 로봇을 활용한 물리적 AI의 가치를 실현할 수 있게 됐다는 것이다.
로봇은 지각, 추론, 계획, 행동, 학습을 할 수 있는 시스템으로, 자율 주행 로봇(AMR), 조작기 팔 또는 휴머노이드 외에도 다양한 유형의 로봇이 존재한다. 가까운 미래에는 수술실부터 데이터 센터, 창고, 공장, 교통 관제 시스템이나 스마트 시티에 이르기까지 움직이는 모든 것, 또는 움직이는 사물을 모니터링하는 모든 것이 자율 로봇 시스템이 될 것으로 보이는데, 이러한 시스템은 주변 환경을 감지하고 이에 대응할 수 있는 능력을 갖추게 된다.
엔비디아는 특히 인간을 위해 설계된 환경에서 효율적으로 작동할 수 있는 휴머노이드 로봇에 주목하고 있다. 휴머노이드 로봇을 개발하려면 물리적 AI와 로봇 훈련, 시뮬레이션, 런타임을 처리하는 세 가지의 가속화된 컴퓨터 시스템이 필요하다. 엔비디아는 개발자가 물리적 AI를 제작할 수 있도록 3가지 컴퓨터 시스템과 가속화된 개발 플랫폼을 구축했다고 전했다.
먼저, 개발자는 엔비디아 DGX 플랫폼에서 엔비디아 네모(NeMo)를 사용해 파운데이션 모델과 생성형 AI 모델을 훈련하고 미세 조정할 수 있다. 또한 자연어를 이해하고 인간의 행동을 관찰해 움직임을 모방할 수 있는 휴머노이드 로봇을 위한 범용 파운데이션 모델을 개발하는 이니셔티브인 엔비디아 프로젝트 GR00T(Project GR00T)를 활용할 수도 있다.
둘째, 엔비디아 OVX 서버에서 실행되는 엔비디아 옴니버스(Omniverse)는 물리적 AI를 테스트하고 최적화하기 위한 개발 플랫폼과 시뮬레이션 환경을 제공한다. 이는 엔비디아 아이작 심(Isaac Sim)과 같은 애플리케이션 프로그래밍 인터페이스와 프레임워크를 통해 활용된다. 개발자들은 아이작 심을 사용해 로봇 모델을 시뮬레이션하고 검증하거나, 물리 기반 합성 데이터를 대량 생성해 로봇 모델 훈련을 진행할 수 있다. 또한 연구원과 개발자는 로봇 강화 학습과 모방 학습을 지원하는 오픈 소스 로봇 학습 프레임워크인 엔비디아 아이작 랩(Isaac Lab)을 사용해 로봇 정책 훈련과 개선을 가속화할 수 있다.
마지막으로 훈련된 AI 모델이 실행 컴퓨터에 배포된다. 엔비디아 젯슨 토르(Jetson Thor) 로봇 컴퓨터는 콤팩트한 온보드 컴퓨팅 요구 사항을 위해 특별히 설계됐다. 제어 정책, 비전, 언어 모델로 구성된 모델 집합이 로봇 두뇌를 구성하고, 에너지 효율적인 온보드 엣지 컴퓨팅 시스템에 배포된다. 로봇 제조업체와 파운데이션 모델 개발자는 워크플로우와 도전 과제에 따라 필요한 만큼의 가속 컴퓨팅 플랫폼과 시스템을 사용할 수 있다.
작성일 : 2024-10-28