오픈마누스 AI 에이전트의 설치, 사용 및 구조 분석
BIM 칼럼니스트 강태욱의 이슈 & 토크
생성형 AI 에이전트는 목표 달성을 위해 세상을 관찰하고 스스로 행동하는 자율적인 애플리케이션으로, 행동과 의사결정을 위한 인지 아키텍처를 갖추고 있다.
이번 호에서는 오픈소스 AI 에이전트인 오픈마누스(OpenManus)를 통해 AI 에이전트의 동작 메커니즘이 어떻게 구현되는지 분석해 본다.
■ 강태욱
건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/ GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다.
페이스북 | www.facebook.com/laputa999
블로그 | http://daddynkidsmakers.blogspot.com
홈페이지 | https://dxbim.blogspot.com
팟캐스트 | www.facebook.com/groups/digestpodcast
최근 AI 에이전트 기술이 크게 발전하고 있다. 구글의 에이전트 백서를 보면, 생성형 AI 에이전트는 목표 달성을 위해 세상을 관찰하고 스스로 행동하는 자율적인 애플리케이션으로 설명한다. 명시적인 지시가 없어도 스스로 판단하고 능동적으로 목표에 접근할 수 있다. 이러한 에이전트는 행동과 의사결정을 위한 인지 아키텍처를 갖추며, 핵심 구성 요소는 <그림 1>과 같이 사용자 입력에 대한 추론 역할을 하는 모델(보통은 GPT와 같은 LLM), 입력에 대해 필요한 기능을 제공하는 도구(tools), 그리고 어떤 도구를 호출할지 조율하는 오케스트레이션의 세 가지로 이루어진다.
그림 1. AI 에이전트의 구성 요소(Agents, Google, 2024)
이번 호에서는 AI 에이전트의 동작 메커니즘을 분석하기 위한 재료로, 딥시크(DeekSeek)와 더불어 관심이 높은 마누스(Manus.im)에서 영감을 받아 개발된 오픈마누스(OpenManus) 오픈소스 AI 에이전트를 활용하겠다. 오픈마누스는 메타GPT(MetaGPT)라는 이름으로 활동 중인 중국인 개발자가 공개한 AI 에이전트이다. 개발자는 오픈마누스가 연결된 다양한 도구를 LLM으로 조율하고 실행할 수 있다고 주장하고 있다. 깃허브(GitHub) 등에 설명된 오픈마누스는 다음과 같은 기능을 지원한다.
로컬에서 AI 에이전트 실행
여러 도구 및 API 통합 : 외부 API, 로컬 모델 및 자동화 도구를 연결, 호출
워크플로 사용자 지정 : AI가 복잡한 다단계 상호 작용을 효율적으로 처리
여러 LLM 지원 : 라마(LLaMA), 미스트랄(Mistral) 및 믹스트랄(Mixtral)과 같은 인기 있는 개방형 모델과 호환
자동화 향상 : 내장 메모리 및 계획 기능을 통해 코딩, 문서 처리, 연구 등을 지원
<그림 2>는 이 에이전트가 지원하는 기능 중 일부이다.
프롬프트 : “Create a basic Three.js endless runner game with a cube as the player and procedurally generated obstacles. Make sure to run it only in browser. If possible also launch it in the browser automatically after creating the game.”
그림 2
오픈마누스는 이전에 중국에서 개발된 마누스에 대한 관심을 오픈소소로 옮기는 데 성공했다. 오픈마누스는 현재 깃허브에서 4만 2000여 개의 별을 받을 정도로 관심을 받고 있다.
그림 3. 오픈마누스(2025년 4월 기준 42.8k stars)
필자는 오픈마누스에 대한 관심이 높았던 것은 구현된 기술보다는 에이전트 분야에서 크게 알려진 마누스에 대한 관심, 오픈소스 버전의 AI 에이전트 코드 공개가 더 크게 작용했다고 생각한다. 이제 설치 및 사용해 보고, 성능 품질을 확인해 보자. 그리고 코드 실행 메커니즘을 분석해 본다.
오픈마누스 설치
개발 환경은 이미 컴퓨터에 엔비디아 쿠다(NVIDIA CUDA), 파이토치(PyTorch) 등이 설치되어 있다고 가정한다. 이제, 다음 명령을 터미널에서 실행해 설치한다.
conda create -n open_manus python=3.12
conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
pip install -r requirements.txt
playwright install
오픈마누스가 설치하는 패키지를 보면, 많은 경우, 기존에 잘 만들어진 LLM, AI Agent 라이브러리를 사용하는 것을 알 수 있다. 여기서 사용하는 주요 라이브러리는 다음과 같다.
pydantic, openai, fastapi, tiktoken, html2text, unicorn, googlesearch-python, playwright, docker
■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2025-05-02