통합검색 > 통합검색 : 캐드앤그래픽스 - 엔지니어링IT 미디어

AI 학습 데이터 생성을 위한 어댑티브 샘플링과 SHERPA의 활용

최적화 문제를 통찰하기 위한 심센터 히즈 (1) 이번 호부터 제품 설계 과정에서 발생하는 다양한 문제에 대해서 최적화 방법론을 적용하고 올바른 결과를 도출하는 과정에 심센터 히즈(Simcenter HEEDS)를 활용하는 방법을 살펴보고자 한다. AI 모델을 학습시키기 위해서는 AI 모델이 정확한 패턴을 학습할 수 있도록 고품질의 데이터를 사용해야 한다. 이번 호에서는 심센터 히즈의 어댑티브 샘플링(Adaptive Sampling)과 SHERPA를 활용하여 양질의 데이터를 효율적으로 생성하는 과정을 살펴본다. ■ 연재순서 제1회 AI 학습 데이터 생성을 위한 어댑티브 샘플링과 SHERPA의 활용 제2회 근사모델 기반의 최적화 vs. 직접 검색 기반의 최적화 제3회 수집 또는 측정된 외부 데이터의 시각화 및 데이터 분석 제4회 산포특성을 가지는 매개변수의 상관성 및 신뢰성 분석 제5회 실험 측정과 해석 결과 간의 오차 감소를 위한 캘리브레이션 분석 제6회 프로세스 자동화 Ⅰ 제7회 프로세스 자동화 Ⅱ 제8회 프로세스 자동화 Ⅲ 제9회 프로세스 자동화 Ⅳ 제10회 프로세스 자동화 Ⅴ ■ 이종학 지멘스 디지털 인더스트리 소프트웨어에서 심센터 히즈를 비롯하여 통합 설루션을 활용한 프로세스 자동화와 데이터 분석, 최적화에 대한 설루션을 담당하고 있다. 근사최적화 기법 연구를 전공하고 다양한 산업군에서 15년간 유한요소해석과 최적화 분야의 기술지원과 컨설팅을 수행하였다. 홈페이지 | www.sw.siemens.com/ko-KR 설계 업무에서 AI를 활용하는 이유 AI는 다양한 영역에서 업무를 보조할 수 있다. 이번 연재에서는 많은 양의 데이터를 분석하여 설계 변수와 제품 성능 간의 관계에서 패턴과 트렌드를 식별하고, 데이터 기반 의사 결정을 지원하는 AI 모델을 학습시키는 것과 관련되어 있다. 잘 학습된 AI는 설계의 품질과 성능을 높이는 데 기여한다. 문제에 따라서는 기존 설계 패러다임에 도전하는 비정형적인 설계 설루션을 발견할 수 있다. 전반적으로는 설계 업무의 디지털 전환을 촉진하고, 전통적인 설계 방법의 한계를 극복하는 데 기여한다. 이는 설계의 효율성을 높이고, 혁신적인 설루션을 개발하는 데 도움을 준다. AI 모델의 학습을 위한 데이터 AI 학습을 위해 필요한 데이터의 품질은 AI 모델의 성능과 정확성에 직접 영향을 미친다. 고품질의 데이터는 AI 모델이 정확한 패턴을 학습하고 신뢰할 수 있는 결정을 내릴 수 있도록 돕는다. 반대로, 저품질의 데이터는 모델의 성능을 떨어뜨리고 편향된 결과를 초래할 수 있다. 고품질의 데이터는 이러한 편향성을 줄이고 공정한 결과를 도출하는 데 기여한다. 데이터의 품질이 높을 수록 모델의 훈련 효율이 높아진다. 데이터가 일관성 있고 정확하면 모델이 더 빠르게 학습할 수 있다. 따라서 정확하고 일관성 있는 데이터는 모델이 올바른 결정을 내리는 데 필수이다. 시뮬레이션 데이터 생성의 자동화 그림 1 히즈는 제품 개발 프로세스에서 사용되는 다양한 설루션의 연결과 데이터 처리를 쉽게 진행할 수 있도록 자동화된 워크플로 구성환경을 제공한다. 상용 CAD 및 CAE 도구에 대한 광범위한 인터페이스를 사용하므로, 스크립트 개발이나 수동 조작 없이 많은 기술을 빠르고 쉽게 통합한다. 자동화된 워크플로에서는 서로 다른 모델링 및 시뮬레이션 간에 데이터를 자동으로 공유할 수 있다. 사용자는 프로세스의 자동화를 통해서 설계 공간 탐색을 보다 쉽고 효율적으로 수행할 수 있다. 사용자는 반복적인 업무를 벗어나 설계를 더 깊이 이해하고 성능 개선과 생산 품질 향상에 가장 적합한 조건을 선택하는 더 중요한 업무에 더욱 집중할 수 있다. AI 학습 데이터 생성을 위한 예제 외팔보의 처짐 문제를 사용하여 데이터를 생성하고 AI 모델을 학습시키는 예제를 통해 기능을 비교해 보겠다. 외팔보의 체적을 최소화하는 최적화 문제를 다음과 같이 정의하였다. 빠른 계산을 위해 파이썬(Python)으로 계산한다. 그림 2 목적함수 외팔보 H빔의 체적을 최소화 제약 조건 최대 굽힘 응력(σ) ≤ 200 MPa • 최대 끝단 처짐(δ) ≤ 2 mm 설계 변수 Length : 5000 mm Load P : 6500 N E : 200 MPa H : 50 mm ≤ H ≤ 100 mm h1 : 5 mm ≤ h1 ≤ 30 mm b1 : 50 mm ≤ b1 ≤ 100 mm b2 : 5 mm ≤ b2 ≤ 50 mm 외팔보의 체적, 응력, 처짐량은 다음의 관계식으로 계산한다. Volume = [2*h1*b1 + (H – 2*h1)*b2]*L Stress = P*L*H/(2*I) Deflection = P*L3/(3*E*I) where : I = 1/12*b2*(H-2*h1)^3 + 2*[1/12*b1*h13 + b1*h1*(H-h1) 2/4] 히즈 기본 설정 파이썬 포털(Python portal)을 사용하여 예제의 입력(input)/출력(output) 파일을 등록하였다. 그림 4 전통적인 실험계획법에 의한 데이터 생성 방법 <그림 6>과 같이 4개의 설계변수를 기반으로 전통적인 실험계획법으로 데이터를 생성해보겠다. 여기서는 3 Level의 Full factorial을 사용하여 81개의 데이터가 생성된다. 그림 6 ■ 자세한 기사 내용은 PDF로 제공됩니다.

작성일 : 2025-03-06

앤시스 2025 R1 : 클라우드·AI·데이터 혁신 가속화를 위한 디지털 엔지니어링 설루션

개발 및 공급 : 앤시스코리아 주요 특징 : 사용자 학습 데이터 기반의 AI로 후처리 과정에서 심층 인사이트 제공, 시스템 아키텍처 모델러에 SysML v2 지원 추가해 협업 촉진 및 제품 설계 최적화 가속, HPC 라이선스 없이 엔터프라이즈급 CFD 기능 제공하는 앤시스 CFD HPC 얼티메이트 출시 등 앤시스가 디지털 엔지니어링 혁신을 지원하는 AI 기반 엔지니어링 시뮬레이션 설루션인 ‘앤시스 2025 R1(Ansys 2025 R1)’을 발표했다. 앤시스 2025 R1은 정교한 디지털 엔지니어링 기술을 통해 기존 인프라와 원활하게 연계될 뿐 아니라, 업무 중단을 최소화하면서 보다 혁신적인 제품 개발을 위한 협업을 지원한다. AI, 클라우드 컴퓨팅, GPU 및 HPC의 강력한 성능을 기반으로 한 이번 업데이트는 더욱 신속하고 협력적인 의사 결정을 가능케 하며, 설계 탐색 범위를 확장하고 제품 설계 기간 단축에 기여할 전망이다. 앤시스의 셰인 엠스윌러(Shane Emswiler) 제품 총괄 수석 부사장은 “앤시스 2025 R1은 더욱 강력한 통합 기능을 제공해, 제품 전체 수명 주기에 걸쳐 디지털 프로세스를 구축하고 개발 전후 데이터를 효율적으로 관리할 수 있는 다양한 도구와 설루션을 제공할 것”이라면서, “하나의 데이터 기반의 환경에서 서로 단절된 팀도 원활하게 협업할 수 있도록 지원하며, 이를 통해 비용 절감과 제품 출시 기간을 단축시켜 고객의 경쟁력 강화에 기여할 것”이라고 밝혔다. 제품이 점차 통합되고 복잡해짐에 따라 R&D 프로세스 또한 급변하는 시장 요구에 맞춰 지속적으로 발전해야 한다. 앤시스는 고객의 디지털 전환 과정을 원활하게 지원하며, 변화하는 시장 환경에 대응할 수 있도록 다양한 도구와 설루션을 제공할 예정이다. ▲ 이미지 출처 : 앤시스 웹사이트 캡처 향상된 물리 솔버 제품 성능을 보장하려면 구성 요소부터 시스템 전반에 이르는 멀티피직스(multi-physics)를 이해하는 것이 필수이다. 앤시스 2025 R1은 신속하고 정밀한 물리 기반 시뮬레이션 결과를 제공하는 신제품뿐만 아니라, 기존 제품의 강화된 기능을 통해 엔지니어링 팀이 설계 초기 단계에서 보다 신뢰성 높은 의사 결정을 내릴 수 있도록 지원할 전망이다. 앤시스 디스커버리(Ansys Discovery) 3D 시뮬레이션 소프트웨어는 전열(electrothermal) 분석, 오소트로픽(orthotropic) 전도, 내부 팬(fans) 기능을 추가해 써멀 모델링 역량을 확장했으며 속도 및 사용 편의성을 개선했다. 구조 해석 설루션은 소음·진동·마찰(NVH)에 대한 통합 설루션을 제공하며, 주파수 응답 함수(FRF) 계산 속도가 10배 향상됐다. 또한 진동음향(vibro-acoustics) 매핑, 최적화된 메싱, 모드 기여도 분석 기능 등을 탑재했다. 앤시스 일렉트로닉스(Ansys Electronics)는 앤시스 소프트웨어 제품 간 연결성을 강화해 3D 집적 회로에 중요한 메싱을 개선하며 자동화된 워크플로우 기능, 향상된 시뮬레이션 성능 등을 제공한다. 새로운 폴리머 FEM(Polymer FEM) 제품은 높은 정확도의 모델을 적용해 실제 재료의 거동을 정밀하게 포착하며, 고객의 고급 재료 시뮬레이션 요구 사항을 충족한다. 클라우드/HPC/GPU 클라우드 컴퓨팅, 고성능 컴퓨팅(HPC) 및 GPU의 강력한 성능은 최신 제품의 엔지니어링 속도를 혁신적으로 변화시키고 있다. 이 과정에서 접근성, 상호 운용성, 확장성은 핵심 요소로 작용하며, 고객이 데스크톱 애플리케이션의 한계를 넘어서서 보다 혁신적인 제품을 협업하여 설계할 수 있도록 지원한다. 앤시스 2025 R1은 GPU 솔버의 성능을 한층 강화했으며, 다양한 애플리케이션에 웹 기반 온디맨드(on-demand) 기능을 추가 제공한다. 앤시스 플루언트(Ansys Fluent) 멀티 GPU(multi-GPU) 유체 시뮬레이션 솔버는 자동차 외부 공기 역학과 같은 대규모 메시 셀(mesh cell)을 포함한 고해상도 해석을 지원한다. 또한, 전체 시뮬레이션 속도 저하 없이 매개변수 추가 및 정확도 개선을 설계자에게 제공한다. 앤시스 CFD HPC 얼티메이트(Ansys CFD HPC Ultimate)는 추가 HPC 라이선스 없이 단일 작업에서 여러 CPU 코어 또는 GPU를 활용할 수 있는 엔터프라이즈급 전산유체역학(CFD) 기능을 제공한다. 앤시스 루메리컬 FDTD(Ansys Lumerical FDTD)의 새로운 GPU 가속 3D 전자기 시뮬레이션은 기존 CPU 솔버 대비 메모리 사용량을 50% 절감하며 메싱 시간을 20% 줄인다. 앤시스 메커니컬(Ansys Mechanical)의 GPU 직접 가속 구조 유한 요소 해석(FEA) 솔버는 기존 설루션 대비 최대 6배 빠른 성능을 제공하며, 반복 솔버(iterative solver)는 CPU 전용 솔버 대비 6배 빠른 속도를 구현한다. 앤시스 디스커버리(Ansys Discovery)의 클라우드 버스트 컴퓨팅(Cloud Burst Compute) 기능을 활용하면 1000개의 설계 변형을 10분 만에 해결할 수 있다. 엔비디아 GPU를 활용한 디스커버리의 매개변수 연구(parametric study) 속도는 100배 이상 향상된다. 앤시스 클라우드 버스트 컴퓨팅(Ansys Cloud Burst Compute) 기능은 앤시스 메카니컬 (Ansys Mechanical), 앤시스 플루언트(Ansys Fluent) 및 앤시스 HFSS(Ansys HFSS) 고주파 전자기 시뮬레이션 소프트웨어를 위한 유연하고 확장 가능한 온디맨드(on-demand) HPC 성능을 제공한다. 인공지능 앤시스는 인공지능(AI) 기반 기술을 통해 포트폴리오를 지속적으로 확장하며, 컴퓨터 지원 엔지니어링(CAE) 산업에 혁신적인 속도와 접근성을 제공한다. 앤시스 AI는 신규 및 기존 데이터를 활용해 빠르게 설계를 분석하고 AI 모델을 신속하게 학습시켜 제품 출시 기간을 단축시키는 한편 비용 절감 효과를 극대화한다. 직관적인 인터페이스를 갖춘 데이터 처리 도구 지원을 통해 SimAI 모델링을 위한 데이터 준비 과정을 간소화한다. 앤시스 SimAI는 사용자가 모델 학습 데이터를 확장해 후처리 과정에서 더욱 정교한 분석을 수행할 수 있도록 지원한다. 앤시스 일렉트로닉스 AI+(Ansys Electronics AI+)는 AI 기반 기술을 활용해 앤시스 멕스웰(Ansys Maxwell) 전기기장(electromagnetic field) 해석 솔버, 앤시스 아이스팩(Ansys Icepak), 전자기 냉각 시뮬레이션 소프트웨어, HFSS 등에서 수행되는 전자기 시뮬레이션의 필요 리소스 실행 시간을 정밀하게 예측한다. 앤시스 RF 채널 모델러(Ansys RF Channel Modeler)의 고급 합성 레이더 시뮬레이션 기능은 지상에서 AI를 활용한 표적 식별을 위해 폭넓은 학습 및 검증 데이터 세트를 제공하여, 디지털 미션 엔지니어링 분야를 지원한다. ▲ 이미지 출처 : 앤시스 웹사이트 캡처 연결된 에코시스템 최첨단 연구개발(R&D) 환경에서는 모델 기반 시스템 엔지니어링(MBSE) 및 자동화 설계를 도입하여 연구개발 워크플로를 원활하고 효율적으로 유지하는 것이 중요하다. 앤시스 엔지니어링 설루션은 기존 인프라에도 새로운 기술을 쉽게 통합할 수 있도록 높은 호환성과 확장성을 갖춰 제품 설계의 혼선을 방지할 수 있다. 앤시스 2025 R1은 디지털 전환을 더욱 원활하게 지원할 수 있도록 MBSE 기능과 데이터 관리 기능이 강화되었다. 앤시스 모델센터(ModelCenter) MBSE 소프트웨어와 앤시스 시스템 아키텍처 모델러(System Architecture Modeler : SAM)는 SysML v2 지원을 강화해 엔지니어링 조직 전반에서 제품 요구 사항의 접근성과 확장성을 높이고, 팀 간 협업을 더욱 긴밀하게 연결하여 개발 시간 단축에 기여한다. 앤시스 모델센터(ModelCenter)는 MBSE 연결성이 향상되어 호환성을 높였고, 카펠라(Capella) 커넥터 기능이 강화되었으며, 앤시스 적으로 제공한다. SAM과의 더욱 긴밀한 통합을 통해 검색, 저장 및 수정 기능을 보다 직관적으로 제공한다. 앤시스 미네르바(Ansys Minerva) 시뮬레이션 프로세스 및 데이터 관리 소프트웨어인 미네르바는 일반 커넥터 개선을 통해 외부 데이터 연동을 표준화하며, 업로드 전 문제점 검증을 가능케 하여 제품 생산 시간 및 비용 절감에 기여한다. 커넥터는 새로운 비동기 작업 실행 기능이 추가돼 엔지니어의 생산성을 개선한다. 기타 앤시스 2025 R1의 주요 특징 앤시스 옵티슬랭(Ansys optiSLang) 프로세스 통합 및 설계 최적화 소프트웨어로 인터페이스, 분산 컴퓨팅, 고급 알고리즘 등 전반적인 개선으로 설계 워크플로의 유연성과 성능을 강화한다. 앤시스 그란타 MI(Ansys Granta Materials Intelligence) 제품군은 컴퓨터 이용 공학(CAE), 컴퓨터 지원 설계(CAD), 제품 수명주기 관리(PLM) 등의 소프트웨어와 공통 사용환경을 제공하여, 그란타(Granta) 최종 사용자 인터페이스와 통합 인터페이스 간 일관된 사용자 경험을 제공한다. 앤시스 플루언트(Ansys Fluent)의 내결함성 메싱(FaultTolerant Meshing : FTM)과 수밀 메싱(watertight meshing)에 적용된 작업 기반 성능을 개선해 메싱 속도를 가속화한다. 전력 필드 효과 트랜지스터(FET) 및 전력 관리 집적회로(PMIC)의 분석, 시뮬레이션, 최적화를 위한 신규 도구로 앤시스 파워X(Ansys PowerX)를 제공한다. ▲ 이미지 출처 : 앤시스 웹사이트 캡처 ■ 기사 내용은 PDF로도 제공됩니다.

작성일 : 2025-03-06

앤시스, 클라우드·AI·데이터 혁신 가속화를 위한 ‘앤시스 2025 R1’ 발표

앤시스가 디지털 엔지니어링 혁신을 위한 AI 기반 엔지니어링 시뮬레이션 설루션인 ‘앤시스 2025 R1(Ansys 2025 R1)’을 발표했다. 앤시스 2025 R1은 정교한 디지털 엔지니어링 기술을 통해 기존 인프라와 원활하게 연계될 뿐 아니라, 업무 중단을 최소화하면서 보다 혁신적인 제품 개발을 위한 협업을 지원한다. 앤시스는 “AI, 클라우드 컴퓨팅, GPU 및 HPC의 강력한 성능을 기반으로 한 이번 업데이트가 더욱 신속하고 협력적인 의사 결정을 가능케 하며, 설계 탐색 범위를 확장하고 제품 설계 기간 단축에 기여할 전망”이라고 전했다. 제품이 점차 통합되고 복잡해짐에 따라 R&D 프로세스 또한 급변하는 시장 요구에 맞춰 지속적으로 발전해야 한다. 앤시스는 고객의 디지털 전환으로의 과정을 원활하게 지원하며, 변화하는 시장 환경에 대응할 수 있도록 다양한 도구와 설루션을 제공할 예정이다. 제품 성능을 보장하려면 구성 요소부터 시스템 전반에 이르는 멀티피직스(Multi-Physics)를 이해하는 것이 필수이다. 앤시스 2025 R1은 신속하고 정밀한 물리 기반 시뮬레이션 결과를 제공하는 신제품뿐만 아니라, 기존 제품의 강화된 기능을 통해 엔지니어링 팀이 설계 초기 단계에서 보다 신뢰성 높은 의사 결정을 내릴 수 있도록 지원할 전망이다. 앤시스 디스커버리(Ansys Discovery) 3D 시뮬레이션 소프트웨어는 전열(electrothermal) 분석, 오소트로픽(orthotropic) 전도, 내부 팬(fans) 기능을 추가해 서멀 모델링 역량을 확장했으며 속도 및 사용 편의성을 개선했다. 구조 해석 설루션은 소음·진동·마찰(NVH)에 대한 통합 설루션을 제공하며, 주파수 응답 함수(FRF) 계산 속도의 10배 향상, 진동-음향(vibro-acoustics) 매핑, 최적화된 메싱, 모드 기여도 분석 기능 등을 탑재했다. 앤시스 일렉트로닉스(Ansys Electronics)는 앤시스 소프트웨어 제품 간 연결성을 강화해 3D 집적 회로에 중요한 메싱 개선, 자동화된 워크플로 기능, 향상된 시뮬레이션 성능을 제공하며, 새로운 폴리머 FEM(Polymer FEM) 제품은 높은 정확도의 모델을 적용해 실제 재료의 거동을 정밀하게 포착 및 고객의 고급 재료 시뮬레이션 요구 사항을 충족한다. 클라우드 컴퓨팅, HPC 및 GPU의 강력한 성능은 최신 제품의 엔지니어링 속도를 혁신적으로 변화시키고 있다. 이 과정에서 접근성, 상호 운용성, 확장성은 핵심 요소로 작용하며 고객이 데스크톱 애플리케이션의 한계를 넘어서서 보다 혁신적인 제품을 협업하여 설계할 수 있도록 지원한다. 앤시스 2025 R1은 GPU 솔버의 성능을 한층 강화했으며, 다양한 애플리케이션에 웹 기반 온디맨드(on-demand) 기능을 추가 제공한다. 앤시스 플루언트(Ansys Fluent) 멀티 GPU 유체 시뮬레이션 솔버는 자동차 외부 공기 역학과 같은 대규모 메시 셀(mesh cell)을 포함한 고해상도 해석을 지원. 전체 시뮬레이션 속도 저하 없이 매개변수 추가 및 정확도 개선을 설계자에게 제공한다. 앤시스 CFD HPC 얼티메이트(Ansys CFD HPC Ultimate)는 추가 HPC 라이선스 없이 단일 작업에서 여러 CPU 코어 또는 GPU를 활용할 수 있는 엔터프라이즈급 전산유체역학(CFD) 기능을 제공한다. 앤시스 루메리컬 FDTD(Ansys Lumerical FDTD)의 새로운 GPU 가속 3D 전자기 시뮬레이션은 기존 CPU 솔버 대비 메모리 사용량을 50% 절감 및 메싱 시간 20% 단축하며, 앤시스 메커니컬(Ansys Mechanical)의 GPU 직접 가속 구조 유한 요소 해석(finite element analysis, FEA) 솔버는 기존 설루션 대비 최대 6배 빠른 성능을 제공한다. 앤시스 디스커버리(Ansys Discovery)의 클라우드 버스트 컴퓨팅(Cloud Burst Compute) 기능을 활용하면 1000개의 설계 변형을 10분 만에 해결할 수 있으며, 엔비디아 GPU를 활용한 디스커버리의 매개변수 연구(parametric study) 속도는 100배 이상 향상된다. 앤시스 클라우드 버스트 컴퓨팅(Ansys Cloud Burst Compute) 기능은 앤시스 메커니컬(Ansys Mechanical), 앤시스 플루언트(Ansys Fluent) 및 앤시스 HFSS(Ansys HFSS) 고주파 전자기 시뮬레이션 소프트웨어를 위한 유연하고 확장 가능한 온디맨드(on-demand) HPC 성능을 제공한다. 또한, 앤시스는 AI 기반 기술을 통해 포트폴리오를 지속적으로 확장하며 컴퓨터 지원 엔지니어링(CAE) 산업에 혁신적인 속도와 접근성을 제공한다고 소개했다. 앤시스 AI는 신규 및 기존 데이터를 활용해 빠르게 설계를 분석하고 AI 모델을 신속하게 학습시켜 제품 출시 기간을 단축시키는 한편 비용 절감 효과를 극대화한다. 앤시스는 직관적인 인터페이스를 갖춘 데이터 처리 도구를 지원해 심AI(SimAI) 모델링을 위한 데이터 준비 과정을 간소화할 수 있도록 한다. 앤시스 심AI는 사용자가 모델 학습 데이터를 확장해 후처리 과정에서 더욱 정교한 분석을 수행할 수 있도록 지원한다. 앤시스 일렉트로닉스 AI+(Ansys Electronics AI+)는 AI 기반 기술을 활용해 앤시스 멕스웰(Ansys Maxwell) 전기기장(electromagnetic field) 해석 솔버, 앤시스 아이스팩(Ansys Icepak), 전자기 냉각 시뮬레이션 소프트웨어, HFSS 등에서 수행되는 전자기 시뮬레이션의 필요 리소스와 실행 시간을 정밀하게 예측할 수 있다. 앤시스 RF 채널 모델러(Ansys RF Channel Modeler)의 고급 합성 레이더 시뮬레이션 기능은 지상에서 AI를 활용한 표적 식별을 위해, 폭넓은 학습 및 검증 데이터 세트를 제공하여 디지털 미션 엔지니어링 분야를 지원한다. 한편, 앤시스는 자사의 엔지니어링 이루션이 기존 인프라에도 새로운 기술을 쉽게 통합할 수 있도록 높은 호환성과 확장성을 갖춤으로써 제품 설계의 혼선을 방지할 수 있다고 덧붙였다. 앤시스 2025 R1은 디지털 전환을 더욱 원활하게 지원할 수 있도록 MBSE 기능과 데이터 관리 기능이 강화되었다. 이외에도 앤시스 2025 R1에는 프로세스 통합 및 설계 최적화 소프트웨어인 앤시스 옵티슬랭(Ansys optiSLang), CAE/CAD/PLM 등 소프트웨어와 공통 사용환경을 제공하는 앤시스 그란타 MI(Ansys Granta Materials Intelligence) 제품군, 메싱 속도를 높인 앤시스 플루언트(Ansys Fluent), 전력 필드 효과 트랜지스터(FET) 및 전력 관리 집적회로(PMIC)의 분석, 시뮬레이션, 최적화를 위한 신규 도구인 앤시스 파워X(Ansys PowerX) 등이 제공된다. 앤시스의 셰인 엠스윌러(Shane Emswiler) 제품 총괄 수석 부사장은 “앤시스 2025 R1은 더욱 강력한 통합 기능을 제공해, 제품 전체 수명 주기에 걸쳐 디지털 프로세스를 구축하고 개발 전후 데이터를 효율적으로 관리할 수 있는 다양한 도구와 설루션을 제공할 것”이라며, “하나의 데이터 기반의 환경에서 서로 단절된 팀들도 원활하게 협업할 수 있도록 지원하며, 이를 통해 비용 절감과 제품 출시 기간을 단축시켜 고객의 경쟁력 강화에 기여할 것”이라고 밝혔다.

작성일 : 2025-02-10

스노우플레이크, 앱 성성 도구에서 딥시크-R1 프리뷰 지원

스노우플레이크가 자사의 생성형 AI 기반 애플리케이션 생성 도구인 ‘코텍스 AI(Cortex AI)’에서 ‘딥시크-R1(DeepSeek-R1)’ 모델을 지원한다고 밝혔다. 딥시크-R1은 지도학습(SFT) 없이 대규모 강화학습(RL)만으로 훈련된 오픈소스 모델로 자체검증, 스스로 답을 찾는 추론하는 사고체계(CoT), 추론 생성 등이 가능하다. 딥시크-R1은 스노우플레이크 코텍스 AI를 통해 서버리스 추론에 사용할 수 있는 비공개 프리뷰 형태로 제공된다. 배치(SQL 함수)와 대화형(파이썬 및 REST API) 모두를 통해 액세스할 수 있어 기존 데이터 파이프라인, 애플리케이션 및 통합 개발 환경(IDE)에 통합된다. 코텍스 AI는 고객이 코텍스 가드(Cortex Guard)를 활성화할 수 있도록 해 잠재적으로 유해한 콘텐츠를 필터링하고, 고객이 생성형 AI 애플리케이션을 대규모로 안전하게 배포할 수 있도록 한다. 스노우플레이크는 모델이 안전한 서비스 범위 내에서만 작동하고 고객 데이터가 모델 제공자와 공유되지 않도록 보장한다고 소개했다. 또한, 모델이 정식 출시되면 고객은 역할 기반 액세스 제어(RBAC)를 통해 딥시크-R1에 대한 접근을 설정해 거버넌스를 관리할 수 있다고 덧붙였다. 현재 미국 내 고객의 스노우플레이크 계정에서 사용할 수 있다. 스노우플레이크 코텍스 AI는 대규모 언어 모델(LLM) 추론, 파인튜닝, 검색 기반 생성(RAG) 기능을 포함한 종합 툴 세트를 제공하고 있다. 이를 통해 정형 및 비정형 데이터를 함께 분석하고 AI 기반 애플리케이션을 쉽게 구축할 수 있다. 메타, 미스트랄, 스노우플레이크를 포함한 주요 오픈소스 및 폐쇄형 LLM 모두 지원함으로써 간편하게 AI를 통합할 수 있게 한다. 스노우플레이크 AI 연구팀은 “딥시크-R1의 추론 비용을 추가로 절감해 고객에게 더 큰 비용 대비 성능 효율성을 제공할 계획”이라면서, “딥시크-R1을 통해 기업은 최첨단 AI 기술을 기반으로 한 생성형 AI 애플리케이션을 보다 빠르게 제공함으로써 생태계에서 혁신의 새로운 표준을 제시하게 될 것”이라고 말했다.

작성일 : 2025-02-05

언리얼 엔진 5.5 : 애니메이션/가상 프로덕션/모바일 게임 개발 기능 강화

작성일 : 2025-01-06

딥러닝 모델 개발 프로세스 기록/분석/가시화 및 모델 튜닝하기

BIM 칼럼니스트 강태욱의 이슈 & 토크 이번 호에서는 AI 업계에서 표준적으로 사용되고 있는 도구를 개발하는 W&B(Weights & Biases)를 소개하고, 이를 사용하는 방법을 소개한다. 그리고 건설, 제조와 같은 전통 엔지니어링 산업에서 생존을 위해 생각할 부분을 정리해 보고자 한다. ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast 모든 산업 분야에서 딥러닝으로 시작된 인공지능(AI) 기술 트랜드가 거세게 몰아치고 있다. 특히, 올해는 생성형 AI가 업무에 실질적으로 사용되기 시작했다. 생성형 AI는 다양한 업무 분야를 자동화하고 있어, ‘Job Killer’라 불릴 만큼 오피스에 많은 영향을 주고 있다. 이와 같이 기술이 전통적인 시장과 일자리를 축소하기도 하지만, 이번 호에서 소개할 W&B는 골드러시에서 역마차를 만들어 운영했던 웰스파고의 전략을 잘 실행한 스타트업이다. W&B 기술 소개 딥러닝 모델을 개발하다 보면 수많은 종류의 데이터셋, 하이퍼모델 파라미터 튜닝 등으로 인해 관리해야 할 자료가 매우 복잡해진다는 것을 알게 된다. W&B는 이름 그대로 완벽한 모델 학습을 위해 필요한 딥러닝 모델의 가중치(weights)와 편향(biases)을 모니터링 및 관리할 수 있는 로그 도구이다. 즉, 딥러닝 모델 개발자를 위한 프로세스 로그 및 가시화 플랫폼을 제공한다. 그림 1. W&B(AI Summer) 매우 직관적인 이름을 가진 이 스타트업은 텐서보드(Tensorboard)와 비슷하지만, 적은 코드로 모델 개발에 많은 통찰력을 준다. W&B의 WandB 라이브러리를 사용하면 딥러닝 모델 학습 시 지저분하게 붙어 나가는 로그 처리를 간단한 함수 몇 개로 처리할 수 있고, 통합된 대시보드 형태로 다양한 모델 학습 품질 지표를 확인 및 비교할 수 있다. 이외에도 학습 모델 하이퍼 파라미터 관리와 튜닝 및 비교 보고서 생성 기능을 제공한다. 로그는 숫자, 텍스트, 이미지 등 다양한 포맷을 지원한다. 그림 2. W&B 딥러닝 모델 개발 프로세스 가시화 대시보드 이번 호에서는 딥러닝 모델 학습 로그 및 가시화 영역에 집중해 살펴본다. 글의 마무리에서는 W&B의 개발 배경도 간단히 알아본다. 사용법 다음 링크에 방문해 회원 가입한다. wandb.ai website : https://wandb.ai 회원 가입한 후 <그림 3~4>와 같이 홈 메뉴에서 키 토큰 값을 얻어 복사한다. 이 키는 wandb API를 사용할 때 필요하다. 그림 3 그림 4 명령행 터미널에서 다음 명령을 실행해 wandb 파이썬 라이브러리를 설치한다. pip install wandb ■ 자세한 기사 내용은 PDF로 제공됩니다.

작성일 : 2024-12-05

IBM, 복잡한 알고리즘 연산 속도 높인 양자 컴퓨터 소개

IBM은 ‘제 1회 IBM 퀀텀 개발자 콘퍼런스(IBM Quantum Developer Conference)’를 개최하고, IBM 양자컴퓨터에서 복잡한 알고리즘을 실행할 때 높은 수준의 규모, 속도, 정확성을 제공하는 새로운 양자 하드웨어 및 소프트웨어 기술을 소개했다. ‘IBM 퀀텀 헤론(IBM Quantum Heron)’은 IBM의 고성능 양자 프로세서로, IBM의 글로벌 양자 데이터 센터를 통해 사용할 수 있다. IBM 퀀텀 헤론은 퀴스킷(Qiskit)을 활용해 특정 클래스의 양자 회로를 최대 5000개의 2큐비트 게이트 연산까지 정확하게 실행할 수 있다. 사용자는 이러한 IBM 퀀텀 헤론의 성능을 활용해 재료, 화학, 생명과학, 고에너지 물리학 등 다양한 분야의 과학적 문제를 양자 컴퓨터로 해결하는 방법을 탐구할 수 있다. IBM은 “이는 IBM 양자 개발 로드맵의 또 하나의 주요 목표를 달성한 것이며, IBM과 비즈니스 파트너가 양자 우위와 2029년으로 예정된 IBM의 오류 수정 첨단 시스템을 향해 나아감에 따라 양자 유용성 시대를 더욱 앞당기는 것”이라고 설명했다. IBM 헤론과 퀴스킷의 성능 향상으로 사용자는 최대 5000개의 게이트로 구성된 양자 회로를 실행할 수 있는데, 이는 2023년 IBM의 양자 유용성 시연에서 정확하게 실행된 게이트 수의 약 2배에 달하는 수치이다. 이를 통해 IBM 퀀텀의 컴퓨터 성능은 무차별 대입 방식의 기존 시뮬레이션 방식보다 더욱 향상됐다. 네이처지(Nature)에 게재된 2023년 유용성 실험에서는 데이터 당 처리 시간이 총 112시간 소요됐으나, 동일한 데이터를 사용한 같은 실험을 최신 IBM 헤론 프로세서에서 실행한 결과 50배 빠른 2.2시간 만에 완료할 수 있었다. IBM은 개발자가 안정성과 정확성, 속도를 갖춘 복잡한 양자 회로를 보다 쉽게 구축할 수 있도록 고성능의 양자 소프트웨어로 퀴스킷을 발전시켜 왔다. IBM은 제3자 기관의 1 000여 개의 테스트를 통해 퀴스킷이 다른 플랫폼 대비 높은 성능과 안정성을 갖춘 양자 소프트웨어 개발 키트라는 것을 확인했다고 밝혔다. IBM 퀀텀 플랫폼은 생성형 AI 기반 기능 및 IBM 파트너의 새로운 소프트웨어와 같은 신규 퀴스킷 서비스로 선택지를 더욱 확장하고 있으며, 산업 전반의 전문가 네트워크가 과학 연구를 위한 차세대 알고리즘을 구축할 수 있도록 지원한다. 여기에는 AI로 양자 하드웨어를 위한 양자 회로의 효율적인 최적화를 지원하는 퀴스킷 트랜스파일러 서비스(Qiskit Transpiler Service), 개발자가 IBM 그래니트 기반 생성 AI 모델로 양자 코드를 생성하는 데 도움을 주는 퀴스킷 코드 어시스턴트(Qiskit Code Assistant), 양자 및 기존 시스템에서 초기 양자 중심 슈퍼컴퓨팅 접근법을 실행하는 퀴스킷 서버리스(Qiskit Serverless) 같은 도구가 포함된다. 양자 노이즈의 성능 관리를 줄이고 양자 회로의 복잡성을 추상화해 양자 알고리즘 개발을 간소화하는 등의 기능을 위해 IBM, 알고리즘믹(Algorithmiq), 케드마(Qedma), 큐나시스(QunaSys), Q-CTRL 및 멀티버스 컴퓨팅의 서비스를 이용할 수 있는 IBM 퀴스킷 함수 카탈로그(IBM Qiskit Functions Catalog)가 있다. 고성능 컴퓨팅의 차세대 진화 단계인 양자 중심 슈퍼컴퓨팅에 대한 IBM의 비전은 병렬화된 워크로드를 실행하는 최첨단 양자 컴퓨터와 기존 컴퓨터를 통합해 복잡한 문제를 고성능 소프트웨어로 쉽게 분리하고, 가장 적합한 아키텍처로 알고리즘의 각 부분을 나누어 해결한 후, 문제를 부드럽고 빠르게 다시 서로 결합하는 방법으로 각각의 컴퓨팅 방식으로는 접근이 불가능하거나 어려운 알고리즘을 실행할 수 있도록 설계되고 있다. 대표적으로, 일본의 국립 과학 연구 기관인 이화학연구소(RIKEN)와 학술 의료 센터이자 생의학 연구 기관인 클리블랜드 클리닉(Cleveland Clinic)은 유용성 단계의 IBM 퀀텀 시스템 원을 통해 화학의 기본이 되는 전자 구조 문제에 대한 알고리즘을 연구하고 있다. 이 프로젝트는 복잡한 화학 및 생물학적 시스템을 현실적으로 모델링하기 위한 양자 중심 슈퍼컴퓨팅 접근 방식의 첫 단계로, 과거에는 무결함 양자 컴퓨터가 필요할 것이라고 여겨졌던 작업이다. 제이 감베타(Jay Gambetta) IBM 퀀텀 부사장은, “IBM 퀀텀 하드웨어와 퀴스킷의 발전으로 사용자들은 첨단 양자 및 기존 슈퍼컴퓨팅 자원을 결합해 각자의 강점을 결합한 새로운 알고리즘을 구축할 수 있게 됐다”며, “오류 수정 양자 시스템을 향한 로드맵을 향해 나아가는 가운데, 현재 산업 전반에서 발견되는 알고리즘은 QPU, CPU, GPU의 융합으로 만들어지는 미개척 컴퓨팅 분야의 잠재력을 실현하는 데 핵심이 될 것”이라고 말했다.

작성일 : 2024-11-14

에픽게임즈, 언리얼 엔진 5.5에서 게임 개발자 및 산업 크리에이터 위한 기능 향상

에픽게임즈 코리아는 게임 개발자와 모든 산업의 크리에이터를 위해 다양한 툴세트와 기능을 새롭게 추가하고 개선한 언리얼 엔진 5.5 버전을 정식 출시했다고 밝혔다. 이번 언리얼 엔진 5.5 업데이트에서는 ▲애니메이션 제작 ▲렌더링 ▲버추얼 프로덕션 ▲모바일 게임 개발 ▲개발자 반복작업 등에서 향상이 이뤄졌다. 애니메이션 제작 영역에서는 에디터에서 고퀄리티 애니메이션 제작 워크플로를 지원하는 신규 및 향상된 기능을 제공하여 상황에 맞는 애니메이션을 제작할 수 있으므로, DCC 애플리케이션을 오가며 작업할 필요성이 줄어들었다. 또한, 애니메이션 게임플레이 제작 툴세트에도 새로운 기능이 추가됐다. 언리얼 엔진의 비선형 애니메이션 에디터인 ‘시퀀서’가 개선돼 더 나은 필터링과 속성을 더욱 쉽게 사용할 수 있어 인터페이스상에서 더 쉽게 제어할 수 있으며, 변경 유지 애니메이션 레이어가 추가되어 기존 DCC 애플리케이션에서만 볼 수 있었던 추가적인 제어 기능과 유연성을 제공한다. ‘조건부 상태 변경’, ‘커스텀 바인딩’ 등과 같은 기능으로 다양한 다이내믹 시네마틱 시나리오를 작동하도록 설정하는 것 역시 더욱 쉬워졌다. 컨트롤 릭에서 애니메이션을 적용할 수 있는 ‘애니메이션 디포머’를 만들어 클릭 한 번만으로 시퀀서의 캐릭터에 쉽게 적용할 수 있는 기능이 추가되어 더욱 사실적인 애니메이션 이펙트를 제작할 수 있다. 또한, 애니메이션에 바로 사용하거나 자신만의 릭으로 구동되는 디포머 또는 헬퍼 릭을 제작하는데 예제로 활용할 수 있는 ‘애니메이터 키트 플러그인’도 제공된다. 다양한 UI 및 UX 개선, 새로운 사족 보행 및 비클 모듈 등을 지원하는 ‘모듈형 컨트롤 릭’이 베타 버전으로 제공되며, 더 빠르고 간소화된 페인팅 워크플로 및 가중치 편집 등의 다양한 개선 사항이 포함된 ‘스켈레탈 에디터’를 정식 버전으로 만나볼 수 있다. 언리얼 엔진용 메타휴먼 플러그인 중 하나인 ‘메타휴먼 애니메이터’ 역시 향상됐다. 이제 오디오만으로 얼굴 상단 부분의 표정을 추론하여 고퀄리티의 페이셜 애니메이션을 생성할 수 있게 됐다. 로컬 오프라인 설루션으로서 다양한 음성 및 언어와 함께 작동되며, 다른 메타휴먼 애니메이터 입력과 함께 일괄 처리 및 스크립팅할 수 있다. 런타임에 동적으로 변경되는 콘텐츠를 개발하는 게임 개발자에게 도움이 될 ‘뮤터블 캐릭터 커스터마이제이션 시스템’도 새롭게 추가됐다. 이 시스템은 캐릭터, 동물, 소품, 무기 등의 다이내믹 스켈레탈 메시, 머티리얼, 텍스처를 생성하는 동시에 메모리 사용량을 최적화하고 셰이더 비용 및 드로 콜 수를 줄여주며, 많은 파라미터와 텍스처 레이어, 복잡한 메시 상호작용 등을 처리할 수 있는 심층적인 커스터마이징을 지원한다. 하드웨어 레이 트레이싱 기반 시스템에 많은 향상이 이루어지면서, 이제 하드웨어 지원을 제공하는 플랫폼에서 ‘루멘’을 60Hz로 실행할 수 있다. 또한, 물리적으로 정확한 DXR 가속 프로그레시브 렌더링 모드인 ‘패스 트레이서’가 정식 버전으로 제공되어, 비선형 애플리케이션 또는 모든 기능을 갖춘 실사 레퍼런스 이미지의 최종 픽셀을 제작할 때 높은 퀄리티를 제공한다. 5.2 버전에서 실험단계로 선보인 머티리얼 제작 프레임워크인 ‘서브스트레이트’가 베타 버전으로 전환되면서 이제 언리얼 엔진이 지원하는 모든 플랫폼과 기존 머티리얼의 모든 기능이 지원된다. 선형 머티리얼 제작에 정식으로 사용할 수 있으며, 룩 개발 아티스트는 이 프레임워크를 활용하여 오브젝트의 룩 앤 필을 더 제어할 수 있게 됐다. 5.4 버전에서 실험단계로 도입되었던 ‘무비 렌더 그래프’ 역시 베타 버전으로 전환되면서 커스텀 EXR 메타데이터를 사용하는 기능, 컬렉션의 스포너블 지원 그리고 오브젝트 ID 지원과 같은 기존 프리셋 구성의 호환성 향상 등을 제공한다. 또한, 패스 트레이서용 ‘스파시오 템포럴 디노이저’를 신규로 제공해 선형 시퀀스에 고퀄리티의 결과를 구현할 수 있다. 신에 제약 없이 다이내믹한 그림자를 만드는 수백 개의 라이트를 추가할 수 있는 ‘메가라이트’를 통해 라이팅 아티스트는 이제 콘솔과 PC에서 소프트 섀도와 함께 텍스처가 적용된 에어리어 라이트, 라이트 함수, 미디어 텍스처 재생, 볼류메트릭 섀도를 자유롭게 사용해 볼 수 있다. ‘SMPTE 2110’의 정식 지원으로 수많은 안정성 개선, 프레임록 손실 자동 감지 및 복구, 타임코드로 PTP 지원 추가 등에 대한 개선이 이뤄졌다. ‘카메라 캘리브레이션’ 솔버 역시 정식 버전으로 제공되면서 렌즈 및 카메라 파라미터 추정 정확도가 향상됐다. 또한, 5.4 버전에서 처음 도입되었던 ‘버추얼 스카우팅’ 툴세트도 정식 버전으로 업데이트됐다. 이제 OpenXR 호환 HMD를 사용해 강력한 경험을 곧바로 활용할 수 있으며, 광범위한 API를 통한 새로운 커스터마이징도 제공한다. 한편, 이전에는 ICVFX 에디터에서만 제공됐던 ‘컬러 그레이딩 패널’이 이제 언리얼 에디터의 일반 기능으로 사용할 수 있게 돼 nDisplay로 작업하는 사용자뿐만 아니라 모든 아티스트에게 향상된 컬러 그레이딩 경험을 제공하며, 포스트 프로세스 볼륨, 시네 카메라 및 색 보정 영역도 지원한다. ‘모바일 포워드 렌더러’에 플랫폼의 비주얼 퀄리티를 높일 수 있는 다양한 신규 기능이 추가됐다. 뿐만 아니라 5.4 버전에서 도입된 런타임 자동 PSO(Pipeline State Object) 프리캐싱이 이제 기본 활성화되어 수동 PSO 수집 워크플로에 대한 쉽고 빠른 대안을 제공한다. ‘모바일 프리뷰어’의 경우 모바일 게임 콘텐츠 개발에 도움이 되는 다양한 개선이 이뤄져, 특정 안드로이드 디바이스 프로필을 캡처 및 프리뷰하는 기능과 함께 반정밀도 16비트 플로트 셰이더를 에뮬레이션하여 오류를 쉽게 확인하고 대응할 수 있는 기능을 제공한다. 개발자 반복작업의 경우, 최적화된 신규 캐시 데이터 스토리지 및 네트워크 커뮤니케이션 아키텍처인 ‘언리얼 젠 서버’가 정식 버전으로 제공돼 공유 파생 데이터 캐시로 사용될 수 있다. 또한, 이번 버전에서는 젠 서버가 타깃 플랫폼으로 쿠킹된 데이터의 스트리밍을 지원해 개발 중에도 PC, 콘솔, 모바일 등의 타깃 플랫폼에서 게임이 어떻게 보이고 작동하는지 보다 빠르고 쉽게 평가할 수 있다. 또한, 에디터 시스템과 쿠킹 프로세스에 최적화된 애셋 로딩 경로를 제공하는 ‘언리얼 젠 로더’, 더 빠른 C++ 및 셰이더 컴파일을 제공하는 ‘언리얼 빌드 액셀러레이터’, 더욱 효율적이고 확장 가능한 개발 워크플로를 제공하는 ‘언리얼 호드 지속적 통합 및 원격 실행’ 등 다양한 기능이 정식 버전으로 제공된다. 에픽게임즈 코리아는 10월 정식 출시된 새로운 통합 콘텐츠 마켓플레이스 ‘팹’이 언리얼 엔진 5.5에 통합되어 퀵셀 메가스캔과 같은 개별 애셋을 신으로 직접 드래그 앤 드롭할 수 있으며, 팹의 애셋 팩을 콘텐츠 브라우저에 추가할 수 있게 됐다고 밝혔다.

작성일 : 2024-11-13

대규모 언어 모델의 핵심 개념인 토큰, 임베딩과 모델 파인튜닝에 대해

BIM 칼럼니스트 강태욱의 이슈 & 토크 이번 호에서는 LLM(대규모 언어 모델)의 자연어 처리에서 핵심 기술인 토큰, 임베딩 및 모델 파인튜닝의 이해를 위한 개념과 임베딩 모델의 동작 메커니즘을 살펴본다. 여기서 토큰은 문장을 구성하는 단어로 가정하면 이해하기 쉽다. 토큰과 임베딩은 입력 시퀀스에 대한 출력을 학습, 예측할 때 훈련의 전제가 되는 LLM의 기본조건이다. 이에 대해 좀 더 깊게 이해해 보자. ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast 최근 대규모 언어 모델(LLM : Large Language Model)과 검색 증강 생성(RAG : Retrieval-Augmented Generation) 기술을 이용해 다양한 전문가 서비스 에이전트를 개발하는 사례가 많아지고 있다. 특히, 전문가처럼 행동하며 문제를 해결하거나 의사결정을 지원하는 멀티 에이전트 기술은 이미 선진국을 중심으로 금융, 제조, 건설 등 엔지니링 분야에 개발되고 있다. 도메인 의존 정보와 토큰 의학과 같은 특별한 분야에서는 환각 현상 등으로 인해 챗GPT(ChatGPT)와 같은 범용 LLM이 제대로 정보를 생성하지 못하는 경우가 많다. 이런 문제를 해결하기 위해 전문 분야의 지식을 기존 LLM 모델을 이용해 재학습하는 방법이 생겨났는데, 파인튜닝은 그 중 한 가지 방법이다. 파인튜닝은 빅테크 업체가 공개한 LLM 모델을 특정 도메인 지식을 잘 표현할 수 있도록 재학습하는 방법 중 하나이다. LLM의 신경망 전체를 재학습하기 위해서는 매우 비싼 GPU 사용 비용이 필요하다. 이는 일반적인 기업에서 수행할 수 없는 수준이다. 이런 이유로, 파인튜닝은 메타에서 공개한 라마(LLaMA)와 같은 파운데이션 LLM 모델의 신경망에 별도의 작은 신경망을 추가해, 이를 별도로 준비된 데이터로 학습하는 방식을 사용한다. LLM을 파인튜닝하기 전에 어떤 토큰이 사용되었는지, 임베딩 모델이 무엇인지 확인해야 한다. 파인튜닝 시 용어가 LLM에 사전 학습되어 있지 않다면, 용어 간 관계를 통계적으로 추론하는 학습 절차가 매우 비효율적으로 계산된다. 일반적으로 모델을 파인 튜닝하려면 LLM 토큰 확인 및 개발, 임베딩 모델의 적절한 사용이 필요하다. <그림 1>은 토큰이 수치화된 결과를 보여준다. 참고로, 토큰이 숫자로 표현되지 못하는 문제를 OOV(Out-Of-Vocabulary)라 한다. 그림 1. 숫자 토큰화 결과 임베딩은 학습 모델이 입력되는 문장의 토큰 패턴을 통계적으로 계산하기 전, 토큰을 수치화시키는 함수이다. 이 함수를 임베딩 모델이라 한다. 임베딩 모델은 토큰을 수치화하여 모델 학습에 사용하는데 필요한 입력값을 출력한다. 이런 이유로, 토큰 사전과 임베딩 모델이 다르면 제대로 된 모델 학습, 예측, 패턴 계산 결과를 얻기 어렵다. 임베딩 모델도 별도의 신경망 모델이며 다양한 방식으로 학습될 수 있다. 이번 호에서는 구글에서 공개한 BERT(Bidirectional Encoder Representations from Transformers) 임베딩 모델을 사용한다. 이와 관련된 실험을 하기 위해, 개발 환경을 설치하고 파이썬 코드를 준비해 본다. 개발 환경 준비 미리 컴퓨터에 파이썬, 아나콘다 등 필수적인 라이브러리가 설치되어 있다는 조건에서, 실습을 위해 명령창에서 다음을 실행해 설치한다. pip install transformers torch 참고로, 다음은 파인튜닝에 사용하는 오픈소스 라이브러리를 보여준다. Torch : 텐서 계산 및 딥 러닝을 위한 핵심 라이브러리이다. PEFT : 낮은 순위의 적응 기술을 사용하여 대규모 언어 모델을 효율적으로 미세 조정할 수 있다. 특히 리소스가 제한된 장치에서 학습 가능한 매개 변수의 수를 줄여 모델을 압축하고 더 빠르게 미세 조정할 수 있다. bitsandbytes : 신경망에 대한 양자화 및 이진화 기술을 제공하여 모델 압축을 지원한다. 모델 압축에 도움이 되므로 메모리와 계산 능력이 제한된 에지 장치에 모델을 보다 실현 가능하게 만들 수 있다. Transformers : 대규모 언어 모델 작업을 간소화하여 사전 학습된 모델 및 학습 파이프라인을 제공한다. trl : 대규모 언어 모델의 경우 효율적인 모델 학습 및 최적화에 중점을 둔다. accelerate : 다양한 하드웨어 플랫폼에서 학습 및 추론을 가속화한다. dataset : 기계 학습 작업을 위한 데이터 세트 로드 및 준비를 간소화한다. pipeline : 사용자 지정 학습 없이 일반적인 NLP 작업에 대해 사전 학습된 모델의 사용을 간소화한다. PyArrow : 효율적인 데이터 로드 및 처리를 위해 사용될 수 있다. LoraConfig : LoRA 기반 미세 조정을 위한 구성 매개변수를 보유한다. SFTTrainer : 모델 학습, 최적화 및 평가를 처리한다. ■ 자세한 기사 내용은 PDF로 제공됩니다.

작성일 : 2024-11-04

[무료다운로드] LLM RAG의 핵심 기술, 벡터 데이터베이스 크로마 분석

BIM 칼럼니스트 강태욱의 이슈 & 토크 이번 호에서는 대규모 언어 모델(LLM : Large Language Model)의 검색증강생성(RAG : Retrieval-Augmented Generation) 구현 시 핵심 기술인 임베딩 벡터 데이터베이스로 유명한 크로마(Chroma)의 핵심 구조를 간략히 분석한다. RAG는 생성형 AI의 환각현상을 줄여 전문가적인 정보를 생성하는 데에 도움을 준다. 크로마의 동작 방식을 이해하면 LLM 기술 개발 시 이해도와 응용력을 높일 수 있다. 참고로, 벡터 베이터베이스는 다양하게 있으나 크로마는 사용하기 쉽고 오픈되어 있어 현재 많이 활용되고 있다. ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast 그림 1. 벡터 데이터베이스의 종류 크로마는 AI 지원 오픈소스 벡터 베이터베이스로, RAG를 처리할 때 필수로 사용되는 데이터베이스 중 하나이다. 크로마를 이용해 LLM 기반의 다양한 앱(지식 서비스 등)을 개발할 수 있다. 예를 들어, 각종 건설 규정, BIM 관련 지침 등을 요약하고 설명해주는 전문가 시스템을 개발할 때 사용할 수 있다. 그림 2 크로마는 임베딩 벡터를 메타데이터와 함께 저장하고, 질의를 통해 해당 임베딩 도큐먼트를 검색할 수 있다. 크로마는 독립적인 서버로서 동작할 수 있다. 설치 및 사용 윈도우 명령창이나 터미널을 실행한다. 크로마 설치를 위해 다음과 같이 터미널에 명령을 입력한다. pip install chromadb 벡터 데이터베이스에 저장되는 단위는 다음과 같다. collection = client.create_collectoin(name='test', embedding_function=emb_fn) collection.add( embeddings=[ [1.1, 2.3, 3.2], [4.5, 6.9, 4.4], [1.1, 2.3, 3.2] ], metadatas=[ {"uri": "img1.png", "style": "style1"}, {"uri": "img2.png", "style": "style2"}, {"uri": "img3.png", "style": "style1"} ], documents=["doc1", "doc2", "doc3"], ids=["id1", "id2", "id3"], ) 여기에서 보는 것과 같이, 벡터 좌표계에 위치할 임베딩 벡터, 벡터에 매달아 놓을 메타데이터와 도큐먼트, ID를 하나의 컬랙션 단위로 저장한다. 이를 통해 벡터 간 유사도, 거리 등을 계산해 원하는 도큐먼트, 메타데이터 등을 얻을 수 있다. 이 때 임베딩 벡터는 미리 학습된 임베딩 모델을 사용할 수 있다. 질의해서 원하는 벡터를 얻으려면 벡터 공간에서 거리 계산이 필수적이다. 이 때 사용하는 함수는 <그림 3>과 같다. 그림 3 컬렉션에 벡터 추가와 질의는 다음과 같다. collection.add( documents=["doc1", "doc2", "doc3", ...], embeddings=[[1.1, 2.3, 3.2], [4.5, 6.9, 4.4], [1.1, 2.3, 3.2], ...], metadatas=[{"chapter": "3", "verse": "16"}, {"chapter": "3", "verse": "5"}, {"chapter": "29", "verse": "11"}, ...], ids=["id1", "id2", "id3", ...] ) collection.query( query_texts=["doc10", "thus spake zarathustra", ...], n_results=10, where={"metadata_field": "is_equal_to_this"}, where_document={"$contains":"search_string"} ) 여기서, where의 metadata_field를 이용해 다음과 같은 조건 비교 연산이 가능하다. $eq, $ne, $gt, $gte, $lt, $lte 그리고, 논리 연산자인 $and, $or를 지원한다. 크로마는 향후 워크플로, 가시화, 질의 계획, 분석 기능을 준비하고 있다. ■ 자세한 기사 내용은 PDF로 제공됩니다.

작성일 : 2024-10-07