• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "CPU"에 대한 통합 검색 내용이 1,437개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
인텔, “새로운 HPC 클러스터로 AI 처리 능력 2배 향상”
인텔은 델 테크놀로지스, 엔비디아, 오하이오 슈퍼컴퓨터 센터(OSC)와 협업한 결과로 최첨단 고성능 컴퓨팅(HPC) 클러스터인 카디널(Cardinal)을 공개했다. 카디널은 연구, 교육 및 산업 혁신, 특히 인공지능(AI) 분야에서 증가하는 지역 내 HPC 리소스 수요를 충족하기 위해 설계되었다. AI와 머신러닝은 과학, 공학, 바이오 의학 분야에서 복잡한 연구 문제를 해결하기 위해 필수로 활용되고 있다. 이러한 기술의 효능이 지속적으로 입증되면서 농업 과학, 건축학, 사회학과 같은 학문 분야에서도 활용도 늘어나고 있다. 카디널 클러스터는 증가하는 AI 워크로드의 수요를 충족할 수 있는 하드웨어를 갖추고 있다. 인텔은 이 새로운 클러스터가 “2016년에 출시된 오웬스 클러스터(Owens Cluster)를 대체할 시스템보다 기능과 용량 모든 면에서 더 대규모의 업그레이드가 될 것”이라고 밝혔다.     카디널 클러스터는 메모리 사용량이 많은 HPC 및 AI 워크로드를 효율적으로 관리하는 동시에 프로그래밍 기능, 이식성(portability) 및 에코시스템 채택을 촉진하는 기반이 되는 델 파워엣지(Dell PowerEdge) 서버와 고대역폭 메모리(HBM)를 갖춘 인텔 제온 CPU 맥스 시리즈(Intel Xeon CPU Max Series)를 활용한 이기종 시스템이다. 이 시스템은 총 3만 9312 개의 CPU 코어를 제공하는 756개 맥스 시리즈(Max Series) CPU 9470 프로세서와 128 기가바이트(GB) HBM2e 및 노드 당 512 GB의 DDR5 메모리를 탑재했다. 단일 소프트웨어 스택과 x86 기반 기존 프로그래밍 모델을 갖춘 이 클러스터는 광범위한 사용 케이스를 처리하고 쉽게 도입 및 배포할 수 있도록 지원하면서 OSC의 처리 능력을 두 배 이상 향상시킬 수 있다. 또한, 이 시스템은 32개의 노드로 104개의 코어, 1테라바이트(TB)의 메모리, 4개의 NV링크(NVLink) 연결로 상호 연결된 94GB HBM2e 메모리를 갖춘 엔비디아 호퍼 아키텍처 기반 H100 텐서 코어(H100 Tensor Core) GPU 4개를 탑재했다. 초당 400기가비트(Gbps)의 네트워킹 성능과 짧은 지연 시간을 제공하는 엔비디아 퀀텀-2(Nvidia Quantum-2) 인피니밴드(InfiniBand)로 대규모 AI 기반 과학 애플리케이션을 위한 500페타플롭(petaflop)의 최고 AI 성능(희소성 포함 FP8 텐서 코어)을 제공하며, 16개의 노드에 104개의 코어, 128GB HBM2e 및 2TB DDR5 메모리를 탑재해 대규모 대칭형 멀티프로세싱(SMP) 스타일 작업을 처리할 수 있다. 인텔의 데이터 센터 AI 솔루션 제품군을 총괄하는 오기 브르기치(Ogi Brkic) 부사장은 “인텔 제온 CPU 맥스 시리즈는 널리 채택된 AI 프레임워크와 라이브러리를 활용하여 HPC 및 AI 워크로드를 개발하고 구현하는 데 최적의 선택지”라면서, “이 시스템의 고유한 이기종성을 통해 OSC의 엔지니어, 연구원 및 과학자들이 이 시스템이 제공하는 두 배 이상 메모리 대역폭 성능을 최대한 활용할 수 있도록 지원할 것”이라고 전했다.
작성일 : 2024-02-23
델, “업무에 AI 활용하기 위해 워크스테이션 도입 고려하는 기업 증가”
한국 델 테크놀로지스는 한국IDG와 발간한 ‘업무용 PC 및 워크스테이션 사용 현황 조사’ 보고서에서 올해 AI 관련 IT 투자 계획을 갖고 있는 기업이나 공공기관 중에 워크스테이션을 최초로 도입하겠다는 곳이 약 63%로 나타났다고 밝혔다. 이번 조사는 AI 등 고부하 워크로드가 늘어나는 추세에 따라 워크스테이션의 도입 현황과 향후 전망을 파악하기 위해 실시됐으며, 2023년 11월 2주간 기업의 IT 담당자과 일반 사무직 및 제조·연구 개발 엔지니어 등 전문 직무 사용자 2725명을 대상으로 진행됐다. 조사에 따르면 AI 워크로드를 처리하기 위해 워크스테이션을 도입할 기업 및 공공기관들이 크게 늘어날 것으로 보인다. 현재 일반 업무용 PC만 사용하고 있으나 추후 AI 관련 업무를 위해 IT 기기 및 인프라 도입을 계획하고 있는 기업 및 공공기관의 63%가 워크스테이션 도입을 고려하고 있다고 밝혔다. 한편, 작년에 AI 관련 업무에 워크스테이션을 사용한 기업 및 공공기관은 10% 이하에 머물렀지만, 올해는 그 비율이 48.9%로 증가할 것으로 나타났다. 기업 규모 측면에서는 이미 워크스테이션을 사용하는 스타트업 중 AI 관련 업무에 워크스테이션 추가 도입을 계획하고 있다는 응답이 74.1%였다. 일반 업무용 PC만 사용하는 스타트업도 AI 관련 업무를 위해 워크스테이션을 새로 도입하려고 한다는 응답이 69.2%로, 대기업(66.7%)이나 중견기업(58.3%)보다 높게 나타났다. 대규모 IT 인프라를 활용하기 어려운 스타트업들이 AI 워크로드를 로컬에서 수행할 수 있는 워크스테이션에 높은 관심을 보이는 것으로 해석할 수 있다.  어떤 AI 워크로드에 워크스테이션을 본격적으로 활용할 계획인지 기업 및 공공기관의 IT 담당자들을 대상으로 조사한 결과, AI 모델 트레이닝(45.6%), 시뮬레이션 및 테스트(45.6%), 학습 데이터 준비 및 가공(25.0%) 순으로 나타났다. 이는 지난해 AI 모델 트레이닝(4.3%)과 시뮬레이션 및 테스트(2.9%)에 워크스테이션을 주로 활용했다는 수치와 차이가 나는 결과다.     또한, 이번 조사에 따르면 제조·연구개발 엔지니어(67.3%), IT 개발자(58.4%) 등 전문 직무 응답자의 과반수 이상이 추후 데이터 집약적인 업무를 처리하기 위해 워크스테이션 제품을 사용할 의향이 있다고 답했다. 현재 워크스테이션의 최대 활용 분야 역시 엔지니어링 영역에서 많이 사용하는 프로그램인 CAD/CAM(24.7%) 및 소프트웨어 개발(17.6%)인 만큼 고성능 CPU 및 GPU가 요구되는 분야에서 워크스테이션을 선호하는 것으로 나타났다.   한편 55.5%의 일반 사무직 응답자 또한 추후 업무를 위해 워크스테이션을 도입할 의사를 밝혔다. 최근 일반적인 업무 환경에서 다루는 워크로드의 규모가 전반적으로 증가한 것이 영향을 미친 것으로 보인다. 예컨대 일반 PC 사용자들이 다수의 오피스 소프트웨어를 사용하는 동시에 팀즈나 줌 등의 화상회의 프로그램까지 함께 사용하는 경우가 많아, 더 많은 컴퓨팅 파워가 필요해졌기 때문으로 풀이된다.  워크스테이션은 전문적인 업무를 처리할 수 있도록 설계돼 높은 성능과 안정성이 필수다. 현재 워크스테이션을 사용하는 응답자들은 워크스테이션의 CPU 및 GPU 성능(85.3%)과 스토리지 및 메모리(56.0%)를 고려해 도입했다고 답했으며, 시스템 안정성(39.7%)이 그 뒤를 이었다. 현재 일반 업무용 PC를 사용하고 있는 답변자들 또한 워크스테이션에 관심을 가지는 이유로 고성능(44.1%)을 꼽았고, 필요에 따라 성능을 편리하게 확장할 수 있는 유연성(33.7%)도 비교적 큰 비중을 차지해 고성능 시스템에 대한 수요가 지속될 것으로 보인다.  한국 델 테크놀로지스의 김경진 총괄사장은 “AI와 같은 고부하 워크로드의 증가로 새로운 변화가 빠르게 진행될수록, 국내 기업의 고성능 PC에 대한 수요는 계속 증가할 것이라는 점을 이번 조사를 통해 확인했다. 워크스테이션은 AI 혁신을 가속할 수 있는 최적화된 도구이자 비용 효율적인 대안”이라며, “델 테크놀로지스의 워크스테이션 제품군은 고성능과 안정성뿐 아니라 확장성과 보안 역량을 갖춘 제품군으로, 델 테크놀로지스는 기업들이 워크스테이션을 통해 비즈니스 가치를 극대화할 수 있도록 전략과 고객 지원 체계를 더욱 강화해 나갈 것”이라고 전했다.
작성일 : 2024-02-15
엔비디아, 차세대 AI 디자인과 시각화를 위한 RTX 2000 에이다 제너레이션 GPU 출시
엔비디아가 차세대 AI 가속화 시대를 위한 엔비디아 RTX 2000 에이다 제너레이션 GPU(NVIDIA RTX 2000 Ada Generation GPU)를 출시했다고 밝혔다. 현재 산업 전반에 걸쳐 변화를 주도하고 있는 생성형 AI의 이점을 활용하기 위해 기업들은 워크플로를 작동시킬 수 있는 적절한 하드웨어를 선택해야 한다. 엔비디아 RTX 2000 에이다 제너레이션은 최신 AI, 그래픽, 컴퓨팅 기술을 컴팩트 워크스테이션에 적용해 전문가용 워크플로에서 이전 세대 RTX A2000 12GB 대비 최대 1.5배의 성능을 제공한다. 새로운 GPU는 정교한 3D 환경 제작부터 복잡한 설계 검토의 간소화, 산업 디자인에 이르기까지 다양한 기능을 처리할 수 있다. 향상된 기능은 전문가들이 성능의 저하 없이 더 많은 것을 실현할 수 있도록 지원하며 AI로 가속화된 미래를 위한 기반을 제공한다. AI 기반 도구, 멀티 디스플레이 설정, 고해상도 콘텐츠 등과 같은 최신 멀티 애플리케이션 워크플로에는 GPU 메모리에 대한 요구가 상당히 높다. 전문가들은 RTX 2000 에이다 제너레이션의 16GB 메모리를 통해 최신 기술과 도구를 활용해 데이터를 더욱 빠르고 효과적으로 작업할 수 있다. 엔비디아 RTX 기술로 구동되는 새로운 GPU는 엔비디아 DLSS를 통해 그래픽에 높은 사실감을 부여한다. 이를 통해, 이전보다 3배 이상 빠른 초고화질의 실사에 가까운 레이 트레이싱 이미지를 제공할 수 있다. 또한, RTX 2000 에이다 제너레이션은 제품 디자인과 엔지니어링 설계 검토와 같은 엔터프라이즈 가상 현실 워크플로에 몰입감 높은 경험을 제공한다.     성능과 활용성에 AI 기능까지 결합된 RTX 2000 에이다 제너레이션은 다양한 산업 분야의 전문가들이 효율성을 달성할 수 있도록 지원한다. 건축가와 도시 설계사는 시각화 워크플로와 구조 분석을 가속화해 설계 정밀도를 높일 수 있다. 산업용 PC를 사용하는 제품 디자이너와 엔지니어는 빠르고 사실적인 렌더링과 AI 기반 생성 디자인을 통해 제품 디자인의 반복 작업을 수행할 수 있다. 콘텐츠 크리에이터는 고해상도 동영상과 이미지를 원활하게 편집하고, AI를 활용한 사실적인 시각 효과를 연출해 콘텐츠 제작에 도움을 받을 수 있다. 아울러 중요한 임베디드 애플리케이션과 에지 컴퓨팅에서 RTX 2000 에이다 제너레이션은 의료 기기의 실시간 데이터 처리를 지원한다. 또한, 예측 유지보수를 통해 제조 공정을 최적화하거나 유통  환경에서 AI 기반 인텔리전스를 구현할 수 있다. 엔비디아 RTX 2000 에이다 제너레이션은 엔비디아 에이다 러브레이스(Lovelace) GPU 아키텍처의 최신 기술을 탑재하고 있다. 여기에는 ▲최대 1.7배 빠른 레이 트레이싱 성능으로 충실하고 사실적인 렌더링이 가능한 3세대 RT 코어 ▲이전 세대 대비 최대 1.8배의 AI 처리량, 구조화된 희소성, FP8 정밀도로 AI 가속 도구와 애플리케이션에 더 높은 추론 성능을 제공하는 4세대 텐서 코어 ▲이전 세대 대비 최대 1.5배의 FP32 처리량으로 그래픽과 컴퓨팅 워크로드의 성능이 향상된  쿠다(CUDA) 코어 ▲이전 세대와 동일한 70W의 전력으로 전문가용 그래픽, 렌더링, AI, 컴퓨팅 워크로드 전반에서 최대 2배의 성능 향상 ▲이전 세대 대비 가상 현실 워크플로 성능 최대 3배 향상 ▲더 큰 규모의 프로젝트를 처리할 수 있는 16GB의 GPU 메모리 및 오류 수정 코드 메모리 ▲AI 기반 그래픽을 개선하고 고품질 프레임을 추가로 생성해 성능을 높이는 DLSS 3 ▲AV1을 지원하며 H.264보다 효율을 40% 높인 8세대 엔비디아 인코더(NVENC) 등이 있다. 한편, 엔비디아는 RTX 엔터프라이즈 드라이버의 최신 업데이트에 그래픽 워크플로를 개선하는 다양한 기능과 함께 RTX 2000 에이다 지원을 포함한다고 밝혔다. 여기에는 ▲AI 기반의 표준 다이나믹 레인지(SDR)에서 하이 다이나믹 레인지(HDR)로 톤 매핑을 지원하는 비디오 트루HDR(Video TrueHDR) ▲엔비디아 GPU에서 최신 대규모 언어 모델(LLM)에 대한 추론 성능을 최적화하고 가속화하는 오픈소스 라이브러리인 텐서RT-LLM(TensorRT-LLM) ▲비트 심도 확장 기술과 새로운 저지연 B프레임을 통한 비디오 품질 개선과 비디오 코덱의 코딩 효율 향상 ▲더 빠른 작업 완료를 위해 실행 간접 확장 엔비디아 API를 사용해 CPU에서 GPU로 작업을 오프로드하는 기능 ▲데스크톱의 엔비디아 제어판(NV Control Panel)에서 GPU 일련 번호를 표시하는 기능 등이 있다. RTX 2000 에이다 제너레이션의 성능을 앞서 활용하고 있는 기업으로는 솔리드웍스(SOLIDWORKS) 애플리케이션을 보유한 다쏘시스템, 롭 월커스 디자인 앤 엔지니어링(Rob Wolkers Design and Engineering), WSP 등이 있다. 다쏘시스템이 2월 11일~14일 미국 댈러스에서 진행한 ‘3D익스피리언스 월드’에서는 엔비디아 RTX 2000 에이다로 구동되는 다쏘시스템 솔리드웍스 애플리케이션의 실시간 데모가 진행되기도 했다. 다쏘시스템 솔리드웍스 그래픽 애플리케이션 연구개발 책임자인 올리비에 제그던(Olivier Zegdoun)은 “고효율 차세대 아키텍처, 저전력 소비, 대용량 프레임 버퍼를 갖춘 새로운 엔비디아 RTX 2000 에이다는 솔리드웍스 사용자에게 큰 도움이 될 것이다. 이 제품은 디자이너와 엔지니어가 더 큰 데이터세트에서도 완전한 모델 충실도로 혁신적인 제품 경험을 빠르게 개발할 수 있도록 뛰어난 성능을 제공한다”고 말했다.  엔비디아 RTX 2000 에이다는 현재 애로우 일렉트로닉스(Arrow Electronics), 잉그램 마이크로(Ingram Micro), 리드텍(Leadtek), PNY, 료요 엘렉트로(Ryoyo Electro), TD시넥스(TD SYNNEX) 등 글로벌 유통 파트너를 통해 구매할 수 있다. 오는 4월부터는 델 테크놀로지스, HP, 레노버 등에서도 구매 가능하다.
작성일 : 2024-02-14
케이던스, GPU 컴퓨팅과 CFD 솔버 결합한 다중물리 턴키 솔루션 발표
케이던스 디자인 시스템즈는 디지털 트윈의 다중물리(멀티피직스) 시스템 설계 및 분석을 가속화할 수 있는 ‘케이던스 밀레니엄 엔터프라이즈 다중물리 플랫폼(Cadence Millennium Enterprise Multiphysics Platform)’을 발표했다. 1세대 플랫폼인 케이던스 밀레니엄 M1(Cadence Millennium M1)은 하드웨어 및 소프트웨어 솔루션을 결합해 고성능 CFD(전산유체역학) 시뮬레이션을 가속화한다. GPU를 탑재한 HPC 하드웨어와 최적화된 GPU 가속화(Acceleration) 및 생성형 AI를 활용할 수 있는 케이던스 고성능 피델리티 CFD(Cadence high-fidelity CFD) 소프트웨어가 턴키로 포함된 것이 특징이다. 밀레니엄 M1은 통합 클러스터로 융합하여, 복잡한 기계 시스템을 시뮬레이션할 때 빠른 TAT(Turnaround Time)과 거의 선형에 가까운 확장성을 고객에게 제공하는 것이 목표이다. 자동차, 항공우주 및 방위산업, 에너지 및 터보기계 등 산업에서는 성능과 효율면에서 새로운 차원의 기계 시스템을 설계하는 것이 핵심적인 우선 과제가 되었다. 자동차 설계자들은 성능을 최적화하고 온실가스를 줄이기 위해 연비 개선, 항력 및 소음 감소, 전기 자동차 주행 거리 연장에 집중하고 있다. 또한 A&D 및 터보기계 설계 엔지니어들에게는 효율 향상, 탄소 배출량 감소, 유지보수 빈도를 줄이는 것이 중요하다. 이런 목표를 달성하기 위해서는 다중물리 시뮬레이션 기술의 발전이 필수적이다. 속도, 정확성, 용량 및 계산 속도를 가속화하는 것은 디지털 트윈 시뮬레이션에 필수 요소로서, 프로토타입을 개발하고 테스트하기에 앞서 의도한 대로 작동할 수 있다는 확신을 줄 수 있는 설계 혁신의 원동력이 된다.   ▲ 이미지 출처 : 케이던스 웹사이트   GPU 내장 CFD 솔버와 전용 GPU 하드웨어를 결합한 케이던스 밀레니엄 플랫폼은 최대 1000개의 CPU 코어로 GPU당 슈퍼컴퓨터급의 처리량을 제공한다. 동급 CPU 대비 향상된 에너지 효율로 몇 주가 걸리던 처리 시간을 몇 시간으로 단축할 수 있게 지원한다.  케이던스 피델리티 CFD 솔버는 복잡한 시뮬레이션 문제를 해결할 수 있으며 높은 정확도를 제공한다. 밀레니엄 플랫폼은 확장형 아키텍처와 유연성을 갖춘 피델리티 솔버를 통해 여러 GPU 노드에서 선형에 가까운 확장성을 제공한다. 또한, 생성형 AI를 접목한 디지털 트윈은 고품질의 다중물리 데이터를 빠르게 생성하고, 생성형 AI가 최적의 시스템 설계 솔루션의 디지털 트윈 시각화를 안정적으로 생성할 수 있다. 케이던스는 밀레니엄 플랫폼이 주요 공급업체의 GPU를 바탕으로 클라우드 환경에서 8개 이상의 GPU를 구성하거나 온프레미스 환경에서 최소 32개 GPU를 구성할 수 있으며, 고객이 원하는 구성 방식을 적용할 수 있는 유연하고 확장성 높은 솔루션을 제공한다고 소개했다. 케이던스의 밴 구(Ben Gu) 다중물리 시스템 분석 R&D 부사장은 “케이던스는 35년의 역사를 통해 매우 어려운 컴퓨팅 분야에서 정확성을 유지하면서 동시에 계산 속도를 향상시키는데 주력해 왔다. 알고리즘 처리량은 여전히 핵심 우선순위이며 이제 우리는 생성형 AI를 활용하여 방대한 양의 설계 및 시뮬레이션 데이터에서 정보를 추출하고 있다”면서, “밀레니엄 플랫폼은 디지털 트윈 및 AI 애플리케이션의 가속화와 확장성을 제공하는 거대한 도약이며, CFD는 성능과 효율이 향상되면서 아주 유용하게 활용될 준비를 마쳤기 때문에 밀레니엄 M1의 뛰어난 성능은 빠른 제품을 출시를 해야 하는 산업계에 혁신을 가져올 것”이라고 전했다.
작성일 : 2024-02-05
딥러닝 수치해석 데이터의 병렬처리를 지원하는 파이썬 넘바 라이브러리
BIM 칼럼니스트 강태욱의 이슈 & 토크   이번 호에서는 GPU CUDA(쿠다) 병렬처리를 지원하는 넘바(Numba) 라이브러리를 간략히 소개한다. CUDA는 현재 딥러닝 기술의 기반처럼 사용되며, 사실상 산업 표준이다. 딥러닝은 모든 연산이 텐서 행렬 계산이므로, 엔비디아 GPU에 내장된 수많은 계산 유닛(실수 계산에 특화된 CPU)들을 사용한다. CUDA의 강력한 수치해석 데이터 병렬처리 기능은 딥러닝뿐 아니라 디지털 트윈의 핵심인 시뮬레이션, 모델 해석 등에 필수적인 수치계산 엔진으로 사용된다.   ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | http://www.facebook.com/groups/digestpodcast   CUDA는 내장된 수많은 계산 유닛에 입력 데이터를 할당하고, 행렬연산을 하여 출력된 데이터를 CPU 메모리가 접근할 수 있도록 데이터 고속 전송/교환하는 역할을 한다. 그러므로, 딥러닝 모델 학습 성능은 GPU CUDA 성능에 직접적 영향을 받는다. 이벙 호에서는 파이썬(Python)에서 CUDA를 이용해 수치해석 등 계산 성능을 극대화할 수 있는 방법과 간단한 예제를 살펴본다.   그림 1. CUDA 아키텍처(출처 : Multi-Process Service : GPU Deployment and Management Documentation)   GPU CUDA 소개 CUDA는 게임 화면에 렌더링되는 3차원 이미지를 2차원 픽셀에 매핑하기 위한 수많은 행렬을 실시간 처리할 수 있도록 개발되어 왔다. 이런 이유로, 행렬 고속 연산이 필요한 딥러닝 학습에 적극 사용된 것이다.   그림 2. CUDA 기반 실시간 텐서 행렬 연산 결과   CUDA는 오랫동안 개발자의 요구사항을 반영해 발전되어, 개발 플랫폼으로서 탄탄한 생태계를 구축했다.   그림 3. 엔비디아 개발자 사이트   그림 4. CUDA 기반 레이트레이싱 렌더링 결과(출처 : Ray Tracey's blog : GPU path tracing tutorial 3 : GPU)   사실, 많은 스타트업이 이런 기능을 지원하는 딥러닝용 AI 칩을 FPGA 기법 등을 이용해 개발, 홍보하고 있으나, 이런 개발자 지원도구와 플랫폼 생태계 없다면 산업계에서는 의미가 없다고 볼 수 있다.   넘바 소개 넘바는 파이썬 기반 CUDA GPU 프로그래밍을 지원한다. 넘바는 컴파일 기술을 지원하여 CPU와 GPU 모드에서 코딩되는 데이터 구조, 함수 호출을 추상화한다. 넘바는 엔비디아의 CUDA 함수와 설정을 래핑한 고수준의 함수 API를 제공한다. 이를 통해 개발자가 CUDA의 세부 설정에 신경쓸 필요 없이, 데이터 병렬 처리 개발에만 집중할 수 있다.   개발 환경 넘바의 개발 환경은 다음과 같다. NVIDIA Compute Capability 5.0 이상 CUDA 지원 GPU 장착 PC(2023년 12월 시점) NVIDIA CUDA 11.2 이상 NVIDIA TX1, TX2, 자비에, 젯슨 나노 GTX 9, 10, 16 시리즈. RTX 20, 30, 40 시리즈. H100 시리즈 CONDA 환경의 경우, 다음과 같이 터미널을 이용해 CUDA 툴킷을 자동 설치할 수 있다. conda install cudatoolkit 넘바는 cuda python을 이용해 엔비디아 GPU CUDA와 바인딩한다. conda install nvidia::cuda-python 설치 방법은 다음과 같다. conda install numba   ■ 상세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2024-02-02
HP, AI 내장 PC 등 소비자용 신제품 소개하며 개인의 디지털 경험 혁신 제시
HP가 CES 2024에서 소비자용 신제품 포트폴리오를 공개했다. HP는 일상생활에서 새로운 기술을 활용할 수 있도록 지원해 사용자에게 향상된 디지털 경험을 제공하는 PC, 모니터, 주변기기를 바탕으로 컴퓨팅 혁신을 이끌겠다는 전략이다.   ▲ HP 스펙터 x360 14 노트북    HP는 적응력이 높은 AI 기술을 내장한 투인원 노트북 신제품 ‘HP 스펙터(HP Spectre) x360’의 14인치와 16인치 제품을 공개했다. 이 제품은 로 라이트 조정 기능을 갖춘 9MP 카메라를 탑재해 선명한 화상 회의를 할 수 있도록 지원한다. 또한, 고성능 AI 칩을 활용해 자리를 뜨면 화면이 자동으로 꺼지는 ‘워크 어웨이 잠금(Walk away lock)’, 가까이 다가가면 기기가 빠르게 켜지는 ‘웨이크 온 접근(Wake on approach)’, 누군가 뒤에 있을 경우 물리적인 보안 위협을 막기 위해 화면이 흐려지는 ‘개인 정보 보호 경고’ 등의 보안 기능을 제공한다. 또한, 자동 화면 밝기 조정을 통해 전력 낭비를 막는 동시에 가변 재생률을 지원해 높은 성능을 유지하면서도 전력 효율을 개선했다. 자동 성능 최적화 기능으로 사용 중인 애플리케이션, 노트북 배치, 배터리 상태에 따라 팬 소음과 온도까지 자동으로 조정한다. HP 스펙터 x360은 CPU, GPU, NPU에 인텔 코어 울트라 프로세서 탑재 및 엔비디아 지포스 RTX 4050 GPU를 옵션으로 제공해 다양한 로컬 AI 작업을 지원한다. 사용자는 사진과 비디오 편집 작업 속도를 높이는 동시에 콘텐츠 제작 및 협업 또한 보다 원활하게 수행할 수 있다. 그리고 영상 장비 전문 업체 폴리(Poly)의 오디오 튜닝이 적용돼, 선명하고 우수한 오디오 품질을 통해 사용자에게 향상된 오디오 경험을 제공한다. 또한 다양한 윈도우 스튜디오 효과(Windows Studio effect)로 오토 프레임, 배경 블러 처리, 자연스러운 아이 콘택트를 지원해 원격 및 화상 회의 등 비대면 협업 기능을 강화했다. 아이맥스 인핸스드(IMAX Enhanced) 인증을 받은 최대 2.8K 해상도의 OLED 화면을 제공해 선명한 이미지와 생생한 색감을 전달하며, 16:10으로 보다 넒은 화면비를 갖추고 사용자가 시청하는 콘텐츠 유형에 따라 48Hz에서 120Hz까지 주사율 조정이 가능한 것도 특징이다. 한편, HP는 일상 속 디지털 경험에 활용할 수 있는 다양한 주변기기도 출시했다. HP의 새로운 주변 기기 포트폴리오는 다변화된 라이프스타일 트렌드에 따라 지속적으로 변모하는 소비자 니즈를 충족한다.  폴리 보이저 프리 20 무선 이어버드(Poly Voyager Free 20 wireless earbuds)는 이동이 잦은 사용자를 위한 제품으로, ‘적응형 액티브 노이즈 캔슬링(Adaptive Active Noise Canceling)’이 적용돼 음악 감상 및 통화 등 사용 형태와 무관하게 선명한 음질을 제공한다. 고품질 오디오 기술 및 지능형 소음 제거 기능을 통해 사용자의 목소리 또한 명확하게 전달한다. 완충 시 최대 8시간까지 이용 가능하며, 배터리 수명을 2.5배 연장하는 Qi 휴대용 충전 케이스 이용 시 보다 오랜 시간 동안 제품을 사용할 수 있다. 또한, 폴리 렌즈 모바일 앱(Poly Lens Mobile App)에서 핏 테스트를 통해 사용자의 귀에 맞는 이어 팁 사이즈를 찾아 제품 착용감 및 전반적인 청취 경험을 동시에 향상시킬 수 있다.   ▲ HP 960 인체공학적 무선 키보드   HP 960 인체공학적 무선 키보드(HP 960 Ergonomic Wireless Keyboard)는 다용도로 활용할 수 있는 인체공학적 분할 무선 키보드다. 분할 설계된 디자인을 통해 사용자의 타이핑 스타일에 맞게 제품을 사용할 수 있으며, 20개의 프로그래밍 가능한 키와 별도의 숫자 키패드를 이용해 커스터마이징이 가능하다. 블루투스 및 동글 연결을 지원해 작업에 따라 적합한 기기를 사용할 수 있다. 제품의 50%는 재생(PCR) 플라스틱으로 제작됐으며, 포장재 역시 지속 가능한 재료로 만들어져 친환경성도 고려됐다. HP 690 충전식 무선 마우스(HP 690 Rechargeable Wireless Mouse)는 Qi 충전식 블루투스 마우스로 무선으로 쉽게 연결할 수 있다. 6개 이상의 프로그래밍 가능한 버튼이 있어 HP 액세서리 센터 앱(HP Accessory Center App)을 통해 맞춤형 사용이 가능해 사용자의 생산성 향상에 기여한다. HP 430 프로그래머블 무선 키패드(HP 430 Programmable Wireless Keypad)는 커스터마이징이 용이한 기계식 키패드로, 콤팩트한 디자인을 통해 휴대성을 높였다. HP USB-C 트래블 허브 G3(HP USB-C Travel Hub G3)는 USB-C 포트 1개, USB-A 포트 2개, HDMI 포트 1개로 구성되었으며, 대부분의 장치와 연결이 가능해 기기에 손쉽게 전원을 공급하고 연결할 수 있다. HP 400 백릿 유선 키보드(HP 400 Backlit Wired Keyboard)는 액체 유입 방지 및 소독이 가능한 키보드로, USB-C 코드 및 USB-A 어댑터와 함께 제공되어 연결이 간편하다.   ▲ HP 시리즈 5 모니터   HP는 HP 시리즈 5 모니터(Hp Series 5 Monitor)를 출시하며 소비자용 디스플레이 라인업 다양화에도 나섰다. 24인치, 27인치, 32인치 모델이 출시되는 이 제품은 1500:1 명암비와 100Hz 재생률을 제공한다. 초슬림 베젤이 특징인 얇고 가벼운 디자인과 함께 통합 케이블 관리가 가능한 HDMI 포트가 추가돼, 되어 동일한 디자인의 모니터를 여러 대 연결할 수 있어 일렬로 배치 시 확장된 시야를 연출할 수 있다. HP 코리아의 김대환 대표는 “가장 개인적인 부분에서 최고의 혁신이 나타난다. HP의 신기술이 탑재된 솔루션은 사용자에게 그 어느 때보다도 높은 수준의 개인 맞춤화 경험을 제공한다”면서, “AI 등장과 같은 혁신이 인류의 기술 활용 방안에 큰 변화를 가져올 것으로 예상된다. HP는 이 혁신의 이점을 잘 활용할 것”이라고 전했다.
작성일 : 2024-01-11
설계자를 위한 유동해석 소프트웨어, SOLIDWORKS Flow Simulation
설계자를 위한 유동 해석 소프트웨어, SOLIDWORKS Flow Simulation   주요 CAE 소프트웨어 소개    ■ 개발 : Dassault Systèmes, www.solidworks.com/domain/simulation ■ 자료 제공 : 다쏘시스템코리아, 02-3270-7800, www.3ds.com/ko / 노드데이타, 02-595-4450, www.nodedata.com / 메이븐, 02-852-2555, www.swmaven.co.kr SOLIDWORKS(솔리드웍스) 사용자가 사용할 수 있는 SOLIDWORKS Flow Simulation은 설계 시 유체 유동 및 열전달 시뮬레이션 수행을 통해 제품의 성능을 향상하고 설계 통찰을 얻을 수 있는 포괄적인 유동 해석 기능을 제공한다.  CFD(Computational Fluid Dynamics)를 기반으로 해석을 수행하며 Add-in 형태로 제공되어, SOLIDWORKS CAD 모델을 SOLIDWORKS Flow Simulation 환경에서 그대로 활용할 수 있다. 따라서 CAD 모델 변경시 해석 모델이 자동으로 업데이트되는 장점을 지닌다. 제품 개발 시 설계와 해석을 동시에 진행하여야 하는 경우 합리적이고 효율적으로 업무를 진행할 수 있다. SOLIDWORKS Flow Simulation은 단일 파트로 구성된 지오메트리에서 어셈블리까지 모두 활용할 수 있으며 외부 유동, 내부 유동, 복합 열전달, 비뉴턴 유체, 자유수면 고려, 다공성 매체, 입자 스터디 등 다양한 해석 기법을 제공하며 정상 상태에서 비정상 상태 해석까지 수행할 수 있다. 다양한 난류 모델 및 내장되어 있는 유체 모델을 손쉽게 선택할 수 있도록 구성되어 있으며 ‘마법사’ 기능을 통해 까다로운 유동해석 조건을 손쉽게 부여할 수 있다. Electronics Cooling 및 HVAC 모듈을 추가할 경우 확장된 해석 기능 활용을 통해 전자제품 냉각 해석 및 HVAC 관련 해석을 수행할 수 있다.  SOLIDWORKS Flow Simulation은 지오메트리 변경에 따른 최적화 해석을 자동으로 수행하는 기능을 제공하는 등 해석에 국한하지 않고 설계 전반에 필요한 통찰을 제공한다. 해석 시 사용자가 보유한 모든 computing resource(Number of CPU Cores) 사용에 제약이 없으며, SOLIDWORKS Simulation 구조 해석에 필요한 정적 하중을 생성할 수 있다. 해석에 필요한 모델 생성의 경우 지오메트리 기반으로 자동 생성되며, 손쉽게 수정 및 관리할 수 있다.   좀더 자세한 내용은 'CAE가이드 V1'에서 확인할 수 있습니다. 상세 기사 보러 가기 
작성일 : 2024-01-06
클라우드 기반 CFD, SIMULIA Fluid Dynamics Engineer
클라우드 기반 CFD, SIMULIA Fluid Dynamics Engineer   주요 CAE 소프트웨어 소개   ■ 개발 : Dassault System, www.3ds.com ■ 자료 제공 : 노드데이타, 02-595-4450, www.nodedata.com   SIMULIA(시뮬리아) Fluid Dynamics Engineer는 클라우드 기반의 CFD 툴로 내부 및 외부 흐름에 대한 유체 성능을 검증하며, 최적의 흐름 분포, 최소 압력 손실 및 난류를 시뮬레이션하여 제품의 성능을 평가할 수 있으며 이를 이용해 설계를 개선하여 최적을 설계를 이룰 수 있다. 일반적인 CFD(Computational Fluid Dynamics) 툴에서 사용하는 기본 이론인 RNAS 방정식(Reynolds Avergaged Navier-Stokes 방정식)을 활용하여 정확도와 효율성을 동시에 가지는 유동 해석 애플리케이션으로 고급 레벨의 솔루션이다. 3DEXPERIENCE 시뮬레이션 포트폴리오의 일부인 Fluid Dynamics Engineer는 모든 일반적인 정상 상태, 비정상 상태 유동 해석부터 음속 유동 해석, 혈액과 같은 비뉴턴 액체에 대한 해석이 가능하고, 팬이나 필터, 배플 등을 표현하기 위한 모델링 기법도 활용 가능하다.  또한 모든 분야에서 일반적으로 사용되며 계산의 정확성이 높은 대표적인 난류 모델인 SST k-Ѡ 난류 모델, Realizable k-ε 난류 모델, Spalart – Allmaras 난류 모델을 제공하여 상황에 맞는 난류 모델을 선택할 수 있어 더욱 정확한 시뮬레이션을 진행할 수 있다.  클라우드 기반의 애플리케이션으로 컴퓨터 CPU를 이용한 로컬 해석뿐 아닌 클라우드 리소스를 활용하는 클라우드 컴퓨팅으로 해석을 진행할 수 있어 상대적으로 빠른 시간에 해석 결과를 얻을 수 있으며, 사무실뿐 아닌 외부에서 하드웨어의 영향없이 해석의 세팅 및 진행과정 결과를 확인할 수 있다. 또한 실시간으로 협의 가능하여 작업 효율을 향상시킬 수 있다.   좀더 자세한 내용은 'CAE가이드 V1'에서 확인할 수 있습니다. 상세 기사 보러 가기 
작성일 : 2024-01-06
클라우드 플랫폼, ScaleX
클라우드 플랫폼, ScaleX   주요 CAE 소프트웨어 소개   ■ 개발 및 자료 제공 : Rescale, 070-4735-8118, www.rescale.com/kr 1. Rescale 플랫폼 Rescale(리스케일)의 ScaleX(스케일엑스) 플랫폼은 Public 클라우드를 기반으로 CAE를 위하여 필요한 다양한 소프트웨어 및 하드웨어, 관리 시스템을 포함하는 플랫폼이다. 사용자들은 Rescale 플랫폼에서 AWS, Azure, GCP 등 다양한 클라우드 업체의 연산 자원들을 활용하여 각 워크로드별로 최적의 하드웨어 유형을 선택할 수 있어 시뮬레이션 소요 시간을 단축하고, 기존 On-premise에서 연산 자원의 한계로 수행하기 어려웠던 대규모 시뮬레이션을 진행할 수 있다. 아울러 Rescale ScaleX 플랫폼은 HPC 운용에 필요한 모든 항목들을 단일 플랫폼에서 제공하므로 이를 통하여 IT 자원 관리의 효율성을 향상할 수 있으며, HPC 클라우드 환경을 제공하는 것뿐만 아니라 On-premise와의 하이브리드 구성 등 기업이 보유하고 있는 기존 자원을 최대로 활용하면서 HPC 클라우드의 장점을 최대로 누릴 수 있도록 지원하고 있다. Rescale 플랫폼의 특징을 요약하면 다음과 같다. (1) 600개 이상의 어플리케이션(소프트웨어) 분류 주요 소프트웨어 Commercial Fluent, CFX, STAR-CCM+, ABAQUS, LS-DYNA, HyperWorks, MATLAB, Nastran, HFSS, CST, PowerFlow, MoldFlow, etc. Open-Source OpenFOAM, SU2, GROMACS, LAMMPS, CalculiX, Code_Aster, etc. Container Singularity Bring Your Own In-House code using MPICH, Intel MPI, Open MPI, Platform MPI Others FireFox, VS Code, PyCharm, Anaconda, BeeGFS, Intel Parallel Studio (2) 100개 이상의 코어타입(하드웨어 유형) 분류 설명 및 주요 용도 General Purpose 일반적인 사양의 유형으로 다양한 작업에 대응 가능 High Interconnect 노드간 데이터 전송속도가 빠른 유형(500코어 이상 필요한 작업) High Memory 대용량 메모리로 구성된 유형(코어당 16GB, 노드당 256GB 이상) High Clock-speed CPU 주파수가 높은 유형(적은 수라도 빠른 CPU가 필요한 작업) High Disk 대용량 스토리지로 구성된 유형(결과의 크기가 수 TB 이상인 작업) GPU GPU로 구성된 유형(머신러닝/딥러닝, GPGPU 활용 작업) (3) 관리자 포털 ■ 효율적인 플랫폼 사용을 위한 성능, 비용, 보안 대시보드 제공 ■ 팀, 프로젝트별 예산, 사용 가능 어플리케이션 및 코어타입 설정 등 개별적으로 플랫폼 최적화를 위한 설정 기능 제공 2. Rescale 플랫폼에서의 시뮬레이션 앞서 소개한 내용과 같이 Rescale 플랫폼은 HPC에서 필요한 모든 항목들이 단일 플랫폼에 구축되어 있으며 사용자의 업무 환경, 특성에 맞추어 최적화할 수 있도록 다양한 작업 유형 및 관련 기능들을 제공하며 이를 요약하면 다음과 같다. 사용자가 작업을 실행할 수 있는 방법은 총 3가지이며 각각의 특징은 다음과 같다. ■ Rescale WebUI : 가장 일반적으로 사용하는 방법으로 웹 페이지에 접속하여 입력 파일을 업로드하고, 사용할 소프트웨어 및 하드웨어 설정을 완료한 후 작업 실행 ■ Rescale CLI : 작업 실행에 필요한 항목들을 Rescale에서 프로그램으로 제작한 것으로 사용자는 이를 활용하여 WebUI에 접속하지 않고 간단한 명령어를 통하여 작업 실행 ■ Rescale API : CLI에서 수행하기 어려운 복잡한 절차의 시뮬레이션의 경우 사용자가 Python 혹은 CURL을 활용하여 스크립트로 구성하여 WebUI에 접속하지 않고 작업 실행 Rescale 플랫폼에서 제공하는 작업 유형은 총 4가지이며 각각의 특징은 다음과 같다. ■ Basic : Rescale 플랫폼에서 가장 많이 사용되는 유형으로 일반적으로 말하는 Batch 작업과 동일하게 하나의 작업을 생성해서 한 개의 시뮬레이션만 수행하거나, 순차적으로 여러 개의 시뮬레이션을 수행 가능 ■ End-To-End Desktop : 리눅스 기반의 GUI 환경을 제공하는 유형으로 시뮬레이션 진행 도중 수렴 데이터를 확인하며 필요시 진행 중인 작업을 중지하고 해석 파라미터를 변경하여 재시작하는 등 Interactive하게 시뮬레이션을 수행 가능 ■ Optimization : 파라미터 최적화 시 사용되는 유형으로 Isight, LS-OPT, 그리고 자체 개발한 Python 최적화 코드를 활용할 수 있으며, Basic 유형에서 사용 가능한 모든 시뮬레이션 소프트웨어를 Optimization 유형에서도 사용 가능 ■ DOE : 시뮬레이션을 활용한 실험계획법 수행 시 사용되는 유형으로 변수를 생성하는 방법과 그에 따른 변화를 반영하는 결과 값을 지정하고 각 케이스를 동시에 여러 개의 클러스터로 계산하여 각 인자의 영향도를 분석 가능 ■ Optimization vs DOE - Optimization은 목적 함수를 만족할 때까지 지정한 파라미터를 조정하면서 반복적으로 하나의 클러스터를 활용하여 계산을 수행 - DOE는 지정한 총 케이스들을 계산을 완료할 때까지 각 변수의 조합들을 여러 개의 클러스터를 활용하여 동시에 계산을 수행 - 예를 들어, Optimization에서 Emerald 코어 타입을 3 노드로 지정하여 클러스터를 생성하면 1개의 시뮬레이션 케이스가 108개의 코어로 계산되며, DOE에서 Emerald 코어 타입을 3 슬롯, 1 노드로 지정하여 클러스터를 생성하면 동시에 3개의 시뮬레이션 케이스가 각각 36코어로 계산됨 Rescale 플랫폼에서는 계산을 위한 작업 유형 외에도 시뮬레이션 모델의 전처리 및 후처리를 수행할 수 있는 Virtual Desktop 또한 제공하며 그 특징은 다음과 같다. ■ OS 유형은 윈도우 및 리눅스 모두를 지원하며, GPU 및 대용량 메모리로 구성된 코어 타입들을 기반으로 활용 가능 ■ 기존에 완료된 시뮬레이션 결과를 가져오거나, 가상 데스크탑 내에서 작업한 내용을 이후 계산 작업에서 사용할 수 있도록 내보내기 가능 ■ 특히, 연구소 내 인터넷 회선의 속도가 느리거나 계산된 시뮬레이션 결과 파일의 크기가 매우 클 경우(1TB 이상) Virtual Desktop 활용을 추천 ■ Virtual Desktop vs End-To-End Desktop - Virtual Desktop의 경우 시뮬레이션 데이터의 전처리 및 후처리가 주요 목적이므로 정해진 설정 값 외에 코어 수를 변경하거나 여러 개의 노드를 사용하는 것은 불가능 - End-To-End Desktop의 경우 계산이 주요 목적이며 필요 시 사용자가 interactive하게 작업을 할 수 있도록 GUI를 추가로 제공해주는 것이므로 사용자가 자유롭게 코어 수 혹은 노드 수를 조정하는 것이 가능 - 다만 시뮬레이션 모델의 검증 및 계산 부하가 적은 시뮬레이션의 경우 Virtual Desktop에서 모델 구성 후 이어서 시뮬레이션까지 진행하는 것이 효율적임 3. Rescale 플랫폼을 활용 Tip(Basic 작업 유형) ■ 기본적으로 사용 가능한 애플리케이션 실행 명령어 외에도 필요한 명령어를 추가하거나, 시뮬레이션에 사용하는 코어 수를 직접 지정하는 것이 가능하다. - 자동으로 생성되는 환경 변수로 계산에 사용할 코어 수를 지정하거나, 해당 파라미터에 직접 숫자를 입력 가능(-np 이후 항목 참조) - 애플리케이션 실행 명령어를 여러 줄로 입력하여 하나의 입력 파일에 대하여 코어 수에 따른 성능 평가를 수행하거나, 여러 개의 입력 파일을 업로드한 후 순차적으로 시뮬레이션 수행 가능 ■ ANSYS HPC Pack과 같이 코어 수에 따라서 Pack 사용량이 달라지는 경우 라이선스의 효율적인 사용을 위하여 생성한 클러스터의 모든 코어를 활용하는 것이 아닌 라이선스의 제약에 맞추도록 설정하는 것이 가능하다. 예를 들어, HPC Pack을 4개 가지고 있는 경우 Emerald 3 노드(144 코어)로 클러스터를 생성하여 시뮬레이션을 실행할 경우 12코어를 더 쓰기 위해서 Pack 1개가 추가로 사용되나, Pack이 1개 증가 시 활용 가능한 코어 수가 4배가 되는 것을 고려하면 불필요한 낭비가 되므로 하드웨어 자원을 일부 활용하지 않더라도 코어 수를 작게 지정하는 것이 필요하다. - $RESCALE_CORES_PER_SLOT을 사용하면 자동으로 활용 가능한 모든 코어 수를 시스템 변수에서 확인 후 시뮬레이션 시 사용 - 숫자를 지정하여 입력하면 해당 코어 수만큼만 시뮬레이션 시 사용 ■ Live Tailing은 시뮬레이션 진행 상황을 실시간으로 확인할 수 있는 탭으로 다음과 같은 기능이 있다. - 시뮬레이션 결과로 생성되는 텍스트 파일들(log, message, out 등)의 실시간 모니터링 - 시뮬레이션 결과로 생성되는 그림 파일들(jpg, png 등)의 확인 - 시뮬레이션 진행 도중 좌측의 Snapshot 버튼을 활용하여 현재까지 생성된 결과를 압축하여 저장한 후 Files 페이지에서 해당 파일을 다운로드 가능 ■ In-Browser terminal은 시뮬레이션이 시작되면 Live Tailing과 함께 자동으로 활성화되는 기능으로 계산이 진행 중인 노드에 원격으로 접속하여 특정 파일의 모니터링, 중간 결과의 압축 등의 작업을 수행 가능하다. - 2개 이상의 소프트웨어를 활용하여 Coupling 시뮬레이션 수행이 필요할 경우 소프트웨어 선택 창에서 필요한 소프트웨어들을 모두 선택하면 클러스터 생성 시 모두 로드되어 동시에 사용 가능 4. Rescale 플랫폼 활용 Tip(코어타입 설정) 앞서 플랫폼 소개의 내용과 같이 Rescale 플랫폼에서는 워크로드 특성에 맞추어 필요한 연산 성능을 제공할 수 있도록 다양한 코어타입들이 있으므로 사용자는 어플리케이션 및 시뮬레이션 모델의 크기에 따라 적절한 코어타입을 선택하는 것이 필요하다. STAR-CCM+의 공식 Benchmark 모델인 LeMans 104M Cells 모델로 테스트한 결과를 예시로 코어타입 설정에 대하여 설명하면 다음과 같다. 일반적으로 모델의 크기가 커질수록 계산 시 더 많은 코어 수의 활용이 불가피한데, 코어 수(노드 수)가 증가함에 따라 계산 노드간 데이터 전송이 많아져 전체 시뮬레이션 성능이 저하될 수 있어 이에 따른 영향도를 최소화하기 위하여 노드간 네트워크 속도가 빠른(100 Gbps 이상) 코어타입의 선택이 필요하다. 위 그림에서의 결과와 같이 Interconnect가 10 Gbps인 Ferrite와 Onyx같은 경우 약 400 코어 부근부터 코어 수 증가 대비 시뮬레이션 속도 향상의 폭이 크게 저하되는 것에 비하여 상대적으로 Interconnect가 빠른 Emerald, Luna(25 Gbps) 그리고 Carbon(100 Gbps)의 경우 더 많은 코어 수에서도 코어 수가 증가함에 따라 시뮬레이션 속도 또한 거의 일정한 비율로 증가하게 된다. Ferrite와 Carbon의 CPU는 Intel Xeon Platinum 8268(Skylake)2.7GHz CPU로 동일하나 Interconnect의 차이로 전체적인 계산 성능에서 차이가 나타난다. 위의 경우와 같이 Rescale의 코어타입들은 같은 CPU를 사용하는 경우에도 가상머신의 구성에 따라 노드당 코어 수, 메모리 용량, 저장장치 용량, 노드간 네트워크 속도 등이 다르므로 실제 시뮬레이션 업무에서 사용하는 모델을 활용하여 코어타입별로 성능 평가가 또한 필요한데 소프트웨어, 시뮬레이션 워크로드마다 병렬 처리 효율이 달라지기 때문이다. 추가적으로 시뮬레이션에 사용할 코어 수를 설정할 때 병렬 처리 효율과 클라우드의 과금 체계를 동시에 고려하는 것이 필요한데 가상의 시나리오를 예시로 설명하면 다음과 같다. ■ 코어 수의 증가에 따른 시뮬레이션 계산 속도 향상의 폭이 1:1에 가까울 경우 2배의 코어 수로 계산하면 시뮬레이션은 2배 빠르게 완료되나 비용을 차이가 없음 ■ 실제로는 Interconnect 속도가 200 Gbps 정도로 높더라도 코어 수(노드 수) 증가 시 1:1로 계산 속도가 향상되지 않으므로 비용 대비 성능이 가장 잘 나오는 값을 찾는 것이 필요 Rescale에서는 사용자들이 On-premise 환경에서 HPC 클라우드 환경으로 변화 시 Soft landing을 위하여 성능 평가 결과에 기반한 코어타입 추천, 시뮬레이션 워크플로우 효율성 향상을 위한 API 자동화, 기존 On-premise와의 하이브리드 구축 등 다양한 방법에 대한 가이드를 드리고 있으므로 도움이 필요하시면 info.korea@rescale.com으로 문의하기 바란다.     좀더 자세한 내용은 'CAE가이드 V1'에서 확인할 수 있습니다. 상세 기사 보러 가기 
작성일 : 2023-12-31