• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "컴퓨팅"에 대한 통합 검색 내용이 3,813개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
팀뷰어, 2025년 인공지능 전망 발표… "업무 프로세스 변화부터 지속가능성까지 적극 대응이 필요"
팀뷰어가 http://www.teamviewer.com/ 2025년 인공지능(AI)의 발전 방향을 조망하는 ‘2025년 AI 전망’을 발표했다. 팀뷰어는 2025년 주요한 AI 관련 전망에 대해 ▲AI는 여전히 업무 조력자로서 확고하게 자리잡겠지만, 완전한 자동화까지는 이르지 못할 것 ▲AI의 환경적 영향이 주요 이슈로 부상할 것 ▲에지 AI를 활용해 초개인화된 사전 예방적 솔루션을 제공할 수 있을 것 ▲비즈니스 AI가 텍스트 기반에서 시각적 경험 영역으로 발전할 것 등을 꼽았다. ■ 팀뷰어는 2025년 AI는 완전한 자율적 의사결정자보다는 지능형 업무 조력자로서 널리 채택되는 양상이 두드러질 것으로 보고 있다. AI가 업무 및 의사결정 과정에 깊이 관여하겠지만 특히 비즈니스 운영에서는 사람의 감독과 개입은 여전히 필수일 것이고, 이에 따라 업계는 완전 자동화에 대한 과장된 기대에서 벗어나 사람과 AI 간의 실용적이고 협력적인 파트너십에 집중할 것이라는 전망이다. 워크플로 자동화에 있어 AI의 잠재력은 크지만, 기술적 한계와 규제로 2025년에 완전 자동화의 실현은 어려울 것으로 보인다. 이에 따라 팀뷰어는 기업에서 직원들이 AI 도구와 효과적으로 협업할 수 있는 교육 프로그램에 투자하고, 직원의 전문성과 AI의 기능이 시너지 효과를 낼 수 있는 분야에 집중해야 한다고 짚었다. ■ 2025년에는 AI의 환경 발자국, 특히 에너지 소비 측면을 조사하는 것이 중요한 전환점이 될 것으로 보인다. 주요 AI 제공업체는 아직까지 전력 소비 지표에 대해 공개적으로 언급하지 않은 채, 주로 AI의 성능과 역량에 초점을 맞추고 있다. 팀뷰어는 향후 논의의 쟁점은 AI가 환경 문제를 해결할 가능성에서 벗어나, AI 기술 자체가 발생시키는 에너지 수요를 해결하는 방향으로 진화할 것으로 보고 있다. 팀뷰어는 “기업은 AI의 비즈니스 혜택뿐만 아니라 환경적 비용까지도 고려해야 한다. 이러한 인식의 전환을 계기로 기업은 에너지 효율성을 최적화하는 AI 솔루션을 우선시해야 한다”고 전했다. 가능한 한 전력을 많이 소비하는 대규모 모델보다는 작고 효율적인 모델을 선호하는 방향으로 나아가야 한다는 것이다. 2025년의 성공은 AI의 환경적 영향을 투명하게 보고하고 이를 최소화하기 위한 명확한 전략을 수립하는 데에 달려 있다. ■ 현재 원격 연결 솔루션은 주로 문제가 발생한 이후 이를 해결하는 사후 대응적 방식이다. 반면, 2025년은 에지 컴퓨팅과 언어 모델의 융합에 힘입어 사전 예방적 솔루션으로 전환되는 중요한 해가 될 전망이다. AI 기능을 에지 기기에 직접 가져옴으로써, 기업은 세션 중 데이터를 실시간으로 처리하고 분석할 수 있게 되어 더욱 맥락에 맞는 초개인화된 경험을 제공할 수 있다. 특히 에지 AI와 세션 데이터 분석을 결합하면 단순한 문제 해결을 넘어 문제를 미리 예측하고 방지하는 솔루션으로 진화할 수 있다. 팀뷰어는 “기업은 세션 중 데이터 활용 기회를 파악하고 에지 AI 배포 전략을 수립하기 시작해야 한다. 다양한 사용자와 사용 사례의 고유 맥락을 이해하고 AI 워크로드를 지원할 수 있는 에지 컴퓨팅 인프라에 투자하는 것이 필요하다”고 조언했다. 또한, 기업은 실시간 인사이트를 활용해 예방적 기능을 구축하는 데 중점을 두는 동시에, 로컬 처리를 통해 사용자 프라이버시를 보호하는 데도 주의를 기울여야 할 것으로 보인다. ■ 현재 비즈니스 AI 애플리케이션은 주로 텍스트 기반 출력에 집중돼 있지만, 2025년에는 풍부한 시각적 AI 경험으로 큰 폭의 전환이 이뤄질 전망이다. 사용자는 텍스트 기반의 지침이나 보고서를 받는 대신 실시간 비디오 생성, 양방향 시연, 시각적 문제 해결 가이드 등 상호 대화형인 시각적 콘텐츠를 통해 AI와 상호작용할 것이다. 이런 변화는 비즈니스 환경에서 정보가 전달되고 소비되는 방식을 근본적으로 변화시킬 것으로 보인다. 팀뷰어는 “기업은 이 시각적 AI 혁명을 준비하기 시작해야 하며, 텍스트 기반 프로세스를 향상시킬 수 있는 시각적 커뮤니케이션 영역을 파악해야 한다”면서, “기업은 시각적 AI 생성을 지원하는 도구와 플랫폼에 투자하는 동시에 효과적인 시각적 콘텐츠 생성을 위한 가이드라인을 개발해야 한다”고 짚었다. 팀뷰어코리아의 이혜영 대표이사는 “한국은 디지털 전환과 AI 기술의 도입 속도가 빠른 만큼, 이러한 변화에 능동적으로 대응해야 할 필요가 있다”면서, “팀뷰어는 한국 고객이 AI를 활용해 업무 효율성과 생산성을 극대화하고 비용을 절감하며 지속가능한 비즈니스 전략을 실현할 수 있도록 적극 지원하겠다”고 전했다.
작성일 : 2024-12-19
엔비디아, 2025년 AI 핵심 인사이트 공유… "건설/엔지니어링/디자인 혁신에 AI 활용 확대 전망"
엔비디아가 2025년 AI가 가져올 각 산업 분야의 혁신에 대해 전망했다. 엔비디아의 전문가들은 멀티모달 모델이 업계의 혁신과 효율성을 가속화할 것이라고 예측했다. 생성형 AI는 올해 조직의 모든 분야에서 큰 주목을 받았다. 이에 따라 산업 전반에서 이를 활용해 혁신과 창의성을 증진하고, 고객 서비스를 개선하며, 제품 개발을 변화시키고, 의사소통을 강화하는 방법에 대한 논의가 활발히 이루어졌다. IDC에 따르면, 전 세계 기업은 내년에 AI 설루션에 3070억 달러를 지출할 것으로 예상된다. 또한, 이는 2028년까지 연평균 29.0%의 성장률로 6320억 달러까지 증가할 것으로 보인다. IDC는 AI가 2030년까지 전 세계 누적 경제에 19조 9000억 달러의 영향을 미칠 것이며, 2030년 전 세계 GDP의 3.5%를 견인할 것이라고 예측했다. 그러나 AI의 빠른 발전에도 불구하고 일부 기업과 스타트업은 여전히 실험과 사일로화된 프로젝트에 집착하며 AI 도입에 느리게 대응하고 있다. 이는 AI의 혜택이 기업, 사용 사례, 투자 수준에 따라 다르기 때문이다. 하지만 신중한 접근 방식은 낙관적인 태도로 전환되고 있다. 포레스터 리서치(Forrester Research)의 2024 AI 현황 설문조사에 참여한 응답자의 3분의 2는 조직의 AI 이니셔티브가 성공하려면 투자 수익률이 50% 미만이어야 한다고 답했다. 다음으로 주목할 만한 것은 에이전틱 AI이다. 이는 자율적이거나 ‘추론’하는 형태의 AI로, 다양한 언어 모델, 정교한 검색 증강 생성(RAG) 스택, 고급 데이터 아키텍처를 사용해야 한다.     엔비디아는 2025년 주목할 만한 AI 트렌드로 ▲효율적인 추론 설루션에 대한 수요도 증가 ▲양자 컴퓨팅의 오류 수정 및 양자 하드웨어 성능 향상 ▲AI의 창의성과 다양성 강화 ▲산업 인프라와 도시 계획의 재검토 ▲AI 에이전트의 효율을 극대화하는 AI 오케스트레이터의 증가 ▲기업의 데이터를 탐색 방식을 바꾸는 AI 쿼리 엔진 ▲기업에게 고성능 추론을 필수로 만드는 에이전틱 AI ▲데이터를 인텔리전스로 처리하기 위한 AI 팩토리 확장 등을 꼽았다. 엔비디아는 에이전틱AI(agentic AI)의 시대가 열리면서, 여러 모델로 구성된 복잡한 시스템에서 거의 즉각적인 응답에 대한 수요가 증가할 것으로 전망했다. 이에 따라 고성능 추론은 고성능 훈련 인프라만큼이나 중요해질 전망이다. 그리고 IT 리더는 실시간 의사 결정을 위한 성능을 제공하기 위해, 에이전틱 AI의 수요에 맞추어 확장 가능하고 특수 목적에 맞게 구축되고 최적화된 가속 컴퓨팅 인프라를 필요로 할 것이다. AI를 통한 건설, 엔지니어링, 디자인 혁신도 보다 활발히 진행될 전망이다. 엔비디아는 건설, 엔지니어링, 디자인 산업에 맞춤화된 생성형 AI 모델이 증가할 것이며, 이는 효율성을 높이고 혁신을 가속화할 것이라고 보았다. 건설 분야에서는 에이전틱 AI가 현장 센서와 카메라에서 수집한 방대한 양의 건설 데이터를 해석해 더 효율적인 프로젝트 일정과 예산 관리로 이어지는 인사이트를 제공한다. AI는 24시간 현실 캡처 데이터(라이다, 사진 측량, 레디언스 필드)를 평가하고 품질, 안전, 규정 준수에 대한 중요한 인사이트를 도출해 오류와 작업장 부상을 줄일 수 있다. 엔지니어의 경우, 물리 정보 신경망에 기반한 예측 물리학은 홍수 예측, 구조 엔지니어링, 건물 내 개별 방이나 층에 맞춘 공기 흐름 설루션을 위한 전산유체역학(CFD)을 가속화해 설계 반복을 단축한다. 디자인 분야에서는 RAG(검색증강생성)를 통해 건물 디자인과 시공을 위한 정보 모델링이 현지 건축법을 준수하는지 확인할 수 있다. 이는 디자인 초기 단계에서 규정을 준수할 수 있도록 한다. 확산 AI 모델은 건축가와 디자이너가 키워드 프롬프트와 대략적인 스케치를 결합해 고객 프레젠테이션을 위한 풍부하고 상세한 개념 이미지를 생성할 수 있게 해 개념 설계와 부지 계획을 가속화한다. 이로써 연구와 디자인에 집중할 수 있는 시간을 확보할 수 있다. 엔비디아는 거의 모든 산업에서 AI를 사용해 사람들의 생활과 여가를 즐기는 방식을 향상시키고 개선할 준비를 하고 있다고 보고 있다. 농업 분야에서는 AI를 사용해 식품 공급망을 최적화하고 식량 공급을 개선할 것이다. 예를 들어, AI는 개별 농장의 다양한 작물에서 발생하는 온실가스 배출량을 예측하는 데 사용될 수 있다. 이러한 분석은 공급망에서 온실가스를 줄이는데 도움이 되는 설계 전략을 수립하는 데 도움이 된다. 한편, 교육 분야의 AI 에이전트는 개인의 모국어로 말하고 특정 과목의 교육 수준에 따라 질문하거나 답변하는 등 학습 경험을 개인화할 수 있다. 엔비디아는 국가와 산업계에서 AI가 경제의 다양한 측면을 자동화해 세계 인구가 감소하는 가운데서도 현재의 생활 수준을 유지하는 방법을 모색하기 시작할 것으로 보았다. 이러한 노력은 지속 가능성과 기후 변화에도 도움이 될 수 있다. 예를 들어, 농업 산업은 밭을 관리하고 해충과 잡초를 기계적으로 제거할 수 있는 자율 로봇에 투자하기 시작할 것이다. 이는 살충제와 제초제의 필요성을 줄여 지구를 더 건강하게 유지하고, 다른 의미 있는 기여를 위한 인적 자본을 확보할 수 있다. 도시 계획 사무소에서 자율주행차를 고려하고 교통 관리를 개선하기 위한 새로운 사고 방식을 기대할 수도 있다. 장기적으로는 AI가 전 세계의 시급한 과제인 탄소 배출량 감축과 탄소 저장을 위한 설루션을 찾는 데에 도움을 줄 수 있을 것으로 보인다. 기업의 AI 팩토리(AI factory)는 원시 데이터를 비즈니스 인텔리전스로 변환한다. 2025년에는 기업이 이러한 AI 팩토리를 확장해 방대한 양의 과거, 합성 데이터를 활용할 것이다. 이를 통해 소비자 행동과 공급망 최적화부터 금융 시장의 움직임, 공장과 물류창고의 디지털 트윈에 이르기까지 모든 것에 대한 예측과 시뮬레이션을 생성할 것이다. AI 팩토리는 초기 채택자들이 미래 시나리오에 대응하는데 그치지 않고 이를 예측하고 구체화하는 데 도움이 되는 핵심 경쟁 우위로 자리 잡을 것이다.
작성일 : 2024-12-11
엑스리얼, 시네마틱 공간 디스플레이 제공하는 AR 글라스 ‘엑스리얼 원’ 출시
엑스리얼이 기술적 업그레이드를 제공하는 시네마틱 AR 글라스 ‘엑스리얼 원(XREAL One)’을 공개했다. 엑스리얼 원은 자체 개발한 공간 컴퓨팅 칩 X1을 탑재하여 물리적 스크린과 동일한 공간 디스플레이 경험이 가능하다. 2025년 출시 예정인 AI 카메라로 사진 및 비디오 촬영 그리고 AI 기능을 사용할 수 있으며, 독일 TÜV 라인란드의 눈 건강 인증을 획득해 안전성을 더했다. 엑스리얼 원은 글라스에 내장된 X1 칩을 사용해 3DoF 공간 컴퓨팅이 가능한 시네마틱 AR 글라스다. X1 공간 컴퓨팅 코프로세서를 통해 접속이 가능한 기기에 공간 디스플레이를 생성한다. X1는 광학 투과형(OST) AR 글라스용 최초의 맞춤형 칩으로, 120Hz에서 최대 3ms에 불과한 매우 짧은 M2P(Motion-to-Photon) 지연 시간을 제공해 블러 현상이나 이미지 지연 없이 부드럽고 안정적인 공간 스크린을 구현한다. 엑스리얼 원은 X1이 제공하는 M2P 지연 시간, 공간 앵커링(물리적 디스플레이와 동일하게 디스플레이를 공간에 고정하는 기능) 및 이미지 안정성을 특징으로 내세운다.     사용자는 어느 각도에서나 1080p 풀 HD에 준하는 영상을 경험할 수 있다. 엑스리얼 원은 버드베스 광학 방식 렌즈 디자인을 채택하여 50도 시야각(FoV)을 달성해 엑스리얼 에어2(XREAL Air 2) 시리즈보다 20.7% 더 넓은 디스플레이 영역을 구현한다. 또한 수평 IPD 옵션을 통해 흐릿한 부분 없이 편안함과 착용감을 경험할 수 있다. 아울러 소프트웨어 기반으로 IPD를 조절할 수 있는 기능이 포함되어 있으며, 3단계로 템플 각도를 조절할 수 있어 착용자가 자신에게 맞는 수직 IPD 설정을 찾을 수 있다. 엑스리얼 원은 120Hz의 화면 주사율과 각각 600 니트의 최대 밝기를 지원해 열악한 조명 환경에서도 이미지를 선명하고 생생하게 구현한다. 아울러 안경의 버튼을 터치해 렌즈를 어둡게 또는 밝게 조절하는 엑스리얼의 일렉트로크로믹 디밍 기능이 탑재되어 몰입감 제어가 가능하다. 또한 눈의 피로도를 감소하고 더 높은 자외선 차단이 가능함을 인정받아 2개의 새로운 TÜV 라인란드 인증을 획득했다. 엑스리얼 원은 강한 햇빛 아래에서도 디스플레이의 가장자리부분까지 선명하고 높은 해상도를 보장하고 눈의 편안함(5스타)을 인증받았으며, 로 블루라이트 및 플리커 프리에 대한 TÜV 라인란드 인증도 획득했다. 연결성과 사용성을 강화한 점도 특징이다. 엑스리얼 원은 아이폰, 안드로이드 기기, 스팀덱, 원도우 PC, 맥북 그리고 게임 콘솔 등 USB-C 포트를 통한 비디오 출력이 가능한 대부분의 기기에 연결할 수 있다. 사용자는 엑스리얼 원으로 다양한 기기에서 물리적인 디스플레이와 동일한 공간에 고정된 디스플레이를 자유롭게 사용할 수 있으며, 오른쪽 템플 아래쪽의 오렌지색 X 버튼을 누르면 팔로 모드, 앵커 디스플레이 모드 간의 전환과 메뉴 설정을 할 수 있다. 화면은 32:9 비율의 울트라 와이드 모드를 지원하며, 화면 크기, 화면 거리, 스태빌라이저, 사이드 스크린, 밝기 조절, 디스플레이 최적화, 색온도, 2D/3D 전환, IPD 조정, 볼륨 및 사운드 설정, 버튼 매핑 설정, 센서 보정, 언어 설정, 튜토리얼 및 공장 초기화 등 글라스 사용자 지정 옵션이 제공된다. 엑스리얼 원의 무게는 84그램으로, 이전 세대보다 튼튼한 마그네슘 합금 프론트 셸이 사용됐다. 교체 가능한 프론트 프레임은 사용자가 AR 글라스의 외관을 맞춤화할 수 있도록 다양한 악세서리를 제공할 예정이며, 템플 디자인은 무게 분산에 최적화되어 콧대에 가해지는 압력을 줄이고 이전 세대보다 더욱 균형 잡힌 디자인을 구현했다. AR 글라스 템플에는 근거리 및 원거리 전용 알고리즘이 적용된 4개의 마이크 레이아웃이 있어, 거리에 상관 없이 선명하게 음성을 마이크를 통하여 전달할 수 있다. 엑스리얼의 쉬츠(Chi Xu) CEO는 “이제 AR 글라스의 공간 화면은 하루 종일 실제 모니터를 대체할 수 있는 시점에 도달했다”면서, “3년이 넘는 첨단 연구 개발을 통해 개발된 X1 칩을 통해 사용자는 가볍고 휴대 가능한 시네마틱 가상화면을 일상에서 만나볼 수 있게 되었으며, 이는 엑스리얼이 항상 상상해 오고 전 세계 고객이 가장 기다려온 공간 컴퓨팅 기술의 정점”이라고 말했다. 엑스리얼 원은 네이버 스마트 스토어와 엑스리얼 코리아 공식 판매처를 통해 예약 구매가 가능하며, 예약 구매 기간은 2025년 1월 12일까지다. 글라스 단독 구매시 가격은 68만원이며, 예약구매 기간에 글라스 및 엑스리얼 허브 추가 구매시 2만 5천원 할인이 적용된다. 기존 엑스리얼 글라스 시리즈 구매자는 3만원의 추가 할인이 적용된다.
작성일 : 2024-12-11
IBM, 생성형 AI 시대를 위한 새로운 광학 기술 발표
IBM은 데이터센터에서 생성형 AI 모델의 학습 및 실행 방식을 획기적으로 개선할 수 있는 차세대 광학 기술을 발표했다. 이는 기존의 전선 기반 단거리 통신을 보완하는 새로운 공동 패키지형 광학(co-packaged optics : CPO) 기술로, 데이터센터 내부 연결 속도를 대폭 향상시킬 수 있는 새로운 공정이다. 특히 IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(Polymer Optical Waveguide : PWG)을 성공적으로 설계, 조립해 최초로 공개했다. IBM 연구진은 CPO 기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.  광섬유 기술은 전기 대신 빛으로 장거리 데이터 전송을 빠르게 처리하기 때문에, 현재 전 세계 상업 및 통신 트래픽 대부분에 사용되고 있다. 그러나 데이터센터의 경우, 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 이 전선은 대규모 분산 학습 과정에서 다른 장치의 데이터를 기다리느라 절반 이상의 시간을 유휴 상태로 보내는 GPU 가속기들을 연결하고 있는데 이로 인해 상당한 비용과 에너지가 소모된다. IBM 연구진은 광학 속도와 처리 능력을 데이터센터 내부로 도입할 방법을 제시했다. IBM은 새롭게 발표된 논문을 통해, 고속 광학 연결을 가능하게 하는 새로운 CPO 모듈의 시제품을 소개했다. 이 기술은 데이터센터 통신의 대역폭을 확장하고, GPU의 유휴 시간을 줄이며, AI 처리 속도를 향상시킬 수 있다.   ▲ IBM 리서치의 광학 모듈 시제품   IBM은 이번 연구 혁신을 통해 중급 전기 배선(interconnect) 대비 전력 소비를 5배 이상 줄임으로써 생성형 AI 확장 비용을 낮추고, 데이터센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있을 것으로 보고 있다. 또한, CPO 기술을 통해 기존 전기 배선(wiring)을 사용할 때보다 대규모 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다고 보았다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상의 폭이 더욱 커진다는 것이다. 이외에도 IBM은 AI 모델 학습 시 모델 당 미국 가정 약 5000가구의 연간 전력 소비량에 해당하는 에너지를 절감함으로써, 데이터센터 에너지 효율을 높일 수 있을 것으로 전망했다.   IBM 리서치 연구 개발 총책임자인 다리오 길(Dario Gil) 수석 부회장은 “생성형 AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터센터는 진화해야 한다. 공동 패키지형 광학(CPO) 기술은 데이터센터를 미래에 대비하도록 만들 수 있다”면서, “이 획기적인 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것이며, 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 말했다.
작성일 : 2024-12-10
마이크로소프트, 2025년 주목해야 할 6가지 AI 트렌드 공개
마이크로소프트가 2025년 주목해야 할 AI 트렌드 6가지를 공개하면서, AI가 이끌어갈 혁신과 과제에 대한 주요 인사이트를 제시했다.  2024년은 전 세계 조직이 AI를 본격 도입하기 시작한 해로 평가된다. 마이크로소프트의 의뢰로 진행된 IDC 2024 AI 보고서에 따르면, 전 세계 조직의 AI 도입률은 지난해 55%에서 올해 75%로 증가했다. 이는 AI가 실험 단계를 넘어, 실제 비즈니스에서 가치를 창출하는 핵심 도구로 자리잡았음을 보여준다. 마이크로소프트는 이러한 변화에 따라 2025년이 AI가 일상과 업무에서 필수적인 기술로 자리 잡는 전환점이 될 것으로 전망하고 있다. AI는 높은 자율성을 기반으로 복잡한 문제를 해결하고, 업무 효율성을 크게 높이며 일상을 단순화할 것으로 기대된다. 나아가 과학, 의료 등 인류가 직면한 주요 과제 해결에도 적극적으로 활용될 것으로 내다보고 있다. 특히, 이러한 흐름은 AI의 논리적 사고와 데이터 처리 능력의 고도화를 통해 더욱 가속화될 것으로 예상된다. 마이크로소프트는 이러한 변화를 지원하기 위해 안전하고 신뢰할 수 있는 AI 기술 개발에 집중하고 있으며, 이를 사용자들이 안심하고 활용할 수 있도록 지원할 계획이다.  마이크로소프트의 크리스 영(Chris Young) 사업개발·전략·투자 담당 부사장은 “AI는 불가능해 보였던 많은 것을 가능하게 하고 있으며, 지난 한 해 동안 많은 조직이 실험 단계를 넘어 실질적인 도입 단계로 진입했다”고 말했다. 이어 그는 "AI 기술은 우리 삶의 모든 영역에 전면적인 변화를 가져올 전환점에 서 있다"고 강조했다.      마이크로소프트가 제시한 2025년 6가지 주요 AI 트렌드는 ▲더 유용하고 유능해질 AI 모델 ▲업무 형태를 변화시킬 AI 에이전트의 활약 기대 ▲모든 일상을 지원하는 AI 역할 확장 ▲지속 가능한 AI 인프라 구축 필요성 증대 ▲테스트와 맞춤화를 통한 책임 있는 AI 구축 ▲과학적 혁신을 가속화하는 AI 등이다. 첫 번째, AI 모델은 더 많은 일을 더 잘 수행할 것이다. 이 AI 모델들은 과학, 코딩, 수학, 법률 및 의학 등 여러 분야에서 혁신을 주도하며, 문서 작성부터 코딩 같은 복잡한 업무에 이르기까지 폭 넓은 업무를 수행할 수 있는 능력을 갖추게 될 것으로 보인다. 특히 AI의 추론 능력도 향상될 전망이다. 고급 추론 AI 모델인 오픈AI o1은 인간이 생각하는 방식과 유사한 논리적 과정을 거쳐 복잡한 문제를 단계적으로 해결하는 데 뛰어난 성능을 입증했다. 데이터 선별과 후속 학습도 AI 모델 발전에서 핵심적인 역할을 하게 된다. 마이크로소프트의 소형언어모델 파이(Phi)는 고품질 데이터를 활용해 모델 성능과 추론 능력을 효과적으로 개선할 수 있음을 보여줬다. 또한, 오르카(Orca) 및 오르카2(Orca 2) 모델은 합성 데이터를 활용한 학습으로 대규모 언어 모델에 준하는 성능을 구현하며 새로운 가능성을 열었다. 두 번째, 개인화된 차세대 AI 에이전트는 반복적이고 일상적인 업무를 자동화하는 데에서 나아가, 복잡하고 전문적인 작업까지 수행하며 조직의 업무 환경과 프로세스를 근본적으로 변화시킬 것으로 기대된다. AI 에이전트는 메모리, 추론, 멀티모달 기술의 발전을 통해 더욱 정교하게 작업을 처리할 수 있다. 예를 들어 조직의 재고 공급에 문제가 발생하면 AI 에이전트가 이를 관리자에게 알리고, 적합한 공급 업체를 추천하거나 직접 주문을 실행해 업무가 중단 없이 진행될 수 있도록 돕는다. 또한, 누구나 AI 에이전트를 설계하고 개발할 수 있는 환경도 마련된다. 마이크로소프트의 코파일럿 스튜디오(Copilot Studio)는 코딩 없이도 AI 에이전트를 개발할 수 있으며, 애저 AI 파운드리(Azure AI Foundry)는 복잡한 프로세스를 처리할 수 있는 고급 AI 에이전트 설계를 지원한다. 이러한 변화는 단순히 사용자와 협력하며 응답하는 프롬프트 기반 AI 에이전트에서, 독립적으로 업무를 수행하고 프로세스를 조율하는 완전 자율형 AI 에이전트까지 다양화될 것으로 예상된다. 세 번째, AI가 일상생활에서 차지하는 역할의 확장이다. 마이크로소프트 코파일럿(Microsoft Copilot)은 AI 동반자로서, 사용자가 하루 일과를 우선 순위에 따라 시간을 효율적으로 관리할 수 있도록 돕는다. 또한, 개인 정보와 데이터 보안을 강화해 보다 안전한 환경에서 AI를 사용할 수 있도록 설계됐다. 사용자는 일상에서 코파일럿을 더욱 밀접하게 활용할 수 있다. 예를 들어, 사용자는 하루를 시작하며 코파일럿 데일리(Copilot Daily)의 음성을 통해 최신 뉴스와 날씨 정보를 확인할 수 있다. 또한, 코파일럿 비전(Copilot Vision)은 사용자가 접속한 웹페이지를 분석해 관련 질문에 답하거나 다음 단계를 제안하는 등 보다 직관적인 상호작용을 지원한다. 코파일럿은 의사결정 과정에서도 유용하게 활용된다. 예를 들어, 새 아파트 인테리어를 위해 어울리는 가구를 추천하고, 효율적인 배치 방안을 제시해 사용자의 공간을 더 편리하고 실용적으로 꾸밀 수 있도록 돕는다. 이는 시작 단계이며, 앞으로 AI는 정서 지능의 고도화를 통해 보다 유연하고 자연스러운 상호작용을 제공할 전망이다. 네 번째, 에너지 자원 효율화를 통한 지속 가능한 AI 인프라 구축에 대한 노력이다. 실제로 전 세계 데이터 센터 처리량은 2010년부터 2020년까지 약 9배 증가했음에도 전력 소비량은 단 10% 증가에 그쳤다. 이는 마이크로소프트가 AMD, 인텔, 엔비디아 등과 협력해 반도체 칩 애저 마이아(Azure Maia)와 코발트(Cobalt), 그리고 대규모 AI 시스템 냉각을 위한 액체 냉각 열교환기 기술을 통해 하드웨어의 에너지 효율을 높인 결과다. 향후 몇 년 내에는 냉각에 물을 전혀 사용하지 않는 워터-프리 데이터센터가 도입될 예정이다. 동시에 초고효율 액체 냉각 기술인 콜드 플레이트(Cold plates)의 사용도 확대된다. 이러한 기술들은 지속 가능한 AI 인프라 조성을 위한 노력의 핵심이다. 이와 함께 마이크로소프트는 저탄소 건축 자재를 도입해 데이터센터 설계를 친환경적으로 혁신하고 있다. 탄소 배출이 거의 없는 철강, 콘크리트 대체 소재, 교차 적층 목재 등이 대표적인 예다. 이와 함께 풍력, 지열, 원자력 및 태양광 등 무탄소 에너지원에도 적극 투자하며, 2030년까지 탄소 네거티브, 워터 포지티브, 제로 웨이스트 목표를 달성하기 위한 장기적인 비전을 실행하고 있다. 다섯 번째, AI의 위험을 측정하고 평가하는 기준의 강화다. 2025년에는 책임 있는 AI를 구현하기 위해 ‘테스트’와 ‘맞춤화’에 대한 기준이 높아질 것으로 예상된다. 포괄적인 테스트 체계는 외부의 정교한 위협을 탐지하고, AI가 생성하는 부정확한 응답(환각)과 같은 내부 문제를 해결하는 데에 효과적이다. 마이크로소프트는 AI 모델이 직면할 수 있는 위협을 정밀하게 분석하고 개선하는 과정을 지속하며, 더욱 안전한 AI 환경 구축을 목표로 하고 있다. 특히 모델의 안전성이 높아질수록 테스트와 측정 기준도 더욱 정교해지고 있다. ‘맞춤화’와 ‘제어’는 미래 AI 응용 프로그램의 핵심으로 자리 잡을 것으로 보인다. 조직은 콘텐츠 필터링과 작업에 적합한 가드레일 설정 등 AI 활용 방식을 자유롭게 조정할 수 있다. 예를 들어, 게임사는 직원이 볼 수 있는 폭력 콘텐츠의 종류를 제한할 수 있다. 마이크로소프트 365 코파일럿은 업무 환경에 적합한 콘텐츠를 설정할 수 있는 맞춤형 제어 기능을 제공한다. 여섯 번째, AI가 과학 연구에 미치는 영향력 확대다. 이미 AI는 슈퍼컴퓨팅과 일기 예보 같은 분야의 연구 속도를 가속화하고 있으며, 앞으로는 자연 과학, 지속 가능한 소재 개발, 신약 연구 및 건강 분야에서 중요한 역할을 할 것으로 예상된다. 2024년, 마이크로소프트 리서치(MSR)는 생체 분자 과학 문제를 해결할 생체분자 역학 시뮬레이션(simulate biomolecular dynamics)을 개발했다. AI2BMD(AI-driven Biomolecular Dynamics)로 불리는 이 시스템은 단백질 설계, 효소 공학, 신약 개발 등의 분야에서 전례 없는 속도와 정밀도로 문제를 해결하며 생물 의학 연구에 새로운 가능성을 열었다. 2025년에는 AI가 지속 가능한 소재 설계와 신약 개발 같은 인류의 공동 과제 해결에 중요한 역할을 할 것으로 보인다. 이를 통해 과학 기관과 연구자들은 AI를 통해 연구 효율을 높이고, 지금까지 불가능했던 새로운 돌파구를 마련할 것으로 기대를 모으고 있다.
작성일 : 2024-12-09
레노버-아이크래프트, HPC/AI 파트너십 맺고 국내 수냉식 서버 시장 공략 강화
레노버 글로벌 테크놀로지 코리아(ISG)가 AI 서비스 공급사 아이크래프트와 고성능 컴퓨팅(HPC) 및 AI 시장 공략 강화를 위한 파트너십을 체결했다고 밝혔다. 레노버는 “HPC/AI 시장 공략 강화를 위해 아이크래프트를 전문 협력사로 선정했다”면서, “이번 파트너십은 고성능 컴퓨팅(HPC) 기술 발전과 산업 혁신에 있어서 중요한 이정표가 될 전망이며, 특히 레노버의 액체 냉각 기술이 탑재된 신규 씽크시스템(ThinkSystem) 제품의 수냉식 서버 시장 공략에 박차를 가할 것으로 기대된다”고 밝혔다. 아이크래프트는 풀스택 AI 전문업체로서 엔터프라이즈용 AI 및 머신러닝(ML) 서비스 구축을 위한 서버, 스토리지, 네트워크의 도입부터 컨설팅, 시스템 검증 및 운영 관리 지원까지 맞춤형 서비스를 원스톱으로 제공한다. 비즈니스 혁신을 위한 AI 인프라 구축을 희망하는 기업에게 모든 단계에 대한 기술 지원 서비스를 공급하고 있다. 아이크래프트와의 협력을 바탕으로 레노버는 엔비디아의 GPU 및 슈퍼칩을 지원하는 첨단 고성능 컴퓨팅 및 AI 서버인 씽크시스템 제품군의 국내 시장 공략을 가속화할 예정이다. 특히 ‘씽크시스템 SR780a V3’는 고밀도 HPC/AI 워크로드를 처리하는 수냉식 GPU 서버로, 8개의 엔비디아 GPU 및 NV링크(NVLink) 고속 인터커넥트를 지원한다. 레노버의 6세대 넵튠(Neptune) 액체 냉각 기술에 기반해 최대 95%의 열을 제거하는 등 에너지 효율과 계산 성능을 강화한 것이 특징이다. 최근 출시된 ‘씽크시스템 SC777 V4 넵튠’은 100% 직접 온수 냉각 방식에 기반해 컴퓨팅 성능과 에너지 효율을 높인 최첨단 수냉식 서버로, 엔비디아의 GB200 그레이스 블랙웰(Grace Blackwell) 슈퍼칩을 지원한다. 고성능 가속 네트워킹을 위한 차세대 엔비디아 플랫폼 ‘퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand)’, ‘스펙트럼-X800 이더넷(Spectrum-X800 Ethernet)’ 및 ‘엔비디아 AI 엔터프라이즈’를 지원해 생성형 AI, 컴퓨터 비전, 음성 AI 등 실무급 AI 설루션의 개발 및 배포를 간소화한다. 레노버 글로벌 테크놀로지 코리아(ISG)의 윤석준 부사장은 “세계 1위의 슈퍼컴퓨팅 및 HPC 설루션 제공업체로서 레노버는 아이크래프트와 함께 국내 HPC/AI 시장 공략을 확대할 수 있게 되어 기쁘다”면서, “이번 협업을 통해 양사의 강점을 결합한 혁신적이고 에너지 효율적인 설루션을 제공할 수 있게 되었다. 레노버가 10년 이상 선도해 온 넵튠 수냉 기술이 탑재된 레노버의 씽크시스템 제품군이 국내 지속가능한HPC 시장 성장을 가속화하는 데 핵심적인 역할을 할 것”이라고 말했다.  아이크래프트의 권영로 부사장은 “레노버와의 협업을 통해 보다 스마트하고 접근 가능한 AI 서비스 및 IT 인프라를 제공할 수 있게 될 것을 기대한다”면서, “양사의 기술 및 노하우 공유를 토대로 수냉식 AI 서버의 새로운 지평을 열게 될 것”이라고 밝혔다.
작성일 : 2024-12-09
엔비디아, AWS에 엔비디아 NIM 제공 확대해 AI 추론 향상 지원
엔비디아가 아마존웹서비스(AWS)의 AI 서비스 전반에 자사의 NIM 마이크로서비스를 확장한다고 발표하면서, 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다고 전했다. 12월 4일 열린 ‘리인벤트(re:Invent)’ 연례 콘퍼런스에서 AWS는 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다.  엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자가 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.     엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다. 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다. NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud : EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service : EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다. 개발자는 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타의 라마 3(Llama 3), 미스트랄 AI의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다. 엔비디아는 다양한 산업 분야의 고객과 파트너가 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다고 소개했다. 개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.
작성일 : 2024-12-06
델 테크놀로지스, “2025년 AI가 테크 빅뱅 가져올 것”
델 테크놀로지스가 2025년 기술 트렌드 전망을 발표하면서, 2025년에는 AI가 일상 생활과 업무 환경, 여가에 이르는 모든 영역에 핵심 기술로 자리 잡으며 미래를 재정의할 전망이라고 밝혔다. 델이 발표한 2025년 IT 기술 전망의 주요 내용은 ▲에이전틱 AI 아키텍처의 부상 ▲엔터프라이즈 AI가 개념 단계에서 실무 환경으로 확대 ▲소버린(sovereign) AI의 가속화 ▲AI와 신흥 기술의 융합 ▲AI 데이터센터를 위한 초고속 분산형 아키텍처 ▲AI PC가 분산 아키텍처의 중요한 역할 담당 ▲지속가능한 데이터센터로 비용 및 환경 문제 해결 노력 등이다. 델은 에이전틱 AI 아키텍처가 인간과 AI의 상호작용에 새로운 장을 열 것으로 전망된다. 상당수의 생성형 AI 도구가 AI 에이전트로서 기능하도록 진화하고 있으며, 사람이 AI 시스템과 소통하는 방식을 혁신적으로 변화시킨다는 것이다. 델 테크놀로지스의 최고 AI 책임자인 존 로즈(John Roese) 글로벌 CTO는 2025년에는 보다 발전된 형태의 에이전트가 등장할 것으로 전망했다. 그는 “자율적으로 작동하고, 자연어로 소통하며, 다른 에이전트 및 사람과 팀을 이루어 작업하는 등 상호 작용이 강화된 형태의 에이전트가 부상할 것”이라는 전망과 함께 “코딩, 코드 검토, 인프라 관리, 비즈니스 계획 및 사이버 보안과 같은 특정 기술을 수행하도록 AI가 세밀하게 조정되고 최적화될 것”이라고 내다봤다.     엔터프라이즈 AI는 기업이나 공공기관의 기관의 생산력 향상을 위해 가장 중요한 영역에서 가장 영향력 있는 프로세스에 AI 기술을 적용하는 것을 의미한다. 2025년에는 우선 순위를 중심으로 반복 가능한 명확한 접근 방식을 취하고, 턴키 형태로 정교하게 정의된 AI 플랫폼 및 AI 인프라 옵션이 등장함으로써, 엔터프라이즈 영역에 AI를 적용하는 과정이 더 간편해질 전망이다. 이를 실행하기 위해서는 상용화되어 있는 다양한 도구들을 선택할 수 있다. 델은 기업이 앞으로 더 선호하는 경로는 프라이빗 인프라에서 AI 도구를 구매하여 구현하는 방식일 것이라고 보고 있으며, 데이터 메시(data meshes)와 같은 데이터 현대화 툴을 구매하고 ‘델 AI 팩토리(Dell AI Factory)’와 같은 인프라 설루션으로 도입 및 구축을 간소화할 수 있다고 전했다. 소버린 AI란, 국가가 자체 인프라와 데이터를 사용하여 AI 가치와 차별화를 창출하고 현지의 문화, 언어 및 지적 재산에 부합하는 생태계를 설계하는 능력을 뜻한다. 일부 국가에서는 정부 전용 AI 시스템 대신 정부와 지역 민간 산업 모두를 지원하기 위해 컴퓨팅 파워와 데이터 용량에 대한 액세스를 제공하는 국가 AI 리소스를 개발하고 있다. 한편으로는 정부가 새로운 인프라를 구축하는 대신 민간 업계가 AI 생태계를 현대화하고 선도할 수 있도록 선제적으로 협력하여 공동 설계하고 장려하는 전략을 시도하는 국가도 있다. 델은 “소버린 AI를 위해 인프라, 데이터 관리, 인재 양성, 생태계 개발을 위한 투자가 증가하고 있으며, 이러한 추세는 앞으로도 계속될 것”이라고 밝혔다. AI가 양자 컴퓨팅, 지능형 에지, 제로 트러스트 보안, 6G 기술, 디지털 트윈 등과 결합하면 전통적인 컴퓨팅의 한계를 극복함으로써 그 영향력이 더욱 커지며, 다양한 영역에서 혁신과 기존 과제의 해결을 위한 역동적인 환경을 조성한다. 델은 2026년 말에는 데이터센터 수요의 절반 이상이 AI 워크로드에서 발생하면서, AI 도입이 새로운 차원에 도달할 것으로 예상했다. AI의 빠른 도입과 함께 학습에서 추론으로의 전환도 이루어지고 있다. 학습과 달리 추론은 워크로드를 실행할 위치를 품질, 비용, 데이터, 보안 및 지연 시간에 따라 최적화하는 데 중점을 둔다. 이러한 변화와 함께 AI는 컴퓨팅, 스토리지 및 네트워크를 각각 독립적으로 확장할 수 있는 초고속 분산형 아키텍처로 이동하고 있다. 이를 통해 기업과 기관에서는 비용을 절감하고, 사일로(silo)를 해소하며, 공급업체 종속을 방지할 수 있다. 2025년에는 데이터가 점점 더 분산되어 이로 인해 기업이 데이터에 맞춰 AI를 적용하는 위치도 변화할 전망이다. 데이터센터와 클라우드를 넘어 에지와 PC로 이동함에 따라, AI PC를 사용하면 데이터를 디바이스에서 직접 처리하여 클라우드에 의존하는 것보다 더 빠르고 비용 효율적이며 안전하게 처리할 수 있다. NPU(신경망 처리장치)가 탑재된 PC의 AI 도구와 애플리케이션은 모든 일상 업무를 지원하며 사용자와 함께 진화하여 요구를 예측하고 생산성을 높여준다. 델은 고성능의 CPU, GPU, NPU와 다양한 PC 실리콘 옵션이 등장하며 선택과 혁신의 폭이 그 어느 때보다 넓어질 것으로 전망했다. 에너지 비용의 상승과 특정 AI 워크로드의 에너지 수요 및 환경에 미치는 영향은 중대한 과제이다. 전 세계적으로 규제 요건이 더욱 엄격해지면서 새로운 수준의 요건이 등장하고 있다. 데이터센터의 경우 하드웨어 차원의 에너지 효율 혁신, 오래되거나 노후화된 장비의 책임 있는 폐기, 다양한 에너지원 사용을 통해 환경 영향을 최소화하고 수익을 극대화하는 노력이 요구된다. 대표적인 사례로는 액체 냉각 혁신이다. 최적화된 냉각판과 누출 감지 기술을 통해 안정성과 효율성을 높일 수 있다. 더 나은 효율성과 성능 최적화를 위한 워크로드 관리 및 모니터링 도구도 필수이다. 이러한 데이터를 분석하면 조직이 원하는 성능에 맞게 AI 설루션의 규모를 조정하고 요구 사항을 효과적으로 충족할 수 있다. 한국 델 테크놀로지스의 김경진 총괄사장은 “빅뱅이 은하와 별, 행성의 발전의 발판을 마련한 것처럼, AI의 급속한 성장은 새로운 기회와 산업, 생활과 업무 방식을 만들어내고 있다”고 말하며, “앞으로는 AI의 힘을 얼마나 활용할 수 있는지에 따라 경쟁력이 좌우될 것이며, 최신 정보와 적응 역량을 확보하는 것이 중요한 이유도 여기에 있다. 델 테크놀로지스는 고객이 AI 활용성에 우선순위를 두고 투자 효과를 극대화할 수 있도록 전폭적인 지원을 아끼지 않을 계획”이라고 말했다.
작성일 : 2024-12-05
AWS, 딥러닝 및 생성형 AI를 위한 트레이니움2 인스턴스 출시
아마존웹서비스(AWS)는 ‘AWS 리인벤트’ 행사에서 AWS 트레이니움2(AWS Trainium2) 칩 기반의 아마존 EC2(Amazon EC2) 인스턴스를 공식 출시했다고 발표했다. 또한, AWS는 대규모 언어 모델(LLM) 및 파운데이션 모델(FM)의 학습과 추론을 지원하는 트레이니움2 울트라서버(Trn2 UltraServers)와 차세대 트레이니움3(Trainium3) 칩도 함께 공개했다. Trn2 인스턴스는 16개의 트레이니움2 칩을 탑재하여 최대 20.8 페타플롭스(PF)의 연산 성능을 제공한다. 이는 수십억 개의 매개변수를 가진 LLM의 학습 및 배포에 적합하다. Trn2 인스턴스는 동일한 비용으로 기존 GPU 기반 EC2 P5e 및 P5en 인스턴스 대비 30~40% 더 나은 가격 대비 성능을 제공하며, 메모리 대역폭도 개선되어 비용 효율성이 높다는 것이 AWS의 설명이다. Trn2 울트라서버는 새로운 EC2 제품군으로, 초고속 뉴런링크(NeuronLink) 기술을 사용해 64개의 트레이니움2 칩을 연결하여 최대 83.2 피크 페타플롭스의 연산 성능을 제공한다. 이는 단일 Trn2 인스턴스 대비 연산, 메모리, 네트워킹 성능을 각각 4배로 확장해 대규모의 모델 학습과 배포를 가능하게 한다. Trn2 인스턴스는 현재 미국 동부(오하이오) AWS 리전에서 사용 가능하며, 추가 리전에서도 곧 제공될 예정이다. Trn2 울트라서버는 현재 프리뷰 상태로 제공되고 있다. 한편, AWS는 앤스로픽(Anthropic)과 협력해 수십만 개의 트레이니움2 칩을 포함하는 EC2 울트라클러스터(UltraClusters)를 구축하고 있다고 밝혔다. 이 프로젝트는 ‘프로젝트 레이니어(Project Rainier)’로 명명되었으며, 현재 세대의 최첨단 AI 모델 훈련에 사용된 엑사플롭스의 5배 이상의 성능을 갖출 것으로 기대된다. 이외에도 AWS는 차세대 AI 학습 칩인 트레이니움3를 공개했다. 트레이니움3는 트레이니움2 대비 최대 2배 성능과 40% 개선된 에너지 효율성을 제공하며, 이를 통해 고객은 더 큰 모델을 더 빠르게 구축하고 실시간 성능을 극대화할 수 있다. AWS의 데이비드 브라운(David Brown) 컴퓨팅 및 네트워킹 부문 부사장은 “트레이니움2는 AWS가 개발한 칩 중 가장 강력한 성능을 자랑하며, 대규모 및 최첨단 생성형 AI 워크로드를 지원하기 위해 설계되었다. 이 칩은 학습과 추론 모두에서 최고의 가격 대비 성능을 제공한다”면서, “매개변수가 수조 개에 달하는 모델이 등장하면서, 고객들에게 대규모 모델을 효율적으로 학습하고 운영할 수 있는 새로운 접근 방식이 필요해졌다. Trn2 울트라서버는 AWS에서 가장 빠른 학습 및 추론 성능을 제공하며, 모든 규모의 조직이 세계 최대 모델을 더 빠르고 비용 효율적으로 학습하고 배포할 수 있도록 돕는다”고 전했다.
작성일 : 2024-12-04
인텔, 고성능과 게이밍 기능 앞세운 아크 B-시리즈 그래픽 카드 출시
인텔은 인텔 아크 B-시리즈(Intel Arc B-Series) 그래픽 카드 신제품(코드명 배틀메이지)를 발표했다. 인텔 아크 B580 및 B570 GPU는 대다수의 게이머가 접근 가능한 가격대에서 동급 최고 수준의 성능과 최신 게이밍 기능을 제공하는 데에 초점을 맞추었으며, AI 워크로드를 가속화할 수 있도록 설계되었다. 인텔 Xe 매트릭스 익스텐션(XMX) AI 엔진이 포함되어 성능, 시각적 유동성 및 응답성을 향상시키는 3개 기술로 구성된 최신 XeSS 2를 지원한다. 인텔 아크-B시리즈 GPU는 인텔의 최신 Xe2 아키텍처를 사용하며, 향상된 효율성과 더 높은 코어당 성능을 제공하고 소프트웨어 오버헤드를 줄이도록 최적화되었다. 2세대 Xe-코어는 최신 워크로드에 필요한 견고한 컴퓨팅 성능을 제공하며 고성능 XMX AI 엔진을 포함하고 있다. 새로운 Xe-코어는 더 뛰어난 성능의 레이 트레이싱 유닛, 향상된 메시 셰이딩 성능, 향상된 주요 그래픽 기능 지원을 통해 최신 게임 엔진의 성능 효율성을 향상시켜 준다.     XeSS 2는 ‘XeSS 초해상도(XeSS Super Resolution)’, ‘XeSS 프레임 생성(XeSS Frame Generation)’, ‘Xe 저지연(Xe Low Latency)’의 세 가지 기술로 구성되었다. XeSS 초해상도는 지난 2년간 AI 기반 업스케일링을 제공해왔고, 현재 150개 이상의 게임을 지원하는 1세대 XeSS의 기반이 된 핵심 기술이다. 새로운 AI 기반 XeSS 프레임 생성은 광학 플로 및 모션 벡터 리프로젝션을 사용하여 보간(interpolated) 프레임을 추가해 더욱 유동적인 게이밍을 제공한다. 또한 새로운 Xe 저지연 기술은 게임 엔진과 통합되어 게이머의 입력에 더 빠르게 반응한다. 세 가지 기술이 모두 활성화된 XeSS 2는 초당 프레임(fps)을 최대 3.9배 이상 끌어올려 까다로운 AAA급 게임에서도 고성능을 제공할 수 있다는 것이 인텔의 설명이다. 새로운 인텔 아크-B 시리즈 GPU는 이전 세대 대비 Xe 코어당 성능은 70%, 와트당 성능은 50% 향상되었다. B580 GPU는 인텔 아크 A750 GPU와 비교시 1440p에서 평균 24% 더 빠르고 일부 게임에서는 최대 78% 더 빠른 속도를 보였다. 인텔은 “경쟁 제품과 비교 시 인텔 아크 B580 GPU가 가격 대비 최대 32%더 높은 성능을 제공한다”고 주장했다. 인텔 아크 B580은 12GB 전용 GPU 메모리를, 인텔 아크 B570은 10GB 전용 GPU 메모리를 탑재했으며, 게이머들은 AI 기반 XeSS 2 기술을 통해 1440p 초고화질 설정에서 고성능 게임을 기대할 수 있다. 한편, 새로운 인텔 그래픽 소프트웨어는 색상 및 스케일링 모드와 가변 주사율(VRR) 지원을 포함한 디스플레이 설정에 접근할 수 있게 하며, 프레임 제한 및 드라이버 수준의 저지연 모드를 포함한 3D 그래픽 설정도 제공한다. 성능 제어 기능으로는 기본 및 고급 오버클럭 설정과, 프레임 생성 및 지연 측정을 지원하는 오픈소스 프레젠트몬(PresentMon) 기반의 메트릭스 기능이 포함되며, 프레임 생성 및 지연 시간 측정도 지원된다. 인텔은 아크 B580 한정판 그래픽 카드 및 에이서, 애즈락, GUNNIR, 오닉스, 맥스썬, 스파클의 보드 파트너 모델이 12월 13일부터 구매 가능하다고 밝혔다. 시작 가격은 249 달러이다. 인텔 아크 B570 그래픽 카드는 2025년 1월 16일 219 달러부터 구매 가능하다. 인텔의 비비안 리엔(Vivian Lien) 클라이언트 그래픽 부문 총괄 매니저는 “새로운 인텔 아크 B-시리즈 GPU는 게이머를 위한 업그레이드 제품이다. 이 제품은 XeSS 2, 2세대 레이 트레이싱 엔진, XMX AI 엔진을 통한 뛰어난 1440p 게이밍 경험과 최고의 가격 대비 성능을 제공한다”고 전했다.
작성일 : 2024-12-04