Announcements

IBM, AI를 위한 최초의 메인프레임 IBM z17 공개

- 대규모 언어 모델 및 생성형 AI를 포함한 엔터프라이즈급 AI 기술 탑재
- 새로운 어시스턴트 및 에이전트 기술로 차별화된 사용자 경험 제공
Apr 10, 2025

2025년 4월 10일, 서울 – IBM은 오늘 하드웨어, 소프트웨어, 시스템 운영 전반에 걸쳐 AI 기술을 탑재한 차세대 메인프레임 IBM z17을 공개했다. IBM 텔럼® II 프로세서((IBM Telum® Processor)를 기반으로 하는 IBM z17은 거래 기반 AI(transactional AI) 기능을 넘어 새로운 워크로드를 지원할 수 있도록 시스템 기능을 확장했다.

IBM Z는 대규모 AI를 재정의하고 기업이 모든 거래를 100% 실시간으로 처리할 수 있도록 설계되었다.[i] z17은 z16 대비 하루 50% 더 많은 AI 추론 작업을 처리할 수 있는 등 기업이 혁신을 추진하고 더 많은 일을 할 수 있도록 지원한다.[ii] 새로 출시된 IBM z17은 대출 리스크 완화, 챗봇 서비스 관리, 의료 이미지 분석 지원, 상거래 범죄 방지 등 250개 이상의 광범위한 AI 활용 사례로 산업 전반에 걸쳐 비즈니스 가치를 창출하도록 설계되었다.

 

IBM z17은 미국 특허청에 출원한 300개 이상의 특허를 포함한 5년간의 설계 및 개발의 결과물이다. 100여 개 이상의 고객사가 직접 제시한 의견을 반영한 것은 물론, IBM 리서치 및 소프트웨어 팀과의 긴밀한 협업을 통해 설계된 이 새로운 시스템은 다중 모델 AI 기능, 데이터 보호를 위한 새로운 보안 기능, 시스템 사용성 및 관리 개선을 위한 AI 툴을 도입했다.

 

z17은 다음과 같은 주요 특징을 가지고 있다.

 

  • 데이터에 AI 적용 - z17 AI 추론 기능은 향상된 주파수, 컴퓨팅 용량, 캐시 40% 증가, 하루에 4,500억 건 이상의 추론 작업과 1ms의 응답 시간을 지원하는 IBM 텔럼 II 프로세서에 내장된 2세대 온칩 AI 가속기에 의해 구동된다.2

 

  • AI를 위한 가속 확장 - 2025년 4분기에 PCIe 카드를 통해 출시될 예정인 IBM 스파이어™ 액셀러레이터(IBM Spyre™ Accelerator)는 텔럼® II 프로세서를 보완하는 추가적인 AI 컴퓨팅 성능을 제공한다. 이 두 제품은 다중 모델 방식의 AI를 지원하기 위한 최적화된 환경을 조성하는데 기여한다. 스파이어™ 액셀러레이터는 시스템에 포함된 엔터프라이즈 데이터를 활용해 어시스턴트를 실행하는 등 메인프레임에 생성형 AI 기능을 제공하도록 특별히 설계됐다.

 

  • AI 활용을 통한 사용자 경험 향상 - z17은 개발자와 IT 운영자의 기술과 효율성을 강화하기 위해  IBM 왓슨x 코드 어시스턴트 포 Z(IBM watsonx Code Assistant for Z)와 IBM 왓슨x 어시스턴트 포 Z(IBM watsonx Assistant for Z)를 포함한 AI 어시스턴트와 AI 에이전트를 활용할 수 있게 설계되었다. 한편, IBM 왓슨x 어시스턴트 포 Z는 실시간 시스템 데이터를 사용해 최초로 AI 채팅 기반 사고 감지 및 해결 기능을 제공하는 Z 오퍼레이션 유나이트(Operations Unite)와 통합될 예정이다.

 

한국IBM Z/리눅스원(LinuxONE) 사업총괄 류정훈 상무는 “IBM 메인프레임은 전 세계 금융 거래의 70%를 처리하고 있다[iii]”며, “최근 기업들이 AI 활용에큰 관심을 보이는 만큼, AI 성능을 크게 향상시킨 z17을 통해 보다 많은 업무를 효율적이고 안전하게 처리할 수 있도록 지원하겠다”고 말했다.

 

IBM z17은 2025년 6월 18일, IBM 스파이어 액셀러레이터는 2025년 4분기에 출시될 예정이다. 더 자세한 정보는 IBM.com/z17에서 확인할 수 있다.

 

# # #

 

[i] 주장: 2022년 IBM z16이 도입된 이후 IBM Z 메인프레임은 메인프레임에서 직접 AI 추론을 지원할 수 있게 되어 대규모 운영 환경에서도 실시간 거래를 100%라는 점수로 나타낼 수 있다. Source - Celent report: “Mitigating Fraud in The AI Age” by Neil Katkov, 04/08/2025, commissioned by IBM

[ii] 주장: 신용카드 사기 탐지 딥러닝 모델을 사용해 1ms의 응답 시간으로 하루에 최대 4500억 건의 추론 작업을 처리하는 IBM z17과 신용카드 사기 탐지 모델을 사용해 1ms의 응답 시간으로 하루에 최대 3000억 건의 추론 요청을 처리하는 IBM z16 간의 비율 차이를 의미한다. IBM z17의 경우 하루에 최대 4,500억 건의 추론 작업을 처리한다. Disclaimer - For z17 performance result is extrapolated from IBM® internal tests running on IBM Systems Hardware of machine type 9175. The benchmark was executed with 1 thread performing local inference operations using a LSTM based synthetic Credit Card Fraud Detection model (https://github.com/IBM/ai-on-z-fraud-detection) to exploit the integrated Accelerator for AI. A batch size of 160 was used. IBM Systems Hardware configuration:  1 LPAR running Red Hat® Enterprise Linux® 9.4 with 6 IFLs (SMT), 128 GB memory. 1 LPAR with 2 CPs, 4 zIIPs and 256 GB memory running IBM z/OS® 3.1 with IBM z/OS Container Extensions (zCX) feature. Results may vary. For IBM z16, performance result is extrapolated from IBM internal tests running local inference operations in an IBM z16 LPAR with 48 IFLs and 128 GB memory on Ubuntu 20.04 (SMT mode) using a synthetic credit card fraud detection model (https://github.com/IBM/ai-on-z-fraud-detection) exploiting the IBM Integrated Accelerator for AI. The benchmark was running with 8 parallel threads each pinned to the first core of a different chip. The lscpu command was used to identify the core-chip topology. A batch size of 128 inference operations was used. Results were also reproduced using a z/OS V2R4 LPAR with 24 CPs and 256GB memory on IBM z16. The same credit card fraud detection model was used. The benchmark was executed with a single thread performing inference operations. A batch size of 128 inference operations was used. Results may vary.

[iii] "Operationalizing Fraud Prevention on IBM Z," an IBM commissioned report by Celent. March 2022.

 

Release Categories

IBM Korea news

Receive the latest news about IBM by email, customized for your preferences

Subscribe now