Announcements
IBM, 생성형 AI 시대를 위한 새로운 광학 기술 발표
2024년 12월 10일, 서울 – IBM은 오늘 데이터센터에서 생성형 AI 모델의 학습 및 실행 방식을 획기적으로 개선할 수 있는 차세대 광학 기술을 발표했다. 이는 기존의 전선 기반 단거리 통신을 보완하는 새로운 공동 패키지형 광학(co-packaged optics : 이하 CPO) 기술로, 데이터센터 내부 연결 속도를 빛의 속도로 대폭 향상시킬 수 있는 새로운 공정이다. 특히 IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(Polymer Optical Waveguide, PWG)을 성공적으로 설계, 조립해 최초로 공개했다. IBM 연구진은 CPO기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.
광섬유 기술은 전기 대신 빛으로 장거리 데이터 전송을 빠르게 처리하기 때문에, 현재 전 세계 상업 및 통신 트래픽 대부분에 사용되고 있다. 그러나 데이터센터의 경우, 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 이 전선은 대규모 분산 학습 과정에서 다른 장치의 데이터를 기다리느라 절반 이상의 시간을 유휴 상태로 보내는 GPU 가속기들을 연결하고 있는데 이로 인해 상당한 비용과 에너지가 소모된다.
IBM 연구진은 광학 속도와 처리 능력을 데이터센터 내부로 도입할 방법을 제시했다. IBM은 새롭게 발표된 논문[1]을 통해, 고속 광학 연결을 가능하게 하는 새로운 CPO 모듈의 시제품을 소개했다. 이 기술은 데이터센터 통신의 대역폭을 크게 확장하고, GPU의 유휴 시간을 줄이며, AI 처리 속도를 획기적으로 향상시킬 수 있다.
이번 연구 혁신을 통해 다음과 같은 주요 성과가 기대된다:
- 중급 전기 배선(interconnect) 대비 전력 소비를 5배 이상 줄임으로써[2] 생성형AI 확장 비용을 낮추고, 데이터센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있다.
- CPO 기술을 통해 기존 전기 배선(wiring)을 사용할 때보다 거대 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상의 폭이 더욱 커진다. [3]
- AI 모델 학습 시, 모델 당 미국 가정 약 5,000가구의 연간 전력 소비량에 해당하는 에너지를 절감함으로써 데이터센터 에너지 효율을 극대화할 수 있다. [4]
IBM 리서치 연구 개발 총책임자 다리오 길(Dario Gil) 수석 부회장은 “생성형 AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터센터는 진화해야 한다. 공동 패키지형 광학(CPO) 기술은 데이터센터를 미래에 대비하도록 만들 수 있다”라며, “이 획기적인 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것이며, 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 말했다.
CPO 기술은 모듈 외 통신을 전기에서 광학 연결로 대체할 수 있는 가능성을 제공함으로써 AI의 증가하는 성능 요구를 충족하기 위한 새로운 경로를 제시한다. 이 기술은 최초의 2nm 노드 칩 기술, 7nm 및 5nm 공정 기술의 최초 구현, 나노시트 트랜지스터, 수직 트랜지스터(VTFET), 단일 셀 DRAM, 화학적 증폭 포토레지스트 등 IBM의 선도적 반도체 혁신 역사를 이어가고 있다.
###
[참고자료]
기존 칩 간 통신 속도 대비 80배 빠른 대역폭
최근 칩 기술의 발전으로 칩 하나에 집적되는 트랜지스터의 집적도가 비약적으로 증가했다. IBM의 2나노미터(nm) 노드 칩 기술은 500억 개 이상의 트랜지스터를 포함할 수 있다. 이번 CPO 기술은 칩 제조사가 전자 모듈에서 칩을 연결하는 데 광학 경로를 추가할 수 있게 함으로써 가속기 간 배선(interconnection) 집적도를 향상시키는 것을 목표로 하고 있다. IBM의 연구에 따르면 새로운 고대역 집적 광학 구조는 광학 채널당 다중 파장을 전송하는 기술과 결합해 칩 간 대역폭을 기존 전기 연결 대비 최대 80배까지 증가시킬 수 있는 잠재력을 보유하고 있다.
상기 설명한 IBM의 기술을 통해 칩제조사는 현재 사용되는 최첨단 CPO 기술 대비 6배 더 많은 광섬유를 실리콘 포토닉스 칩의 가장자리에 추가할 수 있으며, 이는 ‘비치프론트 밀도(beachfront density)’라고 일컫는다. 각각의 광섬유는 머리카락 굵기의 약 3배로 길이가 수 센티미터에서 수백 미터에 달하며, 초당 테라비트의 데이터를 전송할 수 있다. IBM 연구진은 표준 패키징 공정을 사용해 실리콘 포토닉스 도파관에 단열 결합된 50마이크로미터 피치 광채널의 고집적 폴리머 광학 도파관(PWG)을 조립했다.
또한 IBM은 50마이크로미터 피치의 폴리머 광학 도파관(PWG)을 적용한 이 CPO 모듈이 제조에 필요한 모든 스트레스 테스트를 통과한 최초의 제품이라고 밝혔다. 해당 부품은 고습 환경과 -40°C에서 125°C 까지의 온도, 그리고 광학 인터커넥트가 파손이나 데이터 손실 없이 구부러지는지 확인하기 위한 기계적 내구성 테스트를 받게 된다. 또한 연구원들은 18마이크로미터 피치의 폴리머 광학 도파관(PWG) 기술도 시연했다. 4개의 폴리머 광학 도파관을 쌓으면 해당 피치에서 최대 128개의 채널을 연결할 수 있다.