데이터센터 전력소모 줄이는 광학 AI 프로세서…
홈페이지홈페이지 > 소식 > 데이터센터 전력소모 줄이는 광학 AI 프로세서…

데이터센터 전력소모 줄이는 광학 AI 프로세서…

Nov 16, 2023

미국 MIT와 베를린공대 연구진이 GPT4.0 등 대형 언어 모델 AI의 전력 소모를 줄이는 레이저를 내장한 광신경망 프로세서를 구축했다.

3D 아키텍처는 베를린 공과대학교(Technische Universitat Berlin)의 Reitzenstein 그룹이 개발한 최첨단 수직 표면 방출 레이저(VCSEL) 배열을 기반으로 합니다. 이를 통해 에너지 효율성은 100배 향상되고 컴퓨팅 밀도는 20배 향상됩니다.

동료들과 함께 이 디자인에 대한 특허를 출원한 MIT 전자연구소(RLE)의 Ryan Hamerly 연구원은 “이것은 그들 없이는 불가능했을 공동 프로젝트였습니다.”라고 말했습니다.

이 시스템은 6 TOP/mm2/s1의 컴퓨팅 밀도로 작업당 7펨토줄(OP)의 에너지 효율성을 달성할 수 있으며, 이는 최첨단 디지털 프로세서에 비해 각각 100배 및 20배 향상된 성능을 나타냅니다. 단기 개발을 통해 이러한 지표를 두 배 더 향상시켜 데이터 센터에서 분산형 장치까지 기계 학습 작업을 수행할 수 있습니다.

“우리는 몇 년 안에 상업적 용도로 확장될 수 있을 것으로 기대합니다. 예를 들어, 관련된 레이저 어레이는 휴대폰 얼굴 ID 및 데이터 통신에 널리 사용됩니다.”라고 RLE의 MIT에서 박사후 연구원으로 일하면서 이 작업을 수행했으며 현재 University of Southern의 조교수로 재직 중인 Zaijun Chen은 말합니다. 캘리포니아.

“ChatGPT는 오늘날 슈퍼컴퓨터의 성능으로 인해 크기가 제한되어 있습니다. 훨씬 더 큰 모델을 훈련시키는 것은 경제적으로 실행 가능하지 않습니다. 우리의 새로운 기술은 가까운 미래에 도달할 수 없는 기계 학습 모델로의 도약을 가능하게 할 수 있습니다.”라고 MIT 전기 공학 및 컴퓨터 과학과 부교수이자 해당 작업의 리더인 Dirk Englund가 말했습니다.

"차세대 ChatGPT가 100배 더 강력하다면 어떤 기능을 갖게 될지는 알 수 없지만 이것이 바로 이러한 종류의 기술이 허용할 수 있는 발견 체제입니다." Englund는 또한 MIT 양자 포토닉스 연구소(Quantum Photonics Laboratory)의 리더이며 RLE 및 재료 연구소(Materials Research Laboratory)에 소속되어 있습니다.

현재 Nature Photonics 논문의 추가 공동저자는 RLE의 Alexander Sludds, Ronald Davis, Ian Christen, Liane Bernstein 및 Lamia Ateshian입니다. 베를린 공대(Technische Universitat Berlin)의 Tobias Heuser, Niels Heermeier, James A. Lott, Stephan Reitzensttein 등이 있습니다.

Chen, Hamerly, Englund는 미 육군 연구소와 일본의 NTT Research, 독일의 Volkswagen Foundation의 후원을 받아 이 작업에 대한 특허를 신청했습니다.

www.mit.edu; www.nature.com/articles/s41566-023-01233-w