인텔이 올빼미 뇌 수준의 뉴런 용량을 갖춘 세계 최대의 뉴로모픽 시스템을 공개하며, 미래 뇌 구조를 모방한 인공지능 연구지원 및 인공지능의 효율성 및 지속가능성과 관련된 과제를 해결하는데 도움을 줄 것으로 기대가 모아진다.
할라 포인트, 1,152개 로이히2 프로세서 장착
최대 11억5,000만 뉴런·1,280억 시냅스 지원
미래 뇌 구조 모방 AI 연구 지원 및 과제 해결
인텔이 올빼미 뇌 수준의 뉴런 용량을 갖춘 세계 최대의 뉴로모픽 시스템을 공개하며, 미래 뇌 구조를 모방한 인공지능 연구지원 및 인공지능의 효율성 및 지속가능성과 관련된 과제를 해결하는데 도움을 줄 것으로 기대가 모아진다.
인텔은 18일 세계 최대 뉴로모픽 시스템을 발표했다.
코드명 ‘할라 포인트(Hala Point)’인 이 대규모 뉴로모픽 시스템은 최초로 샌디아 국립 연구소(Sandia National Laboratories)에 구축됐다.
인텔 로이히 2(Loihi 2) 프로세서를 활용해 미래의 뇌 구조를 모방한 AI 연구 지원 및 현재 AI의 효율성 및 지속가능성과 관련된 과제를 해결하는 것을 목표로 하고 있다.
할라 포인트는 아키텍처 개선을 통해 인텔의 1세대 대규모 연구 시스템인 포호이키 스프링스(Pohoiki Springs)를 발전시켰으며 아키텍처 개선을 통해 뉴런 용량을 10배 이상 늘리고 최대 12배까지 성능을 향상시켰다.
할라 포인트는 전자레인지 크기의 6랙 유닛 데이터 센터 섀시에 인텔 4 프로세스 노드에서 생산된 1,152개의 로이히 2 프로세서를 패키징했다.
이 시스템은 최대 2,600와트의 전력을 소비하는 14만544개의 뉴로모픽 처리 코어에 분산된 최대 11억5,000만개의 뉴런과 1,280억개의 시냅스를 지원한다.
또한 이 시스템에는 보조 연산을 위한 2,300개 이상의 내장형 x86 프로세서가 포함돼 있다.
할라 포인트는 프로세싱, 메모리, 통신 채널을 대규모 병렬화된 패브릭에 통합해 총 16PB/s(초당 페타바이트)의 메모리 대역폭, 3.5PB/s의 코어 간 통신 대역폭, 5TB/s의 칩 간 통신 대역폭을 제공한다. 이 시스템은 초당 380조 개 이상의 8비트 시냅스와 240조 개 이상의 뉴런 연산을 처리할 수 있다.
생체에서 영감을 얻은 스파이크 신경망 모델에 적용된 이 시스템은 인간의 뇌보다 20배 빠른 11억5,000만개의 뉴런을 최대 용량으로 실행할 수 있으며, 더 낮은 용량에서는 최대 200배 빠른 속도로 실행할 수 있다.
할라 포인트는 신경과학 모델링용은 아니지만, 올빼미 뇌나 카푸친 원숭이의 피질과 거의 동일한 수준의 뉴런 용량을 갖추고 있다.
로이히 기반 시스템은 기존 CPU 및 GPU 아키텍처보다 최대 50배 빠른 속도로 100배 적은 에너지를 사용해 AI 추론을 수행하고 최적화 문제를 해결할 수 있다.
할라 포인트는 주로 사용되는(메인스트림) AI 워크로드에 적용 시 최첨단의 컴퓨팅 효율성을 입증한 최초의 대규모 뉴로모픽 시스템이다.
특성 분석 결과, 기존 심층 신경망을 실행할 때 와트당 15TOPS/w 8-비트 연산 처리(TOPS는 초당 수행할 수 있는 단위 연산으로, 1 TOPS는 1초당 10억 단위 연산 수행)를 초과하는 효율성으로, 초당 최대 20경 연산, 즉 20페타옵스(petaops)를 지원할 수 있는 것으로 나타났다.
이는 GPU 및 CPU 기반 아키텍처가 달성한 수준에 필적하거나 이를 능가하는 수치다.
할라 포인트의 고유한 기능은 과학 및 엔지니어링 문제 해결, 물류, 스마트 시티 인프라 관리, LLM(대형 언어 모델) 및 AI 에이전트와 같은 AI 애플리케이션을 위한 실시간 연속 학습을 가능하게 할 수 있다.
샌디아 국립 연구소의 연구원들은 첨단 두뇌 규모 컴퓨팅 연구에 할라 포인트를 사용할 계획이다. 이 연구소는 장치 물리학, 컴퓨터 아키텍처, 컴퓨터 과학 및 정보학 분야의 과학적 컴퓨팅 문제를 해결하는 데 중심을 둘 예정이다.
인텔 랩스(Intel Labs)의 뉴로모픽 컴퓨팅 랩을 담당하는 마이크 데이비스(Mike Davies) 디렉터는 “오늘날 AI 모델의 컴퓨팅 비용은 지속 불가능한 속도로 증가하고 있다. 업계에는 확장이 가능한 근본적으로 새로운 접근 방식이 필요하다”며 “이러한 이유로 인텔은 딥 러닝 효율성과 뇌와 유사한 새로운 학습 및 최적화 기능을 결합해 할라 포인트를 개발했다. 할라 포인트를 통한 연구가 대규모 AI 기술의 효율성과 적응성을 발전시킬 수 있기를 기대한다”고 밝혔다.