인공지능에 대한 컴퓨팅 요구 사항은 기하급수적으로 증가하고 있다. AI를 발전시키는 데 필요한 컴퓨팅 처리량을 달성하기 위해서는 하드웨어와 소프트웨어에 걸쳐 새로운 혁신이 필요한 상황이다.
인텔·ARM·엔비디아, 8비트 부동소수점(FP8) 사양 및 E5M2·E4M3 논문 공동 참여
인공지능에 대한 컴퓨팅 요구 사항은 기하급수적으로 증가하고 있다. AI를 발전시키는 데 필요한 컴퓨팅 처리량을 달성하기 위해서는 하드웨어와 소프트웨어에 걸쳐 새로운 혁신이 필요한 상황이다.
인텔은 ARM, 엔비디아와 함께 인공지능(AI) 학습과 추론에 적용되는 교환가능 포맷을 제공하기 위해 8비트 부동소수점(FP8) 사양 및 E5M2와 E4M3을 기술하는 논문을 공동으로 작성했다고 16일 밝혔다. 이러한 기업간 사양 합의를 통해 다양한 AI 모델이 하드웨어 플랫폼을 넘나들며 일관된 작동과 성능을 발휘해 AI 소프트웨어 개발을 가속화할 것으로 기대된다.
증가하는 컴퓨팅 격차를 해결하기 위해 각광받고 있는 연구 분야 중 하나는 메모리 및 계산 효율성 개선을 위한 딥 러닝 분야에서 수치 정밀 요구 사항을 줄이는 것이다. 정밀도 감소 방법은 심층 신경망의 고유한 노이즈 복원 특성을 활용해 컴퓨팅 효율성을 향상한다.
인텔은 하바나 가우디 딥 러닝 가속기를 포함한 CPU, GPU 및 기타 AI 가속기에 대한 AI 제품 로드맵에서 해당 사양을 지원할 계획이라고 밝혔다.
FP8은 하드웨어와 소프트웨어 간의 균형을 기반으로 기존 IEEE 754 부동소수점 형식으로부터의 편차를 최소화해 기존에 적용 부분을 활용하고 신규 채택을 가속화하고 개발자 생산성을 향상한다.
ARM, 엔비디아 및 인텔의 해당 포맷 제안의 원칙은 IEEE 표준화에 기반한 규약, 개념 및 알고리즘을 활용하는 것이다. 이번 포맷 제안은 현재의 산업 규약을 고수하면서 미래의 AI 혁신을 위한 가장 큰 자유도를 부여할 것으로 전망된다.