Arm이 28일 개막한 컴퓨텍스 2019에서 새로운 모바일 IP 제품군을 대거 공개했다. Cortex-A77 CPU는 Cortex-A76 디바이스보다 IPC 성능이 20% 향상됐으며, 이를 바탕으로 높은 수준의 머신러닝 기술뿐만 아니라 매끄러운 AR 및 VR 경험을 소비자에게 제공한다. Mali-G77 GPU는 새로운 발할 아키텍처를 통해 기존 Mali-G76가 탑재된 디바이스에 비해 약 40% 향상된 성능을 제공한다. Arm의 프로젝트 트릴리엄은 Arm 머신러닝 프로세서와 오픈소스 기반의 Arm NN 소프트웨어 프레임워크 등으로 구성된 하나의 머신러닝 컴퓨팅 플랫폼으로, 현재 2억 5천만 개 이상의 안드로이드 디바이스에 탑재되고 있다.
| Cortex-A77, A76보다 IPC 20% 향상
| Mali-G77, 하이엔드급 고화질 그래픽 제공
| Arm 머신러닝 프로세서, 와트 당 5조의 연산
Arm이 28일 개막한 컴퓨텍스 2019에서 새로운 모바일 IP 제품군을 대거 공개했다. Arm은 지난 1년여 간 네트워크 에지부터 클라우드까지 아우르는 새로운 솔루션들을 제공해왔다.
Arm, 머신러닝 기능 강화로 AI 성능 높인 솔루션 대거 공개
이번에 선보인 제품군은 Cortex-A77, Mali-G77, Arm 머신러닝 프로세서 등으로 구성되었다. 그 중에는 프로젝트 트릴리엄(Project Trillium), Arm 네오버스(Neoverse), 안전성 기능을 보다 강화한 새로운 차량용 프로세서 2종, 그리고 보안성 기능을 갖춘 IoT 디바이스용 펠리언(Pelion) IoT 플랫폼 등이 있다.
Arm의 새로운 모바일 IP 제품군은 항시 전력을 소비하는 올웨이즈온(always-on) 노트북을 비롯하여, 수준 높은 보안기능을 필요로 하는 스마트폰에까지 더 나은 연산 속도 및 머신러닝 성능을 제공할 뿐만 아니라, 개발자에게 그 이상의 이점을 제공할 수 있도록 설계됐다.
CPU는 일반적인 컴퓨팅 작업뿐만 아니라 지금의 한계를 넘어 더 많은 기기에서의 머신러닝 컴퓨팅까지 모두 처리하기 때문에, 그 중요성은 어느 때보다 높다. 또한, 몰입감 강한 무선 AR/VR 애플리케이션, 이동 중에도 즐길 수 있는 HD 게이밍을 실현하는 것도 중요하다.
Arm Cortex-A77 벤치마크 결과
Cortex-A77 CPU는 Cortex-A76 디바이스보다 IPC 성능이 20% 향상됐으며, 이를 바탕으로 높은 수준의 머신러닝 기술뿐만 아니라 매끄러운 AR 및 VR 경험을 소비자에게 제공한다.
A77은 하드웨어 및 소프트웨어의 최적화를 통해 전반적인 머신러닝 성능을 A76보다 35배 높였으며, 스마트폰 시장에서 필요로 하는 성능 및 효율성을 달성했다.
Arm은 스마트폰에서도 노트북에 필적하는 수준의 컴퓨팅 성능을 구현할 수 있도록 지속적으로 노력할 계획이다.
전 세대 대비 Arm Mali-G77 성능 향상 폭
Mali-G77 GPU는 새로운 발할(Valhall) 아키텍처를 통해 기존 Mali-G76가 탑재된 디바이스에 비해 약 40% 향상된 성능을 제공한다.
G77은 엔진, 텍스처 파이프, 로드 스토어 캐시를 포함한 핵심 마이크로 아키텍처 개선을 통해 G76 대비 에너지 효율 및 ISO 비교 기준 성능밀도 측면에서 모두 30% 이상 끌어올렸다.
머신러닝 성능 역시 60% 높여 온디바이스(on-device)용 AI 애플리케이션을 위한 추론(Inference) 및 신경망(Neural Network; NN) 성능을 강화했다.
이러한 개선점들은 개발자들에게 오늘날 모바일 애플리케이션에서 요구되는 보다 현실감 있고 몰입도 높은 게임을 구현할 수 있는 최적의 환경을 제공한다.
Arm의
프로젝트 트릴리엄(Project Trillium)은 Arm 머신러닝 프로세서와 오픈소스 기반의 Arm NN 소프트웨어 프레임워크 등으로 구성된 하나의 머신러닝 컴퓨팅 플랫폼으로, 현재 2억 5천만 개 이상의 안드로이드 디바이스에 탑재되고 있다.
머신러닝 기술을 이용한 여러 응용분야에 대한 수요가 증가함에 따라 개발자들은 전용 NPU(Neural Processor Unit)를 활용한 하드웨어 플랫폼 환경을 사용할 수 있는 방법을 강구하고 있다.
지난 해 프로젝트 트릴리엄 발표 이후, Arm은 머신러닝 프로세서를 지속적으로 향상시켜 왔다. 그 결과, 에너지 효율을 기존 대비 2배 이상 높여 와트 당 최대 5조개의 연산을 처리할 수 있도록 했으며, 메모리 압축률 또한 기존 대비 최대 3배까지 개선했다.
이를 바탕으로 Arm은 향후 8개의 코어까지 연결하여 초당 최대 32조개의 연산을 처리할 수 있는 멀티프로세서를 발표할 예정이다.