실리콘 큐브, Intel FPGA Arria10 SoC FPGA를 이용해
딥러닝 및 연산/저장 서버 솔루션 NewTypeMind 개발
인텔의 프로그래머블 솔루션 그룹, Intel FPGA의 DSN Partner인 실리콘큐브(SiliconCube)가 Arria10 SoC FPGA를 이용해 딥러닝 및 연산/저장 서버 시스템용 솔루션인 NewTypeMind를 개발했다고 밝혔다. 이 보드는 전력소모를 획기적으로 줄일 수 있어 특히 시스템 전력소모와 공간절감에 민감한 데이터센터 애플리케이션에 적합하다.
Arria10 SoC FPGA에 기반한 NewTypeMind의 가장 큰 장점은 별도의 PC를 사용하지 않고 FPGA 솔루션만으로 독립적(standalone)으로 운영할 수 있다는 점이다. 이는 전력소모를 획기적으로 절감할 수 있는데, 기존 PC가 소모하는 전력대비 10분의 1 수준으로 동작이 가능하다. 따라서 1대의 PC 시스템이 장착될 수 있는 공간에 4대의 NewTypeMind 보드를 장착해 사용할 수 있으며, 시스템 전력소모 및 공간이 큰 이슈인 데이터센터에 적합하다.
또한 NewTypeMind는 64Gbyte의 대용량 메모리와 1.5GFLOPS의 부동소수점 연산능력을 가지고 있어 알파고와 같은 대용량 연산을 수행하는 딥러닝(Deep Running) 알고리즘 처리를 위한 연산용 서버 솔루션에 적합하다. 특히 머신 러닝(Machine Learning) 알고리즘은 대규모 수학연산을 처리하게 되는데, Aria10 SoC는 하드웨어 기반 부동소수점 연산장치를 1,688개를 내장하고 있어 이러한 애플리케이션 환경에 최적화되어 있다.
한편 Aria10 SoC는 OpenCL(Open Computing Language)을 이용한 하이-레벨 디자인을 자동화할 수 있어 고성능 연산 애플리케이션 개발 시간을 크게 단축할 수 있다. 특히 OpenCL은 C 언어와 같은 구조로 되어 있어 HDL 기반 개발 작업에 익숙하지 않은 디자이너도 쉽게 액세스할 수 있다. 또한 OpenCL로 구현된 알고리즘 수행에 필요한 대용량 데이터를 저장할 수 있도록 별도의 DDR4 DIMM 메모리 슬롯이 4개까지 제공되며, 최대 용량은 64Gbyte까지 지원된다. Intel FPGA는 이미 Aria10을 이용하여 CNN ImageNet 알고리즘으로 초당 600장 이상의 이미지 처리성능을 검증한 바 있다.
또한 초고속 광학 인터페이스(Optical interface)를 지원하기 때문에 네트워크 서버 솔루션에도 활용하기 적합하다. 대용량 연산 처리를 위해 요구되는 고속 데이터 송수신이 가능하도록 SFP를 이용한 2개의 광통신 포트가 제공된다.
Aria10 SoC는 1.5GHz 듀얼 코어 Cortex-A9을 하드 IP(Hard IP)로 내장하고 있어 기존의 일반 FPGA와 달리 독립적으로 시스템 운용이 가능하다. NewTypeMind는 이를 기반으로 랙에 NewTypeMind 만으로 서버 시스템을 구성하여 PC 기반 시스템 보다 4배 이상의 집적도를 높일 수 있다. 운영시스템은 리눅스가 포팅되어 있으며, 리눅스를 위한 별도의 2Gbyte DDR4 메모리가 탑재되어 있다.
실리콘큐브는 NewTypeMind를 응용한 다양한 연산 서버 어플리케이션 개발을 진행 중이다.
NewTypeMind의 주요 특징:
• OpenCL 컴파일러 지원
• 리눅스 운영 시스템
• 1.5GHz 듀얼 코어 Cortex-A9
• ARM용 2Gbyte DDR4 SDRAM
• 4개의 2400Mbps DDR4 DIMM 슬롯(최대 64Gbyte)
• 2개의 10Gbps SFP 이더넷 인터페이스
• 1,688개의 하드와이어된 단정밀 부동소수점(Single-Precision Floating Point) 멀티플라이어/애더
• 1.5GFLOPS(Floating Point Performance)
• 3.7GMACS(Fixed Point Performance)
• 42Mbit 메모리 블록
• mSD 인터페이스
• eMMC
• USB 2.0 호스트 인터페이스
• RJ45 타입 1Gbps 이더넷 인터페이스
• PCIe GEN3 x8