인피니언 6월23일부터
Physical AI HBM Smart Factory SDV AIoT Power Semicon 특수 가스 정정·반론보도 모음 e4ds plus

IBM, 온칩 AI 가속 기술 기반 '텔럼' 프로세서 공개

Google 우선 소스 기사입력2021.08.24 09:10

IBM, 삼성전자와 협력해 텔럼 AI 칩 개발
대규모 금융 거래에 딥 러닝 추론 적용 가능
데이터 있는 곳에서 AI 프로젝트 구현 지원



IBM은 24일, ‘핫 칩(Hot Chips)’ 연례 회의에서 기업 워크로드에 딥 러닝 추론 기술을 적용하여 금융 사기에 실시간 대응하는 데 도움이 되도록 설계된 ‘IBM 텔럼(Telum)’ 프로세서의 세부 정보를 공개했다.
▲ IBM 텔럼 프로세서 [사진=IBM]

7nm EUV 기술 노드에서 개발된 텔럼 프로세서는 거래 처리 중에 AI 추론 기술을 적용할 수 있도록 온칩 가속 기술을 포함한 IBM의 첫 번째 프로세서이자, 삼성전자가 기술 개발 파트너로 참여한 제품이기도 하다.

텔럼 칩은 딥 슈퍼 스칼라 비 순차 명령 파이프라인(deep super-scalar out-of-order instruction pipeline) 구조의 8개 프로세서로 구성된다. 각 프로세서는 5GHz 이상의 클럭 속도로 수행되며, 이기종 워크로드에 최적화됐다.

캐시 및 칩인터커넥션 인프라는 코어당 32MB 캐시를 제공하며 32개의 텔럼 칩으로 확장할 수 있다. 듀얼 칩 모듈(Dual-Chip Module; DCM) 설계는 17개의 메탈 레이어 위에 220억 개의 트랜지스터와 19마일의 와이어를 포함한다.

텔럼 기반 시스템은 내년 상반기 출시된다.

◇ 데이터 있는 곳에서 AI 프로젝트 구축·실행 가능

IBM 텔럼은 데이터가 있는 곳에서 애플리케이션을 효율적으로 실행할 수 있도록 설계됐다. 추론을 처리하기 위해 상당한 메모리와 데이터 이동 기능을 요구하는 기존의 엔터프라이즈 AI 접근 방식을 극복하는 데 도움이 된다.

텔럼을 사용하면 성능에 영향을 미칠 수 있는 별도의 플랫폼 AI 솔루션을 호출하는 방식 대신, 미션 크리티컬 데이터 및 애플리케이션 가까운 곳에 있는 가속기를 통해 민감한 거래에 대해 대규모 추론을 실시간으로 실행할 수 있다.

또한, 플랫폼 외부에서도 AI 모델을 구축하고 학습시킬 수 있으며, 분석을 위하여 텔럼 기반의 IBM 시스템에 해당 AI 모델을 배포하여 추론을 실행할 수 있다.

◇ 은행, 금융, 주식 매매, 보험 업무 전반에 적합

오늘날 기업은 사기 사건이 발생하면 이를 잡아내기 위해 탐지 기술을 사용한다. 이는 현존 기술의 한계로 시간이 오래 걸리고 대규모 컴퓨팅 연산이 필요하다.

특히 사기 분석 및 탐지가 기업의 핵심 업무와 연관된 거래나 데이터로부터 분리된 플랫폼에서 수행될 때 더욱 그렇다. 지연 때문에 복잡한 사기 탐지는 실시간으로 이루어지지 않는 경우가 많다. 소매업체가 사기가 발생했음을 인지하기 전에 이미 범죄자들이 탈취한 신용 카드로 상품을 구매할 수 있다는 것이다.

텔럼은 기업 고객들이 사기를 탐지하는 수동적 입장에서, 서비스 수준(Service Level Agreement; SLA)에 영향 없이 거래가 완료되기 전에 사기를 방지하는 능동적 태세로 사고를 전환하도록 도울 수 있다. 신규 칩은 AI 특화된 워크로드에 대하여 AI 프로세서의 모든 성능을 활용할 수 있도록 한다.
이수민 기자
기사 전체보기