2012년 7월 10일, 서울 – 임베디드 시장용 플래시 메모리 솔루션 선도업체인 스팬션(NYSE: CODE)은 음성제어 시스템 인터페이스가 가능한 업계 최초의 HMI(Human machine interface) 코프로세서인 어쿠스틱 코프로세서(Acoustic Coprocessor: ACP)를 발표했다. 이 신제품은 애플 ‘시리(Siri)에 음성인식 기술을 제공한 뉘앙스 커뮤니케이션스의 음성인식 기술이 활용되었다. 스팬션의 어쿠스틱 코프로세서는 자동차, 게임, 가전제품 등의 음성인식 시스템에 이상적이며, 음향과 관련된 방대한 데이터베이스를 지원함으로써 기존 음성 인터페이스와 비교해 반응시간과 정확도를 대폭 향상시킨다. 또한 맞춤형 설계 로직과 고속 메모리로 구성되어 음성 인식기술이 필요한 HMI의 속도를 가속화하고 최적화시키면서 기존 CPU를 통한 음향 처리 작업부하를 없애준다.
전자제품들이 점점 더 인공지능화 되고 양방향 기능을 지원함에 따라, 음성, 이미지, 동작 등의 다양한 휴먼 인터페이스들은 인식속도와 관련 정보에 더욱 빠른 접속을 추구하는 소비자 요구에 더욱 신속하게 부합해야 한다. 현재까지, 사용자 인터페이스는 포괄적인(Genetic) 하드웨어와 소프트웨어에만 의존하고 있다. 스팬션의 어쿠스틱 코프로세서는 뉘앙스의 VoCon® 소프트웨어 엔진을 이용하고 있으며, 맞춤형으로 설계된 로직과 하드웨어가 통합된 최초의 애플리케이션 특정형 방식을 채택해 음성과 같은 자연스러운 사용자 인터페이스를 위한 전용 리소스를 제공한다.
뉘앙스 모바일 사업부를 총괄하는 마이클 톰슨(Michael Thompson) 부사장은 “스팬션은 자동차 제조업체에게 매우 영향력있는 플랫폼을 제공할 수 있는 독자적인 방법과 뉘앙스의 음성인식 기술을 통합했다”면서 “특정화된 코프로세서는 음성 상호작용을 매우 빠르게, 더욱 자연스럽게, 더욱 정확하게 만들어 줄 수 있다”라고 했다.
스팬션의 글로벌 비즈니스를 총괄하는 글렌다 돌첵(Glenda Dorchak) 수석 부회장은 “인간과 기계 간의 상호작용이 빠르게 발전함에 따라, 더욱 자연스러운 사용자 인터페이스에 대한 필요성이 대두되고 있으며 음성기술이 이를 주도하고 있다”면서 “스팬션의 새로운 어쿠스틱 코프로세서 제품은 부가가치를 높여주는 시스템 성능을 실현함으로써 우리의 전략을 강화시켜 준다. 부가가치형 시스템 성능의 실현은 고객들이 제품에 대한 차별화를 주도할 수 있게 하고 접속형의 인공지능형 기기에 대한 폭넓은 채택을 주도하는 동기를 부여한다. 자동차 및 임베디드 메모리 리더십을 통해, 우리는 데이터를 빠르게 판독하고 분석하여 새로운 차원의 사용자 경험을 실현할 수 있는 새로운 시스템 플랫폼을 설계하고 있다.”라고 말했다.
미국의 시장조사기관 스트래티지 애널리틱스(Strategy Analytics) 자동차 컨수머 인사이트 담당의 크리스 슈라이너(Chris Schreiner) 이사는 “자연스런 언어이해(natural language understanding)에 더 다가갈 수 있는 음성 인식의 기술 진보는 자동차 시장에서 중요하다”면서 “점점 더 많은 자동차 제조업체들이 모바일 커넥티비티 관리뿐 만 아니라 운전자 안전까지 지원할 수 있도록 차량에 음성 인식 인터페이스를 통합하고 있다. 스팬션의 어쿠스틱 코프로세서처럼 기술혁신을 통한 정확도 및 레이턴시 등의 성능 향상은 소비자에게 큰 혜택을 제공하며 차량과 상호작용하는 방식에 큰 변화를 줄 것이다”라고 말했다.
스팬션의 어쿠스틱 코프로세서는 광범위한 임베디드 애플리케이션에서 순간적인 반응 속도, 높은 신뢰성 및 성능을 구현할 수 있게 하는 스팬션의 검증된 기술과 리더십을 활용했다. 스팬션의 어쿠스틱 코프로세서를 사용한 벤치마크 결과는 애플리케이션 프로세서만 단독으로 사용할 때 보다 시스템 반응 속도를 최대 50%까지 향상된 것을 보여준다. 애플리케이션 프로세서에 대한 부하는 최대 50%까지 낮춰주어, 다른 작업을 자유롭게 할 수 있게 한다. 또한, 스팬션의 어쿠스틱 코프로세서는 다중 언어, 남성/여성의 음성 차이, 음의 고저가 필요한 성조음(tonal sound) 등 방대한 데이터베이스를 지원할 수 있다. 즉, 이를 통해 정확도와 자연스런 언어이해 성능을 향상시킨다.
IDC의 마이클 파마(Michael Palma) 반도체 담당 수석 리서치 애널리스트는 “오늘날의 컴퓨팅 디바이스에서, CPU는 고속 인터넷 접속 및 HD 비디오에서부터 3D 내비게이션 및 음성 인식에 이르는 모든 것을 처리함에 따라, 프로세싱 성능과 메모리 대역폭 모두에서 병목현상이 발생하게 된다. 음향적 등급을 관리하기 위해 애플리케이션 특정형 코프로세서를 사용할 경우 음성 인식 시스템에서 시스템 반응성과 레이턴시를 대폭 향상시킬 수 있어 CPU에 더 많은 용량을 제공함으로써 다른 리소스 집약형 애플리케이션에 집중을 할 수 있다. 또한 보드 전반에 걸쳐 더욱 향상된 사용자 경험을 실현시킬 수 있다”라고 말했다.
이 제품의 최초 구현은 자동차 시장에서 이루어졌다. 자동차 시장에서 음성 인식 기술은 차량에 연결되는 더욱 안전하고 스마트한 방법으로 제시되고 있으며 휴대형 기기를 통해 발생되는 시각적 매뉴얼의 부주의를 최소화시켜 준다. 스팬션 데모 플랫폼은 스팬션의 기술과 뉘앙스의 음성 인식 소프트웨어가 통합되어 있으며 현재 주요 자동차 제조업체들을 통해 평가되고 있다. 디자인 샘플은 올 3분기에 가능할 것으로 보인다.