웨비나리뷰 - 인피니언 고성능 MEMS 마이크로폰, AI 음성비서 인식 정확도 ↑

[웨비나리뷰] “인피니언 고성능 MEMS 마이크로폰, AI 음성비서 인식 정확도 ↑”

기사입력2024.03.04 15:13

마이크로폰 시장, 2026년까지 연평균 약 4% ↑
음성 인식 정확도 ↑·잡음 ↓·원거리 음성 포착
MEMS, 작은 크기 고성능…대량 생산·비용 절감

대화형 AI를 기반으로 음성 비서 시장이 확대되는 가운데, 고성능 MEMS 마이크로폰이 음성 가능 어플리케이션의 사용자 경험을 향상시킬 수 있다는 전문가의 의견이 제시됐다.

지난 2월 20일 e4ds 웨비나에서 인피니언 김성태 부장이 ‘MEMS 마이크로폰의 기본 원리 및 AI 트렌드에 맞는 고성능 마이크로폰 선정 방법’을 주제로 발표했다.

인공지능(AI)는 사람의 언어를 자연스럽게 이해 및 처리해 기능을 수행한다. 최근에는 LLM(초거대언어모델)과 같은 자연어 대화가 가능한 생성형 AI가 급증하며 음성 입력이 핵심 인터페이스로 제품에 탑재되고 있다. 예컨대 삼성전자의 S24 시리즈, 갤럭시 북 프로 등에 온디바이스 AI 기술을 적용해 생성형 AI를 탑재했다. 애플도 시리(Siri)에 대화형 AI 모델을 통합해 HW와 SW 기능을 강화할 계획을 밝혔다.

센싱의 원리는 인간의 시청각 기능과 유사하다. 인간이 눈, 귀 등 감각을 통해 환경을 인식하듯 유사하게 디바이스들도 센서를 통해 상황을 인식한다. 센서는 인간의 감각 한계를 넘어 더 정확하고 광범위한 정보 수집이 가능하다. 또한 더 정확한 인식을 위해 퓨전 알고리즘을 통해 여러 센서의 입력 정보를 종합적으로 받아들인다.

‘MEMS 고성능 마이크로폰’은 음성을 정확히 탐지(detection)하기 위한 도구로 주목받고 있다. 시장조사기관에 따르면 전체 마이크로폰 시장은 2022년부터 2026년까지 연평균 약 4.2% 성장할 것으로 기대된다.

마이크로폰은 스마트폰, 에어팟 등 TWS(True Wireless Stereo), 헤드폰, 영상통화 장비, AI 스피커 등 소비자 어플리케이션부터 카메라, 감시 모니터링 장비, VR 디바이스, 의료 기기, 산업용 기기 등 다양한 분야에서 사용되고 있다. 점차 마이크로폰은 고사양의 선명한 음질이 선호되는 추세다. 화상통화, 화상회의, 스피커 등을 통해 커뮤니케이션 할 경우, 고품질의 레코딩을 요구한다.

마이크 구성에 있어 가장 널리 사용되는 두 가지 기술은 ‘MEMS’와 ‘ECM(Electronic Condenser Microphone)’이다. MEMS는 센싱부를 반도체 공정으로 구현해 작은 크기에서도 고성능을 낼 수 있다. 대량 생산으로 비용도 저렴한 장점 덕분에 ECM을 빠르게 대체하고 있다.

‘MEMS(Micro Electronic Mechanical system)’는 초소형의 반도체 구조 안에서 외부의 물리적 신호를 전기적으로 변환해주는 장치를 말한다. MEMS 마이크는 소리를 센싱하는 MEMS 부분과 발생한 소리에 의해 정전용량(커패시턴스, Capacitance) 차이를 전기적 신호로 뽑아내는 ASIC, PCB를 포함하고 있다.

MEMS 마이크로폰은 ‘멤브레인(Membrane)’이라는 공기 진동에 의해 움직이는 진동판과 고정된 진동판 두 개의 구조로 형성된다. 일정한 거리에서 멤브레인이 공기의 진동에 따라 움직이면 위아래로 움직이며 고정된 진동판과의 거리가 변한다. 이때 차이를 전기적 특성으로 인식해 출력한다.

인피니언은 ‘SBP MEMS(싱글)’와 ‘SDM MEMS(듀얼)’를 생산하고 있다. SBP 구조는 간단해서 크기를 작게 만들 수 있고 상대적으로 저렴하지만, SDM은 노이즈를 줄이고 신호를 깨끗하게 얻기 위한 방법이다.

인피니언의 ‘XENSIV™ MEMS 마이크로폰’은 SDM MEMS 센서로, 음성 인식 정확도를 높이고, 잡음을 낮추고 원거리 음성 포착을 가능하게 하고, 맥락 이해를 가능하게 하고, 멀티모달 상호작용을 가능하게 한다.

저전력을 소모하면서 높은 수준의 신호 대 잡음비(SNR, Signal-to-Noise Ratio)을 갖췄다. SNR이 높으면 희망 신호를 선명하게 많이 포착할 수 있다는 의미다. IP57 등급의 방수 방진 특성을 가져 환경적으로 유리하다. 낮은 수준의 노이즈 특성으로 트랜스페이런트 모드나 액티브 노이즈 캔슬레이션 등의 어플리케이션에도 적합하다.

넓은 다이나믹 레인지(Wide dynamic range) 덕분에 낮은 노이즈 단계부터 큰 소리까지 왜곡 없이 수신 가능하다. 클락을 인풋해 다양한 파워 모드를 변경해 전력 소모를 최적화할 수 있다. 최고 수준의 품질 표준으로 전 제품을 주요 스펙에 대해 캘리브레이션 및 테스트와 배포가 용이하다.

인피니언의 MEMS 마이크로폰 포트폴리오에서 신제품 ‘IM70D122’은 SDM MEMS 제품으로, 테스트에서 기존 제품은 소리가 작아지고 거리가 2m에서 16m 정도로 멀어지는 경우 인식률이 약 98%에서 약 24%로 낮아졌지만, 같은 조건에서 IM70D122은 39m 거리에서도 약 78%의 인식 정확도를 보인 것으로 나타났다. 노이즈 테스트에서도 기존보다 월등히 높은 인식률을 보였다.

인피니언은 “75dB SNR인 마이크로폰으로 상용 음성 가능 비서에 사용되는 것과 같은 표준 마이크로폰에 비해 오디오를 40%나 더 잘 포착할 수 있다”고 밝혔다.

김성태 부장은 “높은 성능과 고 SNR를 기반으로 인피니언은 실리콘 마이크 비즈니스에서 50% 이상의 시장 점유율을 차지하고 있다”며, “전체 MEMS 센서 시장을 통틀어도 글로벌 3위 내에 든다”고 말했다. 또한 “인피니언은 웨이퍼부터 완제품 생산의 모든 단계에 있어 15년 노하우를 기반으로 획기적인 MEMS 마이크 제품들을 개발해오고 있다”고 말했다.

#AI #MEMS #센서 #인피니언 #생성AI