
▲NPU가 더해진 MCU는 빠르게 움직이는 사물 분할 위치 파악, 자세 추정, 사물 분류, 음성 인식과 같은 고급 AI 기능을 수행할 수 있다.
“NPU 탑재 MCU는 MCU의 기능을 크게 확장해 클라우드에 의존하지 않는 산업 현장서 이전에는 불가능했던 더 복잡한 AI 작업을 가능하게 함으로써 산업 현장과 소비자 가전, 스마트 시티 인프라에 새로운 가능성 제시한다. 전력·네트워크 비용 절감은 물론 데이터 프라이버시와 서비스 안정성을 보장하는 엣지 AI 솔루션의 핵심으로 주목받고 있다”
ST마이크로일렉트로닉스(STMicroelectronics, ST)가 최근 발표한 ‘엣지 AI의 혁신:현대 마이크로컨트롤러가 제공하는 신경망 처리 장치의 힘’이라는 백서에 따르면 MCU는 NPU 탑재를 통해 엣지 AI 혁신을 가속하고 있는 것으로 나타났다.
인공지능(AI)은 데이터를 학습해 패턴을 인식하고 예측하는 기술로, 스마트폰·웨어러블·자율주행차·산업 자동화·의료 진단 등 다양한 분야에 도입되고 있다.
반면에 클라우드 서버에 전송해 처리할 때 발생하는 네트워크 지연과 대역폭 부담은 엣지 AI 확대의 걸림돌로 지목됐다.
전력 제약이 있는 로컬 기기로 AI 연산을 옮기는 ‘엣지 AI’는 이러한 문제를 해결하며, IoT 디바이스의 응답 속도와 개인정보 보호, 에너지 효율을 동시에 끌어올린다.
전통적인 CPU는 순차 처리, GPU는 병렬 계산에 적합하지만, AI 워크로드에는 메모리 접근이 빈번하고 대규모 누적·곱셈 연산이 요구된다.
NPU는 합성곱 신경망 연산에 최적화된 특수 코어를 다수 배치해 저지연·고효율 병렬 처리를 제공한다.
TOPS(초당 연산수)/와트 성능 면에서 CPU·GPU를 크게 앞서며, 엣지 디바이스의 새로운 가능성을 연다.
이런 가운데 ST는 지난 2024년 11월 신경망 처리 장치(NPU)인 Neural-ART Accelerator™를 통합한 STM32 마이크로컨트롤러(MCU) 제품군을 발표했다.
이 제품군은 엣지 디바이스에서 AI 추론을 온디바이스로 처리해 전력 소비를 대폭 절감하고 지연 시간을 최소화하는 것이 목표다.

▲다양한 하드웨어 아키텍처의 전력 효율성
클라우드 의존성을 줄이고 실시간 AI 기능을 구현하려는 산업·의료·스마트시티 분야에서 이 제품을 주목하고 있다.
Neural-ART Accelerator의 핵심은 재구성 가능한 스트림 처리 엔진과 8·16비트 고정소수점 MAC 유닛이다.
필요에 따라 연산 정밀도와 코어 수를 조정해 AI 모델의 연산 효율을 극대화한다.
STM32 MCU에 IP 블록 형태로 통합돼 전력 예산이 제한된 환경에서도 복잡한 영상·음성·센서 데이터 분석을 처리할 수 있다.
.jpg)
▲NPU 가속기가 탑재된 마이크로컨트롤러는 새로운 범위의 임베디드 AI 가능성을 열었다.
개발자는 STM32Cube.AI 데스크톱 애플리케이션이나 ST 엣지 AI 개발자 클라우드 플랫폼을 통해 Keras·TensorFlow·ONNX 등 인기 AI 프레임워크로 학습된 모델을 손쉽게 최적화·양자화하고 Neural-ART Accelerator가 가속하는 코드로 변환할 수 있다.
번거로운 수동 최적화 없이도 플랫폼이 자동으로 연산자를 매핑하고 최적 코드를 생성해 개발 기간을 단축한다.
성능 벤치마크에서 Neural-ART Accelerator는 Cortex-M55 단독 대비 MobileNet v1 성능을 최대 120배, Tiny Yolo v2는 134배 높였다. Yolo v8을 이용한 사람 감지 사례에서는 1GHz 클럭에서 26fps를 달성해 실시간 영상 처리에 무리가 없음을 입증했다.
스마트 시티 카메라용 Tiny Yolo v2는 18fps로 차량·보행자 인식을 지원, 교통 모니터링 효율을 대폭 강화했다.

▲1GHz에서 4개의 합성곱 어레이를 갖춘 Neural-ART Accelerator Gen1으로 측정한 결과
ABI Research에 따르면, 엣지 AI용 MCU 출하량은 2030년 약 18억대에 이를 전망이다.
산업용 예측 유지보수, 스마트 리테일의 방문자 분석, 헬스케어 모니터링, 농업 로봇 등 수많은 신규 애플리케이션이 NPU 기반 MCU 기술을 활용할 것으로 보인다.
ST는 향후 Neural-ART Accelerator 제품군을 더욱 확장해 인메모리 컴퓨팅, 향상된 에너지 효율, 다양한 연산자 지원을 강화할 계획이다. 고성능·저전력 엣지 AI 구현을 위한 하드웨어와 툴체인 개발에 주력해 차세대 AIoT 시장을 주도하겠다는 포부다.
한편 ST는 9월9일 ST센터에서 열리는 ‘
2025 e4ds Tech Day’ 행사에서 ‘STM32N6 기반 ST Edge AI 솔루션’을 주제로 발표한다. 이 행사 참여시 발표 및 ST가 운영하는 데모부스를 통해 직접 Neural-ART Accelerator™가 통합된 STM32 MCU 제품군에 대해 자세히 살펴볼 수 있다. 행사 참가 접수는
https://www.e4ds.com/conference/techday/ 에서 할 수 있다.