AI 모델 확장·배포 엔드투엔드 인프라 제공
클라우드플레어의 네트워크에서 풀스택 AI 애플리케이션 구축이 가능해진다.
클라우드플레어(Cloudflare)가 4일 AI 애플리케이션 구축을 위한 개발자 플랫폼 워커스 AI(Workers AI)를 선보인다고 밝혔다.
클라우드플레어 플랫폼은 보안, 규제 준수, 속도를 기본으로 제공해 개발자가 프로덕션에 사용할 수 있는 애플리케이션을 신속히 배포할 수 있도록 한다. 개발자들은 별도의 인프라 관리가 필요 없다.
다양한 규모의 기업에서 AI 기반 애플리케이션 출시 비용을 최적화하는 것을 목표로 하는 가운데, 클라우드플레어의 워커스 AI(Workers AI)는 이를 충족할 수 있는 업계 최초의 대규모 서버리스 AI로 공개됐다.
클라우드플레어는 “파트너십을 통해 대규모 글로벌 네트워크에서 작동하는 GPU에 대한 액세스를 제공하고, 사용자와 근접한 곳에서 AI 추론이 이루어지도록 지원해 최종 사용자 경험에서 대기 시간을 절감시켜준다”며, “데이터 검증 시 최종 사용자 경험에서 대기 시간을 감소시켜 AI 추론이 사용자에게 근접할 수 있게 보장한다”고 말했다.
또한 데이터 검증 위치를 제어하는데 도움이 되는 데이터 분산 제품군과 결합하면, 고객은 워커스 AI를 통해 정부가 AI 사용에 관한 정책을 만들 때 발생할 수 있는 잠재적인 규정 준수 및 규제 요건을 예측할 수 있다.
애플리케이션 개발에 대한 클라우드플레어의 개인정보 보호 우선 접근 방식은 추론에 사용된 데이터가 LLM 학습에 사용되지 않도록 보장하도록 지원한다.
클라우드플레어는 현재 개발자가 빠르게 작업에 착수할 수 있도록 모델 카탈로그를 지원하며, 여기에는 LLM, 음성 텍스트 변환, 이미지 분류, 감정 분석 등의 사용 사례가 포함된다.
클라우드플레어의 새로운 벡터 데이터베이스 벡터라이즈는 AI 워크플로우 속도를 높인다. 개발자들이 온전히 클라우드플레어에서 전체 스택 AI 응용 프로그램을 구축할 수 있게 한다. 기본 제공 모델을 사용해 생성, 색인화, 쿼리 데이터 저장까지 전 과정을 지원한다.
클라우드플레어는 “개발자들은 워커스 AI와 벡터라이즈를 사용하면 더 이상 AI와 머신 러닝으로 앱의 성능을 강화하기 위해 여러 조각을 붙일 필요 없이 하나의 플랫폼에서 이 모든 작업을 수행할 수 있다”고 말했다.
벡터라이즈는 사용자와 더 근접한 곳에서 벡터 쿼리를 수행하고 대기 시간과 전체 추론 시간을 전반적으로 단축할 수 있다. 개발자가 오픈AI(OpenAI)나 코히어(Cohere)로 생성된 임베딩을 저장할 수 있어 팀은 이미 보유하고 있는 임베딩을 가져와서 AI 앱을 프로덕션으로 확장할 때 벡터라이즈의 이점을 누릴 수 있다.
클라우드플레어는 AI 애플리케이션의 안정성, 관찰 가능성, 확장성을 높이기 위한 AI 게이트웨이를 선보였다. AI 게이트웨이는 개발자에게 요청 수, 사용자 수, 앱 실행 비용, 요청 기간과 같은 AI 트래픽을 이해할 수 있는 통합 가시성 기능을 제공한다. 개발자는 캐싱 및 속도 제한을 통해 질문에 대한 답을 캐시로 저장할 수 있어서 값비싼 API를 지속적으로 여러 번 호출할 필요성을 줄일 수 있다. 속도 제한은 악의적인 행위자와 트래픽 폭주를 관리해 성장과 비용을 관리하는데 도움이 되며, 개발자에게 애플리케이션 확장에 대한 제어 능력을 부여한다.
매튜 프린스(Matthew Prince) 클라우드플레어 CEO 겸 공동 창업자는 “클라우드플레어는 개발자가 확장 가능한 AI 기반 애플리케이션을 구축하는 데 필요한 모든 인프라를 갖추고 있으며, 사용자에게 근접한 AI 추론을 제공할 수 있다”며 “우리는 모든 개발자가 강력하고 합리적인 가격의 도구에 쉽게 액세스하여 미래를 구축할 수 있도록 투자하고 있다. ‘워커스 AI(Workers AI)’는 일반적으로 몇 주에서 몇 달이 걸리는 일을 며칠 만에 효율적이고 경제적으로 프로덕션에 바로 사용할 수 있는 AI 환경을 구축할 수 있도록 지원한다”고 말했다.
하는 우리에게 많은 잠재력을 보여준다”고 말했다.