반도체 설계자산(IP) 기업인 Arm은 뛰어난 확장성을 갖춘 새로운 프로세서들을 포함한 Arm IP 제품군으로, 향상된 머신러닝(Machine learning, ML) 및 신경망(Neural network, NN) 기능을 제공하기 위한 ‘프로젝트 트릴리엄(Project Trillium)’을 발표했다.
Arm의 IP 제품 그룹 대표인 르네 하스(Rene Haas)는 “인공지능(Artificial intelligence)이 엣지 디바이스에 적용되는 속도가 빨라짐에 따라, 전력 효율성을 유지하면서 충분한 컴퓨팅 성능을 제공하는 것이 점점 어려워지고 있다. 이러한 요구를 충족시키기 위해, Arm은 새로운 ML 플랫폼인 ‘프로젝트 트릴리엄’을 발표했다”고 말했다. 또한 그는 “새로운 디바이스에는 이러한 최신 프로세서가 제공하는 고성능 ML 및 AI 기능이 필요할 것이고, 파트너사들은 Arm 플랫폼이 제공하는 높은 수준의 유연성과 확장성을 활용하여 다양한 디바이스에서 구현 가능한 범위를 확장할 수 있을 것”이라고 덧붙였다.
현재 ML 기술은 특정 디바이스 종류나 특정 요구사항에 집중하는 경향이 있다. Arm의 ‘프로젝트 트릴리엄’은 최상의 확장성을 제공함으로써 이러한 현상에 변화를 가져온다. 초기에 출시된 Arm ML 제품은 모바일 프로세서에 초점을 맞췄지만, 향후에는 센서, 스마트 스피커, 홈 엔터테인먼트, 그리고 그 이상을 아우르는 적절한 성능을 제공할 것이다.
성능
Arm의 새로운 ML 및 객체 인식 프로세서는 기존 CPU, GPU, 가속기(accelerators)와 비교하여 엄청난 효율 향상을 가져올 뿐만 아니라, 전형적인 DSP를 훨씬 능가한다.
Arm ML 프로세서는 처음부터 철저하게 ML 전용으로 설계됐다. 이는 확장성이 뛰어난 Arm ML 아키텍쳐를 기반으로 하며, ML 응용 프로그램의 성능과 효율성을 극대화한다:
• 모바일 컴퓨팅의 경우, 프로세서는 초당 4.6조 이상의 연산 수행
• 지능형 데이터 관리를 통해 실제 응용 프로그램에서 2배에서 4배가량 높은 유효 처리량(TOPs) 제공
• 발열과 비용이 제한된 환경에서 소비전력당 초당 3조 이상 연산 (TOPs/W) 효율성을 제공하는 탁월한 성능을 발휘 (Arm ML 프로세서에 대한 자세한 내용은 홈페이지에서 확인할 수 있다.)
Arm OD 프로세서는 사람과 기타 사물을 효율적으로 식별하도록 특수 설계됐으며 프레임당 식별 가능한 사물의 수는 무한대에 가깝다:
• 초당 60 프레임의 속도로 Full HD 해상도 실시간 식별
• 기존 DSP 성능 대비 최대 80배까지 높이고, 이전 Arm 기술에 비해 식별 능력 크게 향상 (Arm OD 프로세서에 대한 자세한 내용은 홈페이지에서 확인할 수 있다.)
Arm의 ML 및 OD 프로세서는 한 층 더 뛰어난 성능을 자랑하며, 높은 성능과 전력 효율을 갖춘 사람 식별 및 인식 솔루션을 제공한다. 이는 스마트 디바이스에서 저전력, 고해상도의 상세한 얼굴 인식 기능을 실시간으로 가능케 한다.
Arm NN 소프트웨어는 Arm 컴퓨트 라이브러리(Arm Compute Library)와 CMSIS-NN과 함께 사용될 경우 NN에 최적화되며, 텐서플로(TensorFlow), 카페(Caffe), 안드로이드 NN과 같은 NN 프레임워크와 모든 Arm Cortex® CPU, Arm Mali™ GPU, ML 프로세서를 자연스럽게 통합해 준다. 개발자는 Arm 기반 하드웨어 기능을 최대한 활용하여, ML 응용 프로그램에서 최고의 성능을 얻을 수 있다. Arm NN 소프트웨어에 대한 자세한 내용은 홈페이지에서 확인할 수 있다.
새로운 Arm ML IP 제품군은 2018년 4월에 시연이 가능하며, 2018년 중순에 출시될 예정이다.
<저작권자 © AEM. 무단전재 및 재배포, AI학습 이용 금지>