자율주행 데이터 쓰나미 ‘아이실론’으로 해결

델 EMC 스토리지, 탁월한 확장성으로 AI·ADAS 지원

2019년 03월호 지면기사  /  편집부

ACCELERATE ADAS INNOVATION WITH POWERFUL STORAGE
자율주행 데이터 쓰나미 ‘아이실론’으로 해결
델 EMC 스토리지, 탁월한 확장성으로 AI·ADAS 지원




DELL EMC Florian Baumann                                  델 EMC 플로리안 바우만 CTO



첨단 운전자 지원 시스템, 자율주행 관련 머신러닝, 딥러닝 기반 AI를 제대로 학습시키고 더욱 정확하면서 다양한 기능을 부여하려면 그만큼 방대한 데이터와 더불어 그러한 데이터를 빠르게 처리할 수 있는 고성능 고용량 시스템 인프라가 필요하다. 델 EMC가 자동차 업계에 이를 지원한다. 4월, 델 EMC의 플로리안 바우만 ADAS 및 AI 부문 CTO와 만났다. 그는 얼마 전까지 독일 OEM에 대한 ADAS 제품 공급을 맡은 티어 1 테크니컬 디렉터였다.

글 | 한상민 기자 han@autoelectronics.co.kr




“델 EMC의 스토리지는 첨단 운전자 지원 시스템(ADAS), 자율주행 관련 자동차 산업의 주요 OEM, 티어1의 75%를 지원하고 있습니다. 데이터 스토리지 볼륨으로 보면 자동차 쪽에서 발생하는 750페타바이트가 델 EMC의 스토리지에 저장되고 있습니다.” 델 EMC의 첨단 운전자 지원 시스템(ADAS) 및 딥러닝 담당 CTO 플로리안 바우만(Florian Baumann)이 말했다.

레벨 2 ADAS 시스템 개발에 2페타바이트 정도의 데이터가 생성된다는 점을 떠올리면, 델 EMC의 저장량은 그들의 스토리지 솔루션의 가치를 잘 반영하고 있다고 볼 수 있다. 델 EMC는 ADAS, 자율주행, 혹은 커넥티드 카와 관련해 어마어마하게 생성되는 데이터를 효율적으로 관리할 수 있도록 해주는 스토리지 솔루션을 자동차 회사들에게 제공하고 있다.

델 EMC는 기존 하드웨어, 소프트웨어 인프라는 ADAS 및 자율주행의 개발 상용화에 준비가 돼 있지 않다고 말해왔다. 기하급수적으로 증가하는 데이터 양을 효율적으로 처리하고 저장할 수 없다는 것이다. 이를 지원하려면 전례 없는 수준의 스토리지 용량, 컴퓨팅 파워, 인공지능 등 새로운 접근 방식이 필요하다. 엣지 컴퓨팅을 이용하던, 클라우드로 확장하던 간에 늘어나는 데이터를 효과적으로 관리하고 사용하려면 자동화된 기능과 새로운 방식의 데이터 센터 운영이 요구된다.

“ADAS와 자율주행 부분은 시스템 개발 시 얼마만큼의 볼륨 데이터가 생성될 지 아무도 모릅니다. 모두가 처음 가보는 길입니다.” 바우만 CTO가 말했다.


방대한 데이터의 요구   

바우만 CTO는 자동차 업계, 특히 ADAS와 자율주행 개발 영역의 특성, 요구사항과 해법을 누구보다도 더 잘 이해하고 있다. 왜냐면 소프트웨어 개발부터 OEM 공통 프로젝트 총괄까지, 자동차 업계의 컴퓨터 비전, 머신러닝, 데이터 관리, 데이터 툴 등 ADAS 분야에서 다년간 경험을 쌓은 전문가이기 때문이다. 커리어의 하이라이트는 파나소닉 오토모티브(Panasonic Automotive)의 자회사인 피코사 인터내셔널(Ficosa International)의 테크니컬 디렉터로서 독일 OEM들에 제공한 ADAS 제품을 시작 단계부터 생산 초기까지 이끌며 ADAS 제품 개발의 전반적인 워크플로우를 총괄한 것이다. 피코사는 데이터 볼륨, AI에 민감한 비전 센싱 분야의 강자다.

“알렉사나 시리와 같은 챗봇에 AI를 적용하려면 머신러닝과 같은 툴을 적용해야 합니다. 딥러닝도 마찬가지입니다. 다양한 산업에서 AI를 적용하고 있고 자동차의 ADAS도 그런 대표적인 예입니다. 이런 모든 것을 델 EMC가 지원하고 있습니다.”

인공지능 분야에서 박사학위를 취득한 바우만 CTO는 알렉사와 시리를 예로 ADAS, 자율주행 개발에서 어떻게 인공지능과 IT가 핵심적인 역할을 하고 델 EMC과 지원할 수 있는지 이야기를 풀어나갔다. 경험 데이터를 기반으로 하는 머신러닝이던, 스스로 데이터의 특징과 규칙, 유용한 통계를 찾아내고 분류하는 딥러닝이던, 제대로 학습하고 더욱 정확하고 신뢰할 수 있는 기능을 발휘하려면 그만큼 방대한 데이터와 이 데이터를 빠르게 처리할 수 있는 인프라가 필요하다.

“자동차 회사가 ADAS나 자율주행에 어떻게 AI를 적용하고 성공적으로 운영할 수 있을까란 답을 찾는 시작점은 많은 양의 데이터를 갖는 것입니다. 이 데이터를 활용하려면 데이터를 준비하는 데이터 인리치먼트(data enrichment)가 필요하고, 그 다음 적절한 알고리즘 모델을 선택해야 합니다. 알고리즘의 종류가 다양하고, 이것들이 해결할 수 있는 문제 또한 제각각이기 때문에 가장 적합한 것을 찾는 것이 중요합니다. 그리고 그 다음이 바로 IT 인프라입니다. 어마어마한 컴퓨팅 파워와 대용량 스토리지 용량이 요구되고 있습니다.” 바우만 CTO가 말했다.

왜 이렇게 많은 데이터가 필요할까? 이것은 현실의 주행에서 존재할 수 있는 무한한 경우의 수 때문이다. 또한 자율주행에 적용되는 애플리케이션은 매우 많고 복잡하다. 게다가 HiL, SiL 등 각각의 테스팅 과정을 거쳐야하고 ECU 개발 과정도 거쳐야 한다. 따라서 많은 테스트, 많은 주행, 많은 데이터, 대용량 스토리지가 요구된다.

ADAS, 자율주행의 테스트 및 검증 프로세스는 매우 복잡하다. 예를 들어 다양한 환경의 국가에 각각 테스트 카를 보내고 수많은 시나리오를 적용해 테스트하고 기록해야만 한다. 가능한 많은 시나리오를 테스트해야 하기 때문에 그 과정에서 많은 이슈가 발생할 수밖에 없다. 한국, 북미, 유럽, 인도 등에 있는 여러 팀들이 하나의 프로젝트를 놓고 협력해야 한다면, 이 과정에서 웹 프론트엔드, 데이터 관리 시스템, 데이터 이동(HiL, SiL, 하이 퍼포먼스 컴퓨팅 등) 요건이 해결돼야만 유즈케이스 데이터를 자동화된 방식으로 빠르게 처리할 수 있다.

또 머신러닝 모델 자체를 개발하고 고도화하는 것도 큰 도전이다. 머신러닝은 루프 프로세스를 반복하며 개선하는 것이다. 개발자가 코딩을 하지만 이를 다시 코딩하고 머신러닝 모델에 대해 트레이닝을 시키고 다양한 시나리오를 적용해 테스트해야 한다. 그 결과가 만족스럽지 않으면 이 프로세스를 반복해야만 한다. 이 과정이 효율적으로 진행되려면 완벽하게 통합된 개발 툴들이 활용될 수 있어야만 한다. 당연하게도 이 과정에서 개발 팀은 엄청난 데이터 증가율을 감당해야만 한다.


ADAS, 자율주행을 위한 AI의 도전과제

“ADAS와 자율주행은 데이터가 많을수록 좋은 결과를 얻을 수 있는데, 자율주행 레벨이 높아질수록 스토리지에 데이터를 저장하는 것만으로는 충분치 않습니다. 특히 메타 데이터가 많이 생성되고 관리돼야 하는데, 예를 들어 차량, 사물에 대한 인식 데이터들은 DB에 저장되고 그 외 생성되는 센서 데이터들이 스토리지에 쌓이기 때문에 확장성을 갖추는 것이 중요합니다. 우리가 지원하는 고객들을 보면 기본적으로 자율주행 레벨 2~4 사이에 있는데, 레벨 2 기능을 개발한다고 하면 2~10페타바이트가 필요하고 CPU는 5K 코어가 요구됩니다. 주행거리로 따지면 2만 km 주행 데이터를 활용해야 합니다. 레벨이 높아질수록 이같은 요구사항은 높아지고, 레벨 5 자율주행이라면 2엑사바이트 이상의 데이터와 100K 이상 코어가 요구됩니다.”


데이터 관리의 규모  


ADAS 워크플로와 데이터 관리  

바우만 CTO는 20단계의 일반적인 AI 개발 워크플로를 5분으로 압축해 들려줬다. 델 EMC의 솔루션이 얼마나 많은 부분을 지원하는지 설명하기 위한 지도를 펼친 것이다. 아마도 고객에게 설명했다면 단계별로 최소 1시간은 할애했을 것이었다.

20단계를 나열하면, 카 빌드업 - 센서 통합 - ■데이터 획득 시스템(DAQ) - 레코딩 플래닝 - 레코딩 캠페인 - 컨텍스트 레이블링 - ■데이터 인제션 - ■데이터 관리 - ■메타데이터 관리 - ■실측 플래닝 - ■실측 생성(groundtruth generation) - 제품개발 - ■알고리즘 트레이닝 - ■재 시뮬레이션 - ■시뮬레이션 - ■HiL, SiL, MiL - 품질보증 - ■백업 관리 - ■디제스터 리커버리 - 생산 개시 순이다. 박스 부분이 델 EMC의 직접적인 지원이 있는 영역이다. 


AI 개발 워크플로와 델 EMC의 지원

차량을 셋업하면 수많은 센서들이 차에 통합된다. 예를 들어 최대 13개의 카메라가 통합된다. 레이더, 라이더, 초음파 등 35개 센서가 통합되고 센서들은 데이터 획득 시스템에 연결된다. 이 데이터는 차량 스토리지에 저장되게 된다. 테스트 이전에 팀은 어떤 시나리오를 적용해 주행할 것인지 여러 계획을 세우며 이 계획을 DB에 저장한다. 실제 테스트가 이뤄지면 차량의 코드라이버는 도로상황, 주행조건 등에 대한 레이블링 작업을 한다.

개발 센터 측에서는 발생한 데이터를 취합하고 인제션 작업을 한다. 어디에 어떤 데이터를 저장할지, 메타데이터 관리는 어떻게 할지와 같은 데이터 관리는 델 EMC 솔루션의 지원 하에 자동으로 이뤄지게 된다.

이후 실측 데이터에 대한 플래닝과 오브젝트에 대한 실측 데이터 레이블링 작업(groundtruth generation)이 진행된다. 그 다음 알고리즘을 짜고 코딩을 해 머신 트레이닝을 하는 실제 ADAS, 자율주행 제품 개발 단계에 들어가 알고리즘을 실제 주행기록에 적용해 다시 시뮬레이션을 해보고 평가 리포트를 작성한다. 가능한 모든 시나리오에 대한 알고리즘 적용 시뮬레이션, HiL, SiL, MiL 각각의 루프 체인을 전개한다. 모든 요소에 대한 품질 평가 단계를 거치면, 백업 관리, 디제스터 리커버리 단계를 거쳐 최종 양산에 들어가게 된다.

델 EMC 솔루션의 직접적인 지원이 미치지 않는 영역, 예를 들어 레코딩 플래닝, 컨텍스트 레이블링과 같은 부분 역시 알트랑(Altran)과 같은 회사가 지원을 한다.

“델 EMC의 스토리지 솔루션 아이실론(Isilon)이 지원하는 전체 과정을 5가지로 압축 설명할 수 있습니다. 테스트 카가 필드 테스트를 하고 나면 데이터센터에서 아이실론을 통해 데이터 취합이 이뤄집니다. 데이터 양은 시간당 6테라바이트입니다. 또 데이터 인리치먼트와 레이블링 과정이 있습니다. 레이블링은 이미지 상에서 신호등, 차량, 사람 등 오브젝트로 인식되는 모든 것에 대한 매뉴얼 작업을 말합니다. 그 다음 가지고 있는 데이터를 적용하고자 하는 테스트 케이스를 정의하고, HiL, SiL 플랫폼에 대해 기록 데이터를 적용합니다. 마지막으로 실측 데이터를 가지고 딥러닝 환경에서 머신러닝 등을 고도화하는 작업을 하고 아카이빙, 디제스터 리커버리를 어떻게 할 것인지를 정립합니다.” 바우만 CTO가 설명했다.


ADAS 개발 라이프사이클과 아이실론


데이터 레이크와 아이실론       
   
델 EMC는 ADAS, 자율주행의 테스트 및 검증 프로세스의 복잡성을 지원하는 데이터 레이크 모델을 지원한다. 여기서 센트럴 데이터 레이크는 데이터 매니지먼트 시스템과 연결돼 전체 데이터 매니지먼트 시스템의 브레인 역할을 한다. 이것은 어떤 데이터가 어디에 있는지 모든 것을 파악한다. 따라서 개발자는 언제 어디서나 모든 데이터에 쉽게 액세스해 필요한 개발과정을 진행할 수 있다.


데이터 레이크와 원격 지원

이런 데이터 레이크 구조를 실현하기 위해 델 EMC는 스토리지 솔루션을 제공한다. 델 EMC의 아이실론 스토리지는 효율성과 대규모 확장성을 갖춘 시스템을 통해 비정형 데이터를 저장, 관리, 보호한다. 특히 뛰어난 성능과 대규모 확장성을 제공해 AI 혁신을 더 빠르게 달성할 수 있도록 돕는다. 까다로운 엔터프라이즈 파일 워크로드를 지원하도록 설계된 업계 1위의 스케일 아웃 NAS 제품이다.

장점을 요약하자면, ▶데이터 환경 규모에 상관없이 관리 용이 ▶80% 이상의 활용도 및 자동화된 계층화를 통한 비용 절감 ▶수십 테라바이트에서 수십 페타바이트까지 확장 ▶멀티 프로토콜 지원을 통한 운영 유연성 증대 등이다.

“델 EMC 이전 회사에서 아이실론을 사용했는데, 그 경험으로 볼 때 아이실론의 강점 중 하나는 멀티스트리밍이 가능하다는 것입니다. HiL, SiL 등 개발자 각자의 개발 과정에게 발생하는 수많은 스트리밍을 잘 처리하는 것이 중요한데, 아이실론은 이것을 처리하는데 최적화된 솔루션입니다. 독일의 개발자가 본인의 알고리즘에 대해 러닝 프로세스를 하고 싶을 때, 한국, 미국, 일본의 데이터 레이크에 있는 데이터를 쓰고 싶으면 알고리즘을 실행시킬 수 있는 코딩을 만들어 데이터 매니지먼트 시스템에 던지기만 하면 자동으로 태스크가 모두 이뤄집니다. 데이터는 글로벌하게 분산돼 있지만 언제 어디서나 원하는 데이터를 쉽게 쓸 수 있는 것입니다.”
 
바우만 CTO가 소개한 아이실론 F800은 올 플래시 NAS(Network Attached Storage)로 까다로운 고성능 컴퓨팅, 4K 스트리밍, 인터랙티브 분석 워크로드에 이상적이다. 리소스 사용률을 최적화하기 위해 스토리지 자동 계층화 기능이 제공되며, 이를 통해 액세스 빈도가 낮은 데이터를 다른 아이실론 시스템 또는 클라우드로 계층화할 수 있다. 섀시 당 최대 250,000 IOPS 및 15GB/s 대역폭을 제공한다. 선택하는 SSD 드라이브 용량에 따라 올 플래시 스토리지 범위는 섀시 당 96~924TB다. 고객은 다양한 센서 데이터에 대한 프로토콜을 동시 지원해 Hadoop, SMB 어떤 영역으로 가더라도 데이터를 이동하거나 시스템을 새로 구축할 필요가 없다.


델 EMC의 플로리안 바우만 CTO는 얼마 전까지 독일 OEM에 대한 ADAS 제품 공급을 맡은 티어 1 테크니컬 디렉터였다. 전반적인 워크플로우를 총괄했다. 델 EMC는 자율주행 알고리즘을 개발하는 볼보와 바이오니어(Vioneer)의 조인트벤처인 제뉴이티(Zenuity)의 전략적 파트너로 선정되는 등 여러 기업의 자율주행 기술 및 미래 차량 플랫폼 연구개발을 지원하고 있다. 

“AI를 지원하려면 성능이 높아야 합니다. 지금 해결책은 SSD지만 비용이 문제입니다. 용량을 보면 티어 1의 경우 OEM과의 계약에 따라 30년까지 데이터를 보관해야할 수도 있습니다. 이런 것을 모두 SSD에 둘 수는 없습니다. 이에 델 EMC는 데이터를 용도에 맞게 티어링해 줄 수 있는데, 이것이 아이실론만 갖고 있는 특화된 기능 중 하나입니다. 델 EMC가 제공하는 시스템으로 고객이 5테라바이트로 시작했다면 그 다음은 필요한 만큼 로드를 추가하며 확장할 수 있습니다. 또 델 EMC 시스템 상에서 데이터 안정성, 정합성을 높게 확보할 수 있습니다. 자동차 산업에서 이같은 개발은 데이터가 가장 중요한 부분이기 때문에 확장성이 중요합니다. 데이터가 늘어남에 따라 성능도 같이 늘어나는 100% 스케일아웃 구조를 가져야만 시스템이 중단되거나 성능이 떨어지는 경우가 없습니다.” 바우만 CTO가 말했다.


 
 

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>

PDF 원문보기

본 기사의 전문은 PDF문서로 제공합니다. (로그인필요)
다운로드한 PDF문서를 웹사이트, 카페, 블로그등을 통해 재배포하는 것을 금합니다. (비상업적 용도 포함)

  • 100자평 쓰기
  • 로그인


TOP