IC Verification Solution for the SDV Era: Veloce™ CS
SDV 시대의 IC 검증 솔루션 Veloce™ CS
업계 최초 에뮬레이션, 엔터프라이즈 프로토타이핑, SW 프로토타이핑 통합
2024년 03월호 지면기사  / 한상민 기자_han@autoelectronics.co.kr



소프트웨어 정의 자동차가 전개되고 오토모티브 일렉트로닉스 비중이 증대되며 OEM과 대형 티어도 소프트웨어 개발 및 반도체 설계에 막대한 리소스를 투자하며 자체 SOC를 개발하고 있다. 이런 가운데 지멘스 EDA는 최신 반도체 프로토타이핑 및 검증 시스템 ‘Veloce™ CS’를 출시했다. Veloce™ CS는 일관성, 모듈성, 특히 속도를 제공해 4,000만 개 게이트부터 최대 400억 개 이상 게이트를 통합하는 대규모 설계를 매우 빠르고 안정적으로 수행하면서 검증 주기당 비용을 절감토록 한다. 

글 | 한상민 기자_han@autoelectronics.co.kr









“만일 자동차 회사가 직접 첨단 운전자 지원 시스템(ADAS) 칩을 만든다면 삼성의 엑시노스 같은 규모는 아니지만, 프로토타이핑을 위해 최소 2개의 에뮬레이션용 Veloce™ Strato CS, 5개의 엔터프라이즈 프로토타이핑을 위한 Veloce™ Primo CS, 소프트웨어 프로토타이핑을 위한 Veloce™ proFPGA CS 100개 등 400억 원 이상 투자가 요구됩니다.” 
반도체 프로토타이핑 및 검증이 자동차 산업과도 깊이 연관되기 때문에 던진 질문에 지멘스 EDA가 답했다.
 
4월 25일 지멘스 EDA는 최신 반도체 프로토타이핑 및 검증 시스템 ‘Veloce™ CS’를 출시했다. 지멘스 EDA는 업계 최초로 하드웨어 검증에 대한 ▶에뮬레이션(Veloce™ Strato CS) ▶엔터프라이즈 프로토타이핑(Veloce™ Primo CS) 솔루션과 소프트웨어 검증에 대한 ▶소프트웨어 프로토타이핑(Veloce™ proFPGA CS) 솔루션을 모두 제공하기 시작했다. 
Veloce™ CS는 일관성(congruency), 모듈성, 특히 속도를 제공해 4,000만 개 게이트부터 최대 400억 개 이상 게이트를 통합하는 대규모 설계를 매우 빠르고 안정적으로 수행하면서 검증 주기당 비용을 절감토록 한다. 



반도체 중심 밸류체인

소프트웨어가 모든 것을 정의하는 시대다. 소프트웨어가 아키텍처와 제품 자체를 정의한다. 자동차면, 모빌리티, 자율주행과 같은 서비스와 기능에 대한 것이다. 소프트웨어 정의 자동차(SDV)가 전개되고 오토모티브 일렉트로닉스 비중이 증대되며 자동차 밸류체인은 반도체 중심으로 극적인 변화를 겪고 있다. 
반도체는 전통적으로 퀄컴과 같은 회사가 칩 설계를 하고, 시스템 하우스들이 설계된 칩을 기반으로 시스템을 빌드하는데, 요즘은 아마존, 마이크로소프트, 구글과 같은 시스템 하우스들이 특정 애플리케이션 목적에 맞게 ‘직접’ 목적형 SOC를 만들고 있다. 자동차 OEM과 대형 티어도 마찬가지로 소프트웨어, 반도체 중심 밸류체인을 강력히 통제하기 위해 소프트웨어 개발 및 반도체 설계에 막대한 리소스를 투자하며 자체 SOC 개발에 나섰다. 

트렌드는 AI와 머신러닝(ML), 하이퍼스케일(Hyperscale)과 함께 전개되고 있다. 22%의 연평균 성장률(2023~2030)을 보이는 AI/ML 시장에서는 NVIDIA나 AMD와 같은 전통적 기업 외에 신생 스타트업이 대거 출현했고, 하이퍼스케일은 연 28%로 AL/ML보다 더 빠른 성장을 보이고 있다. 데이터센터 경쟁도 마찬가지다. 설계 규모가 커지고 소프트웨어 워크로드가 상당해지면서 캐퍼시티와 ‘속도’, 생산성 때문에 이 모든 것을 지원하는 에뮬레이션과 프로토타이핑의 중요성이 커졌다.

지멘스 인더스트리 소프트웨어의 비제이 초비사(Vijay CHobisa) 선임 이사는 “칩 설계는 이같은 트렌드와 함께 갈수록 커지고 복잡해지고, 워크로드도 복잡하고 많은 시간을 필요로 하고 있습니다. 때문에 설계 검증에도 많은 도전이 발생하고 있는데, 고객은 여러 하드웨어, 소프트웨어, 시스템을 설계하면서 원하는 기능이 잘 구현되길 바라는 동시에 최적화된 성능과 저전력과 같은 목표를 주어진 예산과 시간 안에 해결해야만 합니다”라고 말했다.  







에뮬레이션과 프로토타이핑    

예를 들어, AMD와 같은 회사는 SOC 소프트웨어, 하드웨어를 검증할 때 올바른 툴을 사용해야 한다면서 ▶에뮬레이션 ▶엔터프라이즈 프로토타이핑 ▶소프트웨어 프로토타이핑의 세 가지 티어에 대한 비전을 제시하고 있다. 

에뮬레이션은 설계, 검증 과정의 초기부터 해야한다. 즉, 설계 브링-업(bring-up)과 이터레이션(iteration)을 위한 매우 빠른 컴파일링이 중요하다. 또, 생산성을 높이기 위한 완전한 가시성, 빠른 가시성 확보로 에뮬레이션 단계에서 시스템 레벨의 전력, 성능 분석을 해야 한다. 단순 에뮬레이션을 통해 설계 검증만 하는 것이 아니라, 기능안전성, 전력, 성능 검증을 포함하는 종합적인 유즈 모델을 사용해야 한다. 

엔터프라이즈 프로토타이핑은 에뮬레이션과 기존 프로토타이핑을 결합해 강화된 디버깅 기능, 대용량 및 고성능, 다양한 주변 장치 및 자극과 상호작용할 수 있는 기능을 갖춘 솔루션을 제공하는 단계로, 초기에 펌웨어와 임베디드 소프트웨어에 대한 검증 작업 등을 수행한다. 초기부터 에뮬레이션 작업을 하면서 환경이 안정되고 컴파일링을 매일 할 필요가 없어지면 엔터프라이즈 프로토타이핑 단계로 넘어간다.  

“반도체 설계에 대한 검증을 위해 올바른 툴 사용은 어떻게 할까요? 에뮬레이션 단계에서 디버깅 작업을 했고 가시성을 확보했다면 이것을 재빨리 엔터프라이즈 프로토타이핑으로 가져와 매우 상세하게 이를 활용하도록 ‘일관성(congruency)’을 유지하는 것이 중요합니다. 엔터프라이즈 프로토타이핑 작업을 하다가 더 상세하게 디버깅해야 할 경우 에뮬레이션으로 가고, 에뮬레이션을 하다가 뭔가 프로토타이핑이 필요한 경우 엔터프라이즈 프로토타이핑으로 가는 것입니다. 그런 결과 고객은 에뮬레이션 대비 엔터프라이즈 프로토타이핑 단계에서 달러당 더 높은 처리량을 확보할 수 있습니다.”

이 두 단계를 거쳐 소프트웨어 프로토타이핑 단계로 가 시스템 레벨에서 소프트웨어를 검증한다. 소프트웨어 프로토타이핑은 극 초기 IP 레벨부터 시작해 마지막인 시스템 레벨의 소프트웨어까지 전체적인 라이프사이클을 아울러야 한다. 따라서 이 단계는 매우 빠른 인터페이스를 통해 시스템 행태에 대한 가시성 확보 작업이 중요하다. 

지멘스는 이에 대해 Veloce™ Strato CS, Veloce™ Primo CS, Veloce™ proFPGA CS로 구성된 Veloce™ CS 시스템을 론칭했다. ▶목적형 가속기 CristalX에 기반한 Veloce™ Strato CS는 에뮬레이션을 위한 제품으로 이전 세대 대비 퍼포먼스가 5배나 향상됐다. 즉, 소프트웨어를 실행하거나 워크로드를 실행할 때 5배 더 빠르게 작업을 실행할 수 있다. 지멘스 EDA는 적합한 펌웨어와 소프트웨어 확보를 목표로 하는 ▶엔터프라이즈 프로토타이핑 측면에서 AMD VP1902 FPGA에 기반의 Veloce™ Primo CS를 론칭했다. Veloce™ Primo CS는 Veloce™ Strato CS 대비 성능에서 5배 개선 효과가 있다. 에뮬레이션 작업을 하다가 환경이 안정될 경우 Veloce™ Strato CS를 통해 프로토타이핑 작업을 하면서 5배 더 빠르게 성능을 끌어올릴 수 있다. ▶시스템 레벨의 소프트웨어 프로토타이핑에선 AMD VP1902 FPGA 기반 Veloce™ proFPGA CS를 출시했다. 이전 세대 대비 성능이 2배 개선됐다. 







“자일링스가 AMD를 인수하면서 독점성 없이 활용할 수 있게 됐는데, 지멘스 EDA가 이에 빠르게 대응하면서 3개 하드웨어 플랫폼을 동시 제공하는 최초의 벤더가 됐습니다. 경쟁사들은  엔터프라이즈 프로토타이핑과 소프트웨어 프로토타이핑 솔루션은 있지만 에뮬레이션 기능은 제공을 하지 못하거나, 에뮬레이션과 엔터프레이즈 프로토타이핑은 제공하지만 소프트웨어 프로토타이핑을 제공을 하지 못하고 있습니다.” 초비사 선임 이사가 말했다. 


 



CrystalX와 VP1902      
CrystalX와 VP1902 칩은 지멘스 EDA에게 상당히 중요한 의미가 있다. CrystalX는 지멘스 EDA가 직접 설계하고 개발한 칩으로, 에뮬레이션을 목적으로 하는 목적형 SOC다. 이 칩은 에뮬레이터를 위한 ▶매우 빠른 디자인 브링-업과 이터레이션을 위한 빠른 예측성 확보 ▶최고의 디버깅 성능 ▶용량이나 퍼포먼스에는 영향을 미치지 않는 칩, 시스템 혹은 블레이드 간 연결성을 제공한다. AMD VP 1902 Adaptive SOC는 로직 집적도가 2배 개선됐고 자일링스의 이전 세대 칩 대비 디버깅 성능이 8배 더 빨라졌다. SLR에서도 개선이 이뤄지며 라우팅과 연결성 성능이 훨씬 더 향상됐다. 
 



왜 바꿔야 하나     

HPC 시장을 보면, 매우 확장성 크고 인터커넥트된 ‘블레이드 시스템’으로 전환하고 있다. Veloce™ CS는 에뮬레이션 작업을 지원하고 프로토타이핑을 지원하기 위해 하드웨어 아키텍처에서 연결성 높은 모듈러 형태의 블레이드 시스템으로 전환했다.

초비사 선임이사는 “과거에는 에뮬레이션 작업이나 프로토타이핑을 할 때 상당히 커다란 섀시를 활용했지만, 지멘스 EDA는 블레이드를 사용하고 있습니다. 더 많은 용량이 필요하거나 사용자 수가 늘 경우 블레이드를 더 넣어 원하는 대로 구현할 수 있습니다. 게다가 Veloce™ CS는 배출량과 전력소비 등 모던한 최신 데이터센터의 요건도 충족합니다”라고 말했다.







Veloce™ Strato CS는 Primo CS와 함께 고려돼야 한다. 이는 이 두 가지를 한꺼번에 사용했을 때 가장 높은 생산성을 얻을 수 있기 때문이다. 목적형 가속기 CristalX에 기반한 Veloce™ Strato CS는 2021년 출시된 Veloce™ Strato+ 대비 게이트 캐퍼시티가 4배, 퍼포먼스 5배, 디버깅 처리량이 5배 높아졌다. 최대 400억 개 게이트를 가진 설계를 지원할 수 있고 모듈성도 매우 뛰어나다.
고객은 1개 블레이드에서 (4개 블레이드 = 1모듈, 4개 모듈 = 1타워) 최대 256개(16타워)의 블레이드를 구매해 400억 개 게이트를 지원할 수 있다. 지멘스 EDA 자체 CrystalX 칩을 기반으로 하고 있어 매우 빠르고 결정론적인 컴파일 작업을 할 수 있고 CO-MODEL 채널 기술과 함께 상당히 압축적이면서 빠른 디버깅 작업을 할 수 있다.AMD VP1902 FPGA에 기반한 Veloce™ Primo CS는 이전 세대 대비 게이트 용량이 4배, 퍼포먼스가 5배 높아졌다. 디버깅 스루풋은 50배 높아졌다.

Veloce™ Primo CS 역시 최상위 성능과 캐퍼시티를 보여줘 400억 개 게이트까지 지원할 수 있다. 에뮬레이션 작업과 엔터프라이즈 프로토타이핑 간 상당히 일관성 있게(congruent) 왔다 갔다 할 수 있어 최고의 생산성을 구현할 수 있다. 무선 컨피규레이션으로 안정성도 크게 높인다. 특히 사용자가 원하는 FPGA에 연결함으로써 싱글 FPGA 세분성(granularity)까지 지원할 수 있어 효율성을 극대화한다. 

“두 시스템은 100% 일관성을 보입니다. 왜냐면 동일한 R&D 팀에서 설계, 개발했기 때문입니다. 하드웨어적으로 봤을 때 Veloce™ Strato CS와 Primo CS는 상당히 유사해 블레이드, 모듈, 타워도 같습니다. 차이는 Veloce™ Strato CS가 자체 CrystalX 가속기 칩을 기반으로 하는 점입니다. 소프트웨어도 RTL 컴파일러, 신서시스, 런타임, 디버그 등이 같습니다. 차이는 칩과 관련한 PnR에 있습니다. 요약하면, 하드웨어나 소프트웨어 아키텍처 측면에 있어 매우 유사해 양자 간 매우 빠르게 이동할 수 있고, 고객은 두 가지에 모두 투자했을 때 생산성을 6 ~ 10배 올릴 수 있다는 것입니다.”







한편, 지멘스 EDA는 2021년부터 기업 인수를 통해 소프트웨어 프로토타이핑 솔루션 Veloce proFPGA를 제공하고 있다. 최신 Veloce™ proFPGA CS는 이전 대비 게이트 용량 2배, 퍼포먼스 2배, 디버그 처리량이 50배 개선됐다. 소프트웨어 엔지니어는 퍼포먼스를 최우선시한다. 그렇기 때문에 그들은 이 제품을 통해 퍼포먼스를 최적화하고 멀티 FPGA를 이행할 수 있다. 최대 100MHz까지 빠르게 작업할 수 있다.

초비사 선임이사는 “Veloce™ proFPGA CS는 상당히 유연해 사용자가 케이블을 바꿔보고, 클록 작업, 파티셔닝 작업 등을 유연성 있게 하면서 최고의 생산성을 달성할 수 있습니다. 게다가 진입비용도 낮습니다. 최초 단일 FPGA를 구매해 시작하다가 블레이드로 넘어가고 멀티 블레이드까지 확장할 수 있습니다”라고 말했다.  

지멘스는 이 제품에서 싱글 FPGA의 Uno와 4개 FPGA의 Quad 데스크톱은 물론 블레이드와 멀티 블레이드로 데이터센터 환경 프로토타이핑까지 지원한다. 데이터센터처럼 설계가 큰 경우는 블레이드 구성으로 6개 FPGA를 넣을 수 있다. 1개 타워는 10개 블레이드, 총 60개 FPGA를 지원한다. 3개 타워를 구성하면 총 180개 FPGA를 지원한다. 

“경쟁사의 경우 하드웨어만 제공하지만, 지멘스 EDA는 이런 작업을 위한 소프트웨어도 함께 지원하기 때문에 고객은 원하는 환경을 가져와 구현할 수 있고, 그 결과 높은 효율성으로 컴파일링 할 수가 있고 멀티 FPGA 파티셔닝을 자동화된 방식으로 할 수 있습니다. 타이밍 기반 퍼포먼스 최적화, 매우 정교하고 빠른 디버깅 작업을 할 수 있습니다.”



포괄적인 지원 

지멘스는 칩 검증 프로토타이핑을 위한 포괄적인 포트폴리오를 제공한다. 
에뮬레이터는 ‘시프트-레프트 방법론’과 유사하게 검증 주기 초반에 매우 일찍 활용된다. 블록 수준 및 IP 수준의 검증을 위해 UVM 가속화 또는 SystemC 기반 가속화를 위한 Transactor와 최적화된 라이브러리 등을 제공한다. 고객이 SOC 수준 유효성 검사에 준비되면 가상 랩 환경과 물리적 장치를 연결해 시스템 수준 검증 및 유효성 검사를 가상 랩에서 수행할 수 있는 IC 환경을 제공한다. 

초비사 선임이사는 “지멘스는 약 10년 전부터 데이터센터 규정을 준수하기 위해 가상 모델을 구축했다는 점을 강조하고 싶습니다. 지멘스는 가상 랩 기반 환경을 제공하는 선도업체로 PCI Express, CXL, 이더넷 및 USB와 같은 모든 표준 프로토콜에 대한 가상 랩 모델을 보유하고 있는데, 경쟁사들은 현대적인 데이터센터와 호환되는 가상 랩 기반 환경을 제공하는 데 크게 뒤처져 있습니다. 다른 측면으로는, 설계의 기능적 정확성 검증이 중요하다는 점을 강조하고 싶습니다. 전력, 성능 분석, 기능안전성, 시험 설계, 소프트웨어-하드웨어 공동 유효성 검사 및 커버리지와 어서션과 같은 다른 중요한 것이 있고, 지멘스 EDA는 이런 특정 작업을 실행하기 위한 정교하고 차별된 앱을 제공합니다”라고 말했다.







마지막으로, 에뮬레이터 및 프로토타이핑 제품 자체, 유지보수 비용은 매우 크지만, Veloce™ CS는 매우 효율적인 제품이 될 수 있다. 특히 공랭식이어서 에너지 효율성이 높고 10억 게이트 당 10kW를 지원한다. 경쟁사는 10억 게이트 당 전력소비가 60 ~ 70kW다. 이것이 비용으로 반영될 수 있고, 특히 데이터센터같이 곳에서는 커다란 이점이 될 수 있다. 게다가 Veloce™ CS는 데이터센터와 완벽하게 호환되기 때문에 별도의 조정이 필요하지 않다.



AEM_Automotive Electronics Magazine


<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>

PDF 원문보기

본 기사의 전문은 PDF문서로 제공합니다. (로그인필요)
다운로드한 PDF문서를 웹사이트, 카페, 블로그등을 통해 재배포하는 것을 금합니다. (비상업적 용도 포함)

  • 100자평 쓰기
  • 로그인



TOP