Deep Learning-based Solutions for the Automotive Industry
자동차 산업 위한 딥러닝 기반 솔루션
2021년 07월호 지면기사  / 글 | 김슬기 마케팅 스페셜리스트, 코그넥스코리아



OCR에 대한 새로운 딥러닝 기반 접근 방식은 불필요한 레이블링을 제거하고 노이즈가 매우 심한 배경에서 문자를 정상적으로 판독하여 학습 및 개발 시간을 단축해준다. 코그넥스 ViDi 블루-판독 툴은 변형된 문자를 쉽게 찾아 판독한다. 판독 소프트웨어를 학습시키기 위해 엔지니어는 차대 번호 문자 모음이 들어있는 이미지의 관심 영역을 정의한다. 그리고 블루-판독 툴의 사전 학습된 모든 문자 인식 기능은 반짝임과 대비로 인한 불분명한 문자까지 인식해낸다. 소프트웨어 학습과 검증을 진행하는 동안, 검사 담당자는 소프트웨어의 모델이 모든 문자를 정확하게 식별할 때까지 누락된 문자만 다시 레이블링하면 된다. 

글 | 김슬기 마케팅 스페셜리스트, 코그넥스코리아





딥러닝은 기존에 다루기 어려웠던 영상, 텍스트, 음성과 같은 비정형 데이터에서도 높은 수준의 인식 성능을 보여주는 매력적인 기술이다. 등장 초기에는 과도한 컴퓨팅 자원을 요구한다는 점을 지적받았지만, 최근에는 경량화되고 최적화된 알고리즘의 등장으로 충분히 산업에 도입될 수 있을 수준으로 현실성 있는 기술이 되었다.

하지만 딥러닝 기술은 고객이 새로 도입하기에는 큰 비용과 높은 불확실성을 가지고 있다. 기존의 인력을 교육하고, 새로운 연구 인력을 투입하고, 데이터 수집 및 실험과 검증까지 엄청난 비용이 소요되기 때문이다. 게다가 이러한 투자가 더 나은 결과를 보여준다는 보장도 없다. 그래서 많은 제조업체들은 딥러닝 기술 기반 머신비전(Machine Vision) 솔루션의 지원을 받는다.


머신비전과 딥러닝 

머신비전은 카메라를 통해 획득한 영상으로부터 정보를 얻고 이를 활용해 산업 과정을 자동화하는 기술이다. 머신비전에서 가장 중요한 과정 중 하나는 영상 데이터로부터 필요한 정보를 추출하는 것인데, 그러기 위해서는 영상에서 원하는 사물을 찾고, 인식하고, 분류하는 알고리즘이 필요하다. 그러나 복잡한 영상 데이터에 규칙기반(rule-based) 알고리즘을 적용하기는 쉽지 않다.

그렇기에 최대한 제어된 환경에서 영상을 촬영하고, 환경에 맞는 특징 추출 알고리즘을 사람이 설계하곤 한다. 이를 극복하기 위해 다양한 특징 추출 알고리즘이 등장했지만, 대부분 현장에서는 여전히 알고리즘을 조금씩 수정하고 실험하는 과정을 반복하고 있다. 이 과정은 엄청난 인적자원을 요구하면서도 환경과 대상이 달라지면 성능이 급격히 나빠진다는 단점이 있다. 즉, 알고리즘의 재사용성이 매우 떨어진다.
이러한 한계로 인해 여전히 머신비전은 그 이름이 무색하게 많은 부분을 엔지니어와 검사 인력에게 의지하고 있다. 이에 코그넥스는 머신비전이 직면한 이런 문제를 딥러닝을 통해 해결할 수 있다고 제안한다.

실제로 딥러닝은 등장과 동시에 다양한 분야에서 새로운 가능성을 제시했다. 그 중 컴퓨터 비전 분야에서 단연 돋보이는 혁신을 보였다. 크고 복잡한 영상 데이터에서 필요한 특징을 추출하고, 이를 통해 고차원의 패턴을 학습하는 과정이 사람의 손을 거치지 않고 이루어지기 때문이다.

컨볼루션 신경망(Convolutional Neural Network)은 인접한 픽셀로부터 상관관계를 도출하고, 이 과정을 반복해 유의미한 패턴을 추출하는 필터를 학습한다. 기존에는 사람이 손수 설계하던 필터를, 컨볼루션 신경망은 데이터 기반으로 스스로 찾아간다. 그리고 그 성능은 대부분 딥러닝의 완승이었다.



딥러닝 도입의 어려움과 문제 해결 

앞서 딥러닝의 장점을 설명했지만, 실제 현장에 도입한 사례는 생각보다 많지 않다. 이는 높은 초기 투자 비용과 그에 대비되는 높은 불확실성에 있다. 딥러닝을 기존 머신비전 시스템에 도입하기 위해서는 교육과 채용, 연구개발을 위한 시간 그리고 제품 적용에 필요한 테스트와 최적화가 필요하다. 새로운 기술을 도입한다는 것 자체만으로도 기업 입장에서 큰 부담이기 때문에 수많은 데이터를 필요로 하고 불확실하다면 투자의 부담감은 배가 될 수밖에 없다.

우선, 딥러닝 도입을 위한 과정은 다음과 같다. 

첫 번째 단계는 데이터 수집 및 관리다. 딥러닝 모델의 성능을 높은 수준으로 이끌어 내려면 많은 데이터가 필요하다. 하지만 많은 데이터를 수집하고 전처리하는 작업은 그 수가 많아질수록 난이도가 기하급수적으로 증가한다.

두 번째 단계는 데이터 레이블링이다. 수집된 데이터는 도메인 지식을 가진 인력을 동원해 정확히 레이블링되어야 한다. 데이터가 많아지고 복잡할수록 레이블링하고 관리하는 일 자체가 엄청난 인력을 요구하며, 경우에 따라 전용 툴의 개발이 불가피하다.

세 번째로, 모델을 설계하고 실험해야 한다. 전문 인력을 통해 딥러닝 실험을 수행할 수 있도록 환경을 구축하고, 방법론에 대한 연구와 실험을 반복해야 한다. 그 다음으로, 모델 비교와 분석이 필요하다. 학습한 모델들을 관리하고 성능을 비교하거나, 모델의 성능 향상을 위해 추가적인 분석을 할 때에도 관련 지식을 가진 전문 인력이 필요하다.

마지막으로, 제품의 적용이 필요하다. 앞선 과정이 마무리되어 성능 좋은 모델을 완성했다고 해도 문제는 끝나지 않는다. 기존 머신비전 시스템에 새로운 딥러닝을 도입할 수 있도록 환경을 구축해야 하며, 사용하는 환경에 맞게 소프트웨어적인 최적화가 필요하다. 이 과정에서 기존 엔지니어들도 딥러닝에 대한 이해를 해야한다는 추가적인 비용이 발생한다.




딥러닝을 도입하는 과정 



위의 과정들은 교육, 채용, 환경 구축 및 개발에 많은 비용과 시간을 필요로 한다. 만족할 수준으로 기술을 고도화하는 데에는 작지 않은 투자가 필요한 셈이다. 이런 점들이 많은 기업들의 기술 도입 의지를 저해한다.

이러한 딥러닝 도입 과정에서 공통적으로 필요한 부분을 하나의 솔루션으로서 제공하고, 최소한의 이해만으로 바로 사용할 수 있도록 추상화한다면 앞선 문제들을 상당 부분 해결할 수 있다. 그리고 이러한 솔루션이 압도적인 성능을 보여준다면, 기업 입장에서는 저비용, 고효율 제품이 될 것이다. 그리고 이 점이 바로 코그넥스 딥러닝랩이 제품을 개발하는 철학이다.

딥러닝 기술을 효과적으로 기존 머신비전 시스템에 도입하여 문제를 해결하기 위해서 다음 세 가지 사항을 고려해야 한다.

첫째, 간단한 GUI 툴을 통해 사용자가 대용량 데이터를 손쉽게 관리할 수 있게 해야 한다. 복잡한 레이블링과 전처리도 손쉽게 수행할 수 있고, 클릭 몇 번으로 고성능의 딥러닝 모델을 학습할 수 있다. 그리고 이렇게 학습한 모델들을 비교/분석할 수 있는 툴까지 제공한다. 학습된 모델은 파일의 형태로 내보낼 수 있고, 이 모델 파일과 소프트웨어 개발 키트를 사용하면 곧바로 인식시스템을 구현할 수 있다.

둘째, 간단하고 강력한 소프트웨어 개발 키트를 통해 일반적인 머신비전 라이브러리 정도로 추상화된 API(Application Programming Interface)를 제공해야 한다. 이 간단한 API를 사용해 학습된 모델을 불러오는 것만으로 엔지니어는 고성능의 영상인식 시스템을 구현할 수 있다. 딥러닝을 적용하기 위해 수많은 라이브러리나 프레임워크를 별도로 설치하고 관리할 필요가 없어지는 것이다.

마지막으로, 유저 친화적인 UI/UX의 내부에는 고도의 딥러닝 알고리즘 기술 역시 필요하다. 유저의 입장에서 딥러닝이 가지는 불확실성을 최소화하고 최고의 효용을 얻을 수 있는 가장 중요한 요소이기 때문이다. 



딥러닝 기반 차량 제조 솔루션:
차대 번호(VIN) 검사        


자동차 제조 산업에서 딥러닝이 적용된 머신비전은 잘못된 부품 위치, 복잡한 외관 검사, 분류 작업 및 까다로운 OCR(Optical Character Reader/Recognition) 애플리케이션에 적합하다.

자동차 제조 과정 중, 제조업체는 정상적인 이력 관리를 위해 차대번호를 찾아 판독해야 한다. 차대 번호(VIN)는 차량의 고유 식별자로 사용되는 코드이며 여러 문자로 구성되어 있다. 차대 번호에는 문자와 숫자가 포함되며, DPM(Direct Part Marked)이 금속판에 에칭 또는 기재되거나 스티커에 인쇄되어 있을 수 있다. 이를 머신비전으로 검사할 때, 반사광, 도장색, 반짝임 등이 비전 시스템으로 문자를 찾고 인식하는 데 어려움을 유발한다. 검사 시스템은 이렇게 이미지 형성에 문제가 되는 반사성 표면을 용인하여 문자를 정상적으로 판독해야 한다는 과제가 있다.

이런 과제를 해결하기 위한 솔루션으로 코그넥스 ViDi 블루-판독 툴은 변형된 문자를 쉽게 찾아 판독한다. 이러한 판독 소프트웨어를 학습시키기 위해 엔지니어는 차대 번호 문자 모음이 들어있는 이미지의 관심 영역을 정의한다. 그리고 블루-판독 툴의 사전 학습된 모든 문자 인식 기능은 반짝임과 대비로 인한 불분명한 문자까지 인식해낸다. 소프트웨어 학습과 검증을 진행하는 동안, 검사 담당자는 소프트웨어의 모델이 모든 문자를 정확하게 식별할 때까지 누락된 문자만 다시 레이블링하면 된다. OCR에 대한 이 새로운 딥러닝 기반 접근 방식은 불필요한 레이블링을 제거하고 노이즈가 매우 심한 배경에서 문자를 정상적으로 판독하여 학습 및 개발 시간을 단축해준다.



코그넥스_VIN검사       



<저작권자 © AEM. 무단전재 및 재배포, AI학습 이용 금지>

PDF 원문보기

본 기사의 전문은 PDF문서로 제공합니다. (로그인필요)
다운로드한 PDF문서를 웹사이트, 카페, 블로그등을 통해 재배포하는 것을 금합니다. (비상업적 용도 포함)

  • 100자평 쓰기
  • 로그인



TOP