MS, 인포테인먼트 시스템 간소하고 자연스럽게
2010년 04월호 지면기사  / 글│한 상 민 기자 <han@autoelectronics.co.kr>

운전 중 듣고 싶은 곡을 찾기 위해 운전자들은 보통 왼손으로 스티어링 휠을 잡은 상태에서 오른손을 이용하고, 때론 몸을 기울여 센터 스택에 장착된 카스테레오의 버튼을 이리저리 눌러야 할 것이다. 모바일폰 벨이 울린다면 핸즈프리 헤드셋을 이용해야 하는데, 헤드셋을 운전 중에 장착해야 할지도 모른다. 차에서 즐기거나 해야 할 일이 많아지면서 운전 부주의를 유발하는 요인들 또한 증가하고 있다. 운전자들의 급제동 빈도는 갈수록 늘고 있다. 

그러나 이같은 역작용을 해소하기 위한 노력 또한 활발히 전개되고 있다. 차는 사람에 맞춰져 가고 있다. 자동차 메이커들은 단순히 수납 공간을 추가 확보하거나 시트의 안락함, 탑승과 하차 시의 편리를 고려하는 데에서 시계, 조작성, 거주성 등 인체 모델에 따른 인간공학적 설계, 고령자 대응 차 개발이나 유니버셜 디자인 등의 다양한 인간공학적 연구를 진행해 차에 반영해 가고 있다. 운전 부주의를 막기 위해 음성인식과 같은 신개념 사용자 인터페이스(Human Machine Interface, HMI)를 지속적으로 개발 상용화하고, 운전자의 인지적 한계와 관련한 운전부하 평가와 저감을 위한 연구도 수행하고 있다.
마이크로소프트 리서치(Microsoft Research)는 음성인식 기술을 이용해 카 메이커들의 혁신을 지원하고 있다. MS의 연구는 기본적으로 어떻게 하면 사람들이 보다 자연스럽고 안전한 방법으로 차에서 운전하면서 원하는 다른 일을 할 수 있을 지를 연구하는 것이다.


차에서 특별한 음성

마이크로소프트 리서치의 음성인식 부문 엔지니어들은 수년 전에 ‘커뮤트 UX (Commute UX)’라 불리는 인카 인포테인먼트 시스템의 인터랙티브 다이얼로그 시스템 개발 프로그램을 론칭했다. 목표는 자연어 음성 입력과 멀티모달 사용자 인터페이스 개발을 통해 보다 쉽고 효율적으로 음악을 플레이 시키거나 전화할 상대방 등을 찾게 하는 것이었다.
개발 팀의 한 관계자는 “만일 운전자가 탑승자에게 말하는 것처럼 시스템에게 말하게 된다면 운전자는 시스템 동작에 필요한 수백 가지의 명령어들을 기억할 필요가 없게 된다. 이 말은 즉, 운전자가 운전에 더 집중할 수 있고, 눈은 도로에 손은 스티어링 휠에 둘 수 있어 보다 안전해질 수 있다는 의미”라고 말했다.
음성기술 그룹은 커뮤트 UX 프로젝트의 가치를 매우 높이 평가한다. 음성기술은 반세기 동안 유망한 미래 기술로 주목받아 왔지만 산업화, 대중화로 이어지지는 못했었다. 이는 다양한 산업 분야에서 음성을 대신할 수 있는 소통 방식들이 존재했기 때문이다. 그러나 자동차에서는 전혀 달랐다.
한 관계자는 “자동차는 다른 분야와 차별된다. 어떤 소통 방식도 차에서 음성보다 안전할 수 없다. 때문에 자동차에서의 음성기술, 우리의 커뮤트 UX 프로젝트는 가치 있는 것”이라고 말했다.   
커뮤트 UX의 관련 하드웨어는 매우 단순하다. 최근의 차들이 장착하고 있는 마이크로폰이나 터치스크린, 그리고 스티어링 휠의 버튼 군과 같은 친근하지 않은 장치들을 포함하지 않는다. 개발 팀은 간소함이 운전 부주의를 최소화하는 핵심이라고 보고 이 명제 하에 사용자의 만족도를 극대화시킬 수 있는 시스템 개발을 원칙으로 세웠다.
커뮤트 UX에서 음성기술(Speech-enabled)은 눈과 손이 바쁜 운전 중 가장 주가 되는 자동차와의 소통 채널이다. 시스템은 멀티모달 인터페이스를 지향하고 터치스크린과 버튼 등을 추가하지만 이것은 운전자가 선호하는 몇몇 단축 기능 동작에만 활용된다.
음성은 차에서 가장 빈번히 사용되는 오디오의 곡 선택, 모바일폰의 통화 등에 이용된다. 특히 이들 태스크는 주소록과 같은 매우 광범위한 리스트들에서 필요한 것을 선택해 동작시키거나 브라우징 하기 때문에 음성이 최선의 입력 방식이 된다. 터치 등의 이용은 운전자의 선호도가 높은 간단한 동작에 대해 주행과 관련해 매우 자연스러운 때에만 사용하도록 한다.
MS의 한 관계자는 “우리는 통합 인터페이스 내에 음성기술을 통합시키는 일을 수행한다. 음성은 1만여 곡의 음악이나 500여 개의 주소록에서 원하는 것을 찾는 데에 매우 강력한 툴이다. 또 서너 가지의 옵션, 선택 사항이 있을 때 매우 효율적인 소통법이다. 이 두 가지 장점을 결합시켜 운전 부주의를 최소화할 수 있는 사용자 인터페이스를 개발하고 있다”고 말했다.


음성의 간소화

마이크로소프트가 자동차 메이커들과 공동 개발한 인포테인먼트 시스템들은 이미 포드, 피아트, 기아 등의 모델에 제공되고 있다. 커뮤트 UX는 이 시스템들의 간소화와 혁신을 빠르게 진행시킬 것이다. 
그동안 음성 시스템의 가장 큰 문제 중 하나는 빌트인 모델에서 운전자들이 원하는 정확한 기능의 동작, 답을 얻기 위해 반드시 정확한 명령을 내려야만 했다는 점이다. 곡 선택은 전통적인 오디오에서 트랙 순으로 찾았지만, 음성 시스템을 이용하면 노래 이름을 말해 찾으면 된다. 이때 운전자가 알고 있고 말하는 노래 제목은 실제 제목의 일부분인 경우가 많다. 부정확한 곡명인 것이다. 사람들은 종종 그들이 무슨 말을 해야 할 지 종종 잊기도 한다. 심지어 무슨 말을 해야 할지를 알고 있으면서도 정착 입에서는 다른 말이 나오기도 한다. 엔지니어들은 이처럼 사용자가 잘 알지 못해 범하는 입력 에러 문제에 대해 고심하고 있다.
정확도의 불확실성(perceived accuracy)이란 문제도 있다. 사용자들은 대개 매뉴얼을 읽지 않고 사용한다. 반면 음성인식 기술 또한 완벽하지 않다. 이같은 이유로 인해 많은 에러들이 사용자들로부터 야기된다. 개발자들 또한 시스템을 디자인하거나 개량하는데 있어 사용자들의 실수를 심각하게 고려하지 않는 경향이 있다.
개발 팀의 한 관계자는 “사용자들이 그들의 실수를 알지 못하고 컴퓨터만 탓하기 때문에 목표값의 불확실성이 커진다. 우리는 올바른 사용자들을 불리하게 하지 않으면서 경우에 따라 실수를 야기하는 사용자들까지 포용할 수 있는 밸런스의 시스템 개발을 위해 노력 중”이라고 말했다.
이 문제에 대해 커뮤트 UX 개발자들은 필요한 음성 명령어 수를 대폭 줄임으로써 풀어내려 한다. 음악을 듣고 싶다면 ‘Play’라고 하는 매우 직관적인 단어만 필요할 것이란 생각에 ‘Call’, ‘Reply’와 같이 매우 간단하고 자연스러운 트리거 단어로 일을 수행할 수 있도록 했다.
개발 팀의 한 관계자는 “운전자는 ‘Play artist Red Hot Chili Peppers’라고 말하지 않고, ‘Play the Chili Peppers’라고 말하기만 해도 된다. 완전한 문장을 만들거나 레드핫 칠리 페퍼스란 풀 네임의 아티스트 명을 기억할 필요가 없어지는 것이다. 과거엔 500여 개의 명령어를 기억해야 했다면 이제는 play, call, reply 이 세 가지만 기억하면 간단히 문제가 해결 된다”고 말했다. 
주행 중 차에서의 소음 장애 극복은 커뮤트 UX의 효율을 높이는 중요한 과제 중 하나였다. 커뮤트 UX는 마이크로폰 어레이를 이용해 소리를 잡아내는 최신 음성 기술을 이용한다. 마이크로폰과 음성개선(speech-enhancement) 기술은 음성인식 이전에 필요한 기술로 강력한 성능의 음성인식 기능을 발휘하기 위해 선행돼야 할 부문이다. 차내는 매우 시끄러운 곳으로 사전용 음성인식기가 사용되는 사무실과 같은 환경과는 비교할 수 없다. 한 관계자는 “우리는 큰 어려움을 겪었다. 첫 번째는 마이크로폰을 어디에 놓고 얼마나 둘 것인가의 문제였다. 먼저 대시보드, 리어뷰 미러, 운전자의 시선이 미치는 오른쪽 공간 어느 곳에 마이크로폰을 위치시켜야 할 지 고민했다”고 말했다.
엔지니어들은 몇 가지 안을 디자인했고 공동개발 파트너인 마이크로소프트의 자동차 비즈니스 부문과 이를 공유했다.
두 번째는 음성개선 부문이었다. 프로젝트 팀은 사람과 음성인식기 모두에 친화적인 시스템을 만들길 원했다. 개발 팀의 한 관계자는 “음성인식기가 아닌 사람이 에러의 주원인 중 하나라고 한 것은 일부분에서 음향 획득과 음성개선 시스템의 적절한 디자인을 위한 것이기도 했다”고 말했다.
문자 메시지 쓰기

커뮤트 UX 프로젝트는 2006년 그룹의 비공개 과제로 시작됐고 2007년에 처음 공개됐다. 개발자들은 프로젝트 2단계에서 복잡한 메뉴 구조를 피하는 음성 커맨드와 쿼리(query)를 특징으로 하는 프로토타입을 만들었다.
개발 팀의 한 관계자는 “많은 시스템들과 달리 커뮤트 UX는 관련 메뉴 구조가 없다. 운전자가 ‘Play track Yellow Submarine’이라고 말한다고 치자. 시스템은 운전자가 음악에 대해 말하고 있다고 추정해 음악 메뉴로 들어간다. 이 때 전화를 걸고 싶다면 일반적 시스템에서는 운전자가 메인 메뉴로 돌아온 후에 전화를 걸어야 했다. 커뮤트 UX에서는 아무 때나 말하면 된다”고 말했다. 
커뮤트 UX는 음성으로 SMS 메시지를 보낼 수 있다. 개발자들은 운전자들이 운전 중에 문자 메시지를 보내고 싶어 한다는 것을 알고 있었고, 또 그렇게 해선 안 된다는 것도 알았다. 팀은 커뮤트 UX의 음성 기술을 통해 운전자들을 돕기로 했다.
개발 팀의 한 관계자는 “예전엔 구술 기반(dictation-based) 시스템을 가질 수 있다고 생각했었다. 이것은 운전자가 뭔가를 말하면 시스템이 결과를 보여주는 식이다. 사용자가 말이 잘못된 것을 알고 나면 다시 말하거나 정확한 것을 고르는 것이다. 그런데 이는 매우 일방적인 접근이었다”고 말했다.
개발 팀은 이 방식이 매우 위험스럽고 부담스럽다는 것을 깨달았다. 그리고 음성검색(voice-search)적 접근으로 동일한 서비스를 제공할 방법을 찾아냈다. 게다가 이 방식은 이전에 비해 물리적, 인지적 방해를 저감할 수 있었다.


위치기반 서비스

커뮤트 UX는 자동차와 클라우드(Cloud) 기반의 서비스를 심리스하게 통합한다. 커뮤트 UX의 기능성은 일반적인 차내 컨트롤 기능에 웹 기반의 다양한 부가 정보와 기능들을 연결해  더욱 풍부해진다.
개발 팀의 한 관계자는 “우리는 운전자가 무엇을 묻든지 간에 답할 수 있는 통합된 시스템 개발을 원했다. 거의 모든 온보드 시스템 관련 기능들은 음성인식으로 프로세싱이 가능해야만 하고, 교통, 날씨, 기름값 등의 위치기반 정보와 서비스들도 통합해야 한다고 생각했다”고 말했다. 
커뮤트 UX 프로젝트가 비공개 과제로 시작된 직후 얼마 안 있어 다음 개발 목표 설정을 위한 브래인스토밍 스케줄이 잡혔고 여기서 운전자들에게 교통, 날씨, 주유소 시세 및 위치, 주식 등의 정보 등을 포함한 정보 자동화 제공이 목표로 설정됐다. 시스템은 마이크로소프트 스피치 서버에 의해 동작되도록 디자인됐다. 2007년 커뮤트 UX가 공개될 때 시스템은 위치기반 서비스 기능을 보유하게 됐다.
개발 팀의 한 관계자는 “자동차가 지속적으로 움직이는 물체여서 우리는 거리, 상점, 극장 등 지정학적인 POI 정보를 다룰 수 있다고 생각했다. 당시엔 GPS(Global Positioning System)의 이용이 일반화 되지 않았었지만 우리는 연구 단계에서 온보드 시스템과 관련해 모바일폰 시스템을 통해 위치 정보를 가져 올 필요가 있다고 생각하고 있었다. 위치 정보와 효율적인 정보 전달의 중요성에 대해 연구했다”고 말했다.
프로젝트는 통신 데이터(call data) 분석과 사용자 연구를 통해 작업 성공률을 향상시켰다. 또 자주 방문하는 지역에 대한 사용자 정보 같은 사전 정보 활용이 다이얼로그 텀 수를 줄인다는 것을 확신하게 됐다. 이를 통해 사용자가 하기 원하는 것을 보다 쉽게 할 수 있도록 도울 수 있음도 알게 됐다.


능동적 대응

커뮤트 UX 개발자들은 급제동 하게 되는 위태로운 상황에서 동승자들이 일반적으로 운전자를 배려해 조용히 앉아 있는 점에서 아이디어를 냈다. 시스템이 동승자의 행태처럼 주행 조건의 급격한 변화, 장애 발생에 따라 즉각적으로 반응해 운전자의 안전 운행을 도울 수 있길 원했다. 예를 들어 주행 중 차선 변경, 다른 차량의 진입, 교차로 통과 등 잠재적인 운전 부주의 유발, 운전부하 가중 요소가 예상될 때 인터페이스가 순간적으로 꺼지거나 동작하지 않아 위험 요소를 제거하거나 저감하는 식이다.
개발 팀의 한 관계자는 “운전자가 앞 차와 간격 유지를 위해 급제동을 한다던가, 리어뷰 미러를 볼 때 동승자들은 운전자에게 말을 걸지 않는다. 우리는 커뮤트 UX의 컴퓨터가 동승자들처럼 위험 상황이 예상될 때 운전자에게 말하거나 동작하지 않고, 반대로 운전자가 말하지 않도록 할 것”이라고 말했다. 
개발자들은 한 대의 차를 몇몇의 가족 구성원들이 이용하는 점을 고려해 커뮤트 UX가 다양한 운전자들에 맞춰 조정될 수 있어야 한다고 생각했다. 이에 따라 커뮤트 UX는 운전 정황(driving context)과 운전자의 습관을 저장해 디폴트로 사용할 수 있어야 하고 디폴트는 몇몇 운전자들과 관계되기 때문에 쉽게 정의되고 모니터링, 저장할 수 있어야 했다.
커뮤트 UX 시스템의 맞춤화(persona-lization)는 운전자의 프로파일 업로드를 위해 모바일폰을 연결할 줄만 알면 된다. 폰은 음성인식기를 위한 프로파일을 포함하고 있어 말로 명령해 적용시키기만 하면 된다.
선호하는 곡과 플레이 리스트, 내비게이션의 POI(Point of Interest) 등은 차와 운전자의 특별한 취향, 스타일이 된다. 전체 시스템은 정보 검색과 음성인식 기능 향상을 위해 가능한 우선 정보들을 적극 이용한다. 개발 팀의 한 관계자는 “유용성과 사용자 편의는 차를 탈 때마다 증대된다. 운전자의 배우자가 차 문을 열게 되면 차는 그 사람의 것이 된다. 우리는 이 기능이 미래 시스템에서 매우 중요한 역할을 할 것으로 믿는다”고 말했다.
마이크로소프트 리서치의 다른 부서에서도 커뮤트 UX와 관련된 다양한 연구를 진행하고 있다. 예를 들어 어떤 부서는 통화, 메시지와 관련해 적절한 시기에 이를 차단해 운전 부주의를 줄이는 테스트 단계의 사용자 연구를 진행 중이다.    
커뮤트 UX 프로젝트 팀은 음성 기반 인터페이스를 개량하고 다듬는데 지속적인 노력을 기울이고 있다. GPS를 이용한 다양한 가능성, 모바일 기기의 거대한 상황인지적 가능성과 애플리케이션에 대해서도 연구 중이다.



AEM_Automotive Electronics Magazine


<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


  • 100자평 쓰기
  • 로그인


  • 세미나/교육/전시

TOP