본문 바로가기
카테고리 없음

음성인식 가상비서 기술 동향 및 전망

by 할로파파 2021. 1. 24.
반응형

"헤이 구글, 내일 미세먼지 어때?"

: 음성인식 가상비서 기술동향 및 전망

 

매년 미국 라스베이거스에서 열리는 CES(Consumer Electronics Show)는 50년 전통의 세계 최대 가전제품 전시회입니다. 다양한 신기술들이 해마다 이곳에서 가장 먼저 소개되는데요. 올해 CES 2019에서는 아마존(Amazon)의 '알렉사(Alexa)'와 구글(Google)의 '헤이 구글(Hey Google)’ 음성인식 서비스 대결이 돋보였습니다. 구글은 야외 전시장에서 헤이 구글 체험 부스를 설치했고, 아마존은 알렉사를 다양한 가전제품들과 연결해 선보였습니다. 이렇게 음성인식 가상비서의 한 형태인 스마트 스피커는 글로벌 혁신기업들의 연구로 그 영역이 더욱 넓어지고 있습니다.

 

꾸준히 성장 중인 스마트 스피커 분야

구글의 인공지능 알파고(AlphaGo) 기억하시죠? 알파고와 이세돌 9단과의 바둑대결은 인공지능(AI)을 이야기할 때 여전히 빠지지 않고 있습니다. 인공지능은 끊임없이 성장 중인데요. 자율주행차 분야는 물론 스마트 스피커를 통한 음성인식가상비서 (Voice Assistant)를 통해 폭발적으로 성장하고 있습니다.

음성인식 가상비서 서비스가 구현된 스마트 스피커는 차세대 기술로 주목받고있는데요. 미국 소비자 기술 협회에서 스마트 워치, 스마트홈 디바이스와 함께 2019년 큰 성장이 예상되는 분야로 스마트 스피커를 제시했는데요. 음성인식 가상비서서비스는 자율주행, 자동번역과 더불어 인공지능의 대표 상품으로 등장하고있습니다.음성인식 기술은 1950년대부터 꾸준히 연구되어 왔습니다. 하지만 음의 높낮이,말하는 속도, 문장에 따른 발성 차이, 사투리 등을 구별하지 못했죠. 2010년 중반에들어서 구글을 중심으로 1,000억 개에 달하는 음성 데이터가 축적되고, 딥 러닝(DeepLearning)을 통해 2017년에는 인간의 음성 인식률이 95% 정도에 도달하게됐습니다. 중국 바이두의 음성인식 기술 ‘딥스피치(DeepSppech)'의 인식율은 97%에 달합니다. 우리나라의 한국어 음성인식율도 이미 상당한 수준에 도달해 있습니다.

 

사람과 대화하는 스마트 스피커

스마트 스피커 분야를 선도하고 있는 기업은 아마존인데요.이 회사는 2014년 말에코(Echo) 스피커를 시작으로 에코 닷, 카메라로 의상을 골라주는 에코 룩, 음성과디스플레이가 결합된 에코 쇼 등 새로운 디바이스를 선보여 왔습니다.

구글은 AI스타트업 Api.ai를인수하면서 2016년 구글홈(Google Home) 스피커를출시했고, 애플은 2018년 시리가 탑재된 홈파드(HomePod)를 출시했습니다.중국도 발 빠르게 움직이고 있는데요. 중국어 음성인식 회사인 iFlyTec사가 딩동스마트 스피커를 2016년 출시했고, 화웨이(Huawei)도 관련 제품을 선보였습니다.우리나라는 주요 통신사 및 인터넷 기업을 중심으로 스마트 스피커를 출시하고있습니다. 2016년 SK텔레콤은 누구(NUGU)를 시작으로 btv NUGU를 내놓았고,2017년 KT는 스피커와 셋톱박스(Set-Top Box)를 결합하여 음성과 TV 디스플레이를동시에 보여주는 기가지니를 출시했습니다.

 

음성인식 가상비서가 만들 미래

음성 명령 서비스는 장점이 많습니다. 복잡하게 검색하지 않고 바로 실행할 수 있죠.정보 검색이 간편하기 때문에 어린아이부터 고령자까지 누구나 사용이 가능합니다. 또손과 눈이 자유로워서 정보를 검색하며 다른 일도 할 수 있습니다. 요리할 때 레시피를물어보거나 운전하면서 어느 도로가 막히는지 물어볼 수 있죠.

 

최근에는 가전·사물인터넷(IoT) 기기와의 연계도 늘어나고 있습니다. 침대에 누워음성으로 불을 끄고, 커튼을 여닫고, 모션 베드를 움직일 수 있습니다. 새로운 형태의서비스도 등장하고 있습니다.

라스베이거스 윈(Wynn)호텔은 객실에 스마트 스피커를 설치해 음성으로 객실 환경을제어하고 호텔 서비스를 부를 수 있습니다. 우리나라에서는 조명과 가스, 냉난방기기조절이 가능하도록 빌트인 형태의 스마트 스피커를 시공하고 있습니다.

AI 플랫폼 간 협력 및 연동도 활성화되고 있습니다. 아마존 알렉사 이용자가 “알렉사,코타나 열어줘(Alexa, Open Cortana)"라고 하면 MS의 AI플랫폼 코타나를 이용할 수있습니다. 반대로 윈도우10 코타나 사용자가 알렉사를 호출할 수도 있습니다.

인공지능 음성인식 서비스가 제조 현장에 적용된다면 음성으로 기계를 멈추어 위험상황에서 벗어나거나, 다국적 작업자 간의 소통 도구로 활용할 수 있습니다.

 

앞으로 풀어야 할 과제

급격하게 성장하는 시장과 새로운 서비스의 증가에 맞추어 함께 고려해야 하는요소들도 늘어나고 있습니다.첫 번째로 프라이버시 침해 가능성입니다. 스마트 스피커는 특성 상 항상 대기 상태에있어야 하는데요. 이로 인해 이용자의 사적대화나 검색 내용을 도용하는 음성 무단점거 가능성이 높아질 수 있습니다.두 번째는 특정 기업이 인공지능 플랫폼 독점하는 것이 아닌 공개를 통한 협력이시도되어야 합니다. 인공지능 기반 기술 및 서비스 플랫폼은 자본력이 있는 ICT기업이나 공공이 주로 담당하고, 새로운 기술 발굴, 서비스 구현 부분에서는스타트업의 역할이 필요합니다.

 

세 번째로 1인 가구 고령화 사회 증가에 따라 음성인식 가상비서와 연계된 스피커와 홈로봇 등의 역할이 커질 것입니다.지식서비스는 지식을 집약적으로 생산·가공·활용하고, 타 산업과의 융합을 통해 높은부가가치를 창출하는 서비스산업입니다. 이런 지식서비스산업은 4차 산업혁명기술과의 연계가 기본이 되고 있는데요. 그 중 대표적인 기술인 음성인식 가상비서기술은 우리 일상이 적용되고 있습니다. 향후 다양한 제조 공정, 업무환경 등산업현장에 적극적인 도입과 함께 음성인식 가상비서를 활용해 다양한 산업에 새로운활력을 불어넣을 수 있을 거라 예상합니다.

 

인공지능 가상비서는 4차 산업혁명의 대표기술 중 하나로 소비자와 만나는 접점이되고 있습니다. 시장조사업체 캐널리스(Canalys)에 따르면 2022년에는 전 세계보급된 스마트 스피커가 3억 대가 넘을 것으로 예측하고 있습니다. 미국은 2019년현재, 66.4백만 명이 스마트 스피커를 한대 이상 보유하고 있습니다. 반면, 우리나라는미국 등에 비해 상대적으로 느린 편입니다. 급격하게 성장하고 있는 음성인식 가상비서분야에서 경쟁력을 갖추기 위해서는 적극적인 R&D 도입이 필요한 때입니다.

시사점

▶ 스마트 스피커가 디스플레이, 가전제품 내재화로 진화하고, 호텔, 아파트, 회사 등에서다양한 형태의 서비스를 시도하고 있습니다.

 

▶ 개인정보 보호 측면, 1인 가구 고령화 등 인구구조 변화에 따른 고려가 필요합니다.

 

▶ 음성인식 가상비서의 산업 현장 도입과 새로운 BM 창출 기술로의 활용이 필요합니다.

 

 

출처 : KEIT PD 이슈리포트

반응형

댓글