아이티랩 - “한국어 챗봇 서비스, 네이버 아미카가 돕겠다”

새로운 사용자 인터페이스(UI) 뒤엔 새로운 하드웨어 등장이 있다. PC 시절엔 키보드와 마우스를 중심으로 한 UI가, 스마트폰이 등장하면서 터치 중심 UI가 만들어졌다. 터치 다음엔 어떤 UI가 등장할까.

이런 고민에 네이버는 ‘대화형 인터페이스’란 답을 내놓았다. 사람에게 가장 자연스런 UI가 음성과 대화라는 이유에서다. 최근 등장한 다양한 하드웨어를 살펴보면, 클릭이나 터치로만 조작하긴 어렵다. 아마존 에코, SK텔레콤이 선보인 누구와 같은 인공지능 기반 음성인식 서비스부터 시작해서 페퍼, 지보와 같은 소셜 로봇, 차량 인포테인먼트 시스템 모두 대화 중심으로 UI가 바뀌고 있다.

소셜 로봇을 스마트폰처럼 일일이 클릭해서 작동하기보다는 대화를 나누는 게 더 자연스럽다. 에코나 누구를 살펴보면 동작할 수 있는 버튼이 적다. 스피커를 통해 기기와 대화를 나누고, 기기는 대화를 바탕을 정보를 처리한다. 그리고 이런 변화는 스마트폰에서도 일어나고 있다.

“사람들이 많이 사용하는 스마트폰을 살펴봐도, 메신저를 사용하면서 대화하는 데 익숙해져 있습니다. 이제 메신저는 단순한 앱이 아니라 하나의 서비스 플랫폼이 됐습니다. 단순한 의사소통 수단이 아니라, 대화를 통해 그 위에서 다양한 서비스 제공하려고 하지요. 이를 아미카가 도우려고 합니다.”

10월24일 열린 ‘데뷰 2016’ 행사에서 김정희 네이버랩스 수석연구원은 ‘아미카’를 설명하면서, 네이버가 대화형 UI를 주목한 이유에 관해 설명했다.

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });
김정희 네이버랩스 연구원

김정희 네이버랩스 연구원

한국어에 최적화된 자연어 이해 플랫폼

아미카는 대화형 인터페이스를 만들 수 있는 엔진 및 개발도구다. 개체명 인식 기술(Named Entity Recognition)과 의도 분석(intent analysis)을 통한 자연어 처리를 돕는다. 즉, 챗봇이나 앱, 서비스, 기기 등에서 자연어 대화 인터페이스 환경을 만들 수 있게 도와주는 플랫폼이라고 이해하면 된다.

챗봇과 같은 서비스를 만들려면, 사용자가 입력하는 언어를 컴퓨터가 이해할 수 있는 수준으로 만드는 작업이 먼저 이뤄져야 한다. 사람에게 ‘슈프림피자 4개 주문할게요’라고 말하면 자연스럽게 ‘피자 매장에서 슈프림피자 4판을 사려고 하는구나’라고 이해하지만, 컴퓨터는 다르다. 컴퓨터에겐 ‘슈프림피자’가 ‘피자 종류’이고, ‘4개’는 수량이며, ‘주문할게요’라는 건 ‘주문한다’라는 것과 같은 뜻임을 학습시켜야 한다.

사용자가 입력한 정보에서 메뉴, 수량, 의도를 분석해야 서비스할 수 있다. 이를 ‘자연어이해'(NLU)라고 말한다. 그런데 이 자연어이해가 쉽지 않다. 컴퓨터를 학습시키려면 방대한 데이터와 계산력이 필요하다. 단순히 정보를 입력한다고 해서 컴퓨터가 스스로 정보를 터득하는 건 아니기 때문이다.

아미카는 이런 부분을 도와준다. 컴퓨터가 언어를 학습하는 방법을 플랫폼으로 만들어 제공하기 때문에, 스타트업이나 기업에서 쉽게 챗봇과 같은 대화형 서비스를 개발할 수 있게 돕는다. 네이버는 포털 서비스를 하면서 얻은 한국어를 바탕으로 형태소 분석 등을 통해 한국어에 최적화된 자연어 이해 플랫폼을 개발했다.

“배달, 주문 등에서 공통으로 많이 쓰이는 단어들이 있습니다. 이런 단어는 저희가 이미 분석해서 제공할 계획입니다. 사용자가 특별히 따로 학습을 시키지 않아도, 이런 내용 바탕으로 대화형 서비스를 만들 수 있게 제공하겠습니다.”

김정희 연구원 설명에 따르면, 아미카는 수량, 성별, 사람 이름, 주소, 장소 등 대화할 때 자주 쓰이는 대화 묶음을 25개 제공한다. 개발자가 따로 학습시키지 않아도 아미카가 사람 대화를 자동으로 적절한 묶음으로 분리한다. 개발자가 적절한 사용 예시를 입력하면, 그 내용을 분석해서 학습한다.

예를 들어 ‘20대 여자가 좋아하는 피자는?’이라는 대화가 입력되면 ‘20대’는 ‘나이’를, ‘여자’는 성별을, ‘좋아하는’은 ‘추천’을. ‘피자는?’은 ‘피자’를 의미한다는 걸 이해한 다음 이에 맞는 대답을 제공하는 식이다.

아미카 개발자 콘솔은 크게 대시보드, 메뉴, 표현확장, 설정 메뉴 등으로 이뤄져 있다.대시보드는 등록된 애플리케이션 목록과 최근 편집한 대화 목록을 보여주고, 대화는 표현 의도에 따라 사용자 표현 문장 및 봇 응답 문장 대화를 구성한다. 표현 확장 메뉴를 통해 사용자 표현 문장과 표현 요소를 입력할 수 있다.

각 메뉴를 통해서 빠르고 간단하게 봇을 만들 수 있다. 메시징 API가 공개된 라인을 이용해 라인에서 작동하는 챗봇을 만들 수 있다. 간단한 봇은 만들기까지 약 3시간이 걸린다고 한다.

“아직은 모든 걸 분석해서 제공하는 건 아닙니다. 대화형 UI는 서비스 중심적입니다. 예로, 사용자가 ‘해산물 피자’를 입력했을 땐 이에 대해 어떤 답을 줘야 하는지는 해당 서비스군 개발자만 알 수 있지요. 이런 부분은 미리 아미카를 통해 입력하면, 또 학습이 이뤄집니다. 서비스 의존이 높은 단어는 서비스 개발자가 직접 정의해서 입력해야 합니다.”

현재 아미카는 앞 대화 내용을 참고해서 답해주는 서비스는 제공하지 않는다. 사람에게 ‘오늘 서울 날씨 어때’라고 물은 다음 ‘그럼 내일은?’이라고 질문하면, ‘내일 서울 날씨는?’이라고 이해해서 답을 주지만 컴퓨터는 다르다. 이런 방식으로 대화하려면 시간만 내일로 바뀌었고, 장소는 서울로 유지한다는 알고리즘을 따로 짜야 한다.

지금은 제공하지 않지만, 김정희 연구원은 차후 이런 서비스도 API 연동으로 제공할 방안을 고민 중이라고 설명했다.

“현재 자연어이해 부부만 아미카에서 서비스 합니다. 향후 앞선 대화 내용까지 참고해서 이해하는 부분도 편하게 설계할 수 있도록 개발하려고 합니다.”

amica.ai closed beta

구글·MS·페이스북과 견주다

네이버는 현재 아미카 클로즈베타 서비스를 운영하고 있다. 이 플랫폼을 통해 개발자가 자연어이해, 처리에 대한 부담을 덜고 다양한 서비스를 개발하기를 기대하고 있다. 개발자가 조금이라도 챗봇 개발을 쉽게 느꼈으면 한다는 바람도 내비쳤다. 이유는 하나다. 네이버 생태계 확장이다.

“많은 글로벌 업체들이 이 분야에 관심이 많습니다. 결국은 자기 플랫폼을 확장하기 위해서지요. 우리도 아미카 플랫폼을 통해 라인에 챗봇이 많이 들어와서 서비스가 확장됐으면 합니다.”

김정희 연구원 얘기에 따르면, 모든 글로벌 업체가 자연어 이해 앱을 인수하고, 기술 개발에 공을 들이고 있다. 구글은 ‘알로’란 앱을 출시하면서 동시에 자연어 이해를 잘 하는 ‘api.ai’란 회사를 인수했다.

페이스북은 역시 ‘wit.ai’를 2년 전 인수해서 메신저 기반 챗봇 서비스를 준비하고 있다. 마이크로소프트는 ‘루이스.ai’를 이용해 자사 인공지능 서비스인 코타나에 챗봇 기능을 추가했다. 국내 기업도 빠지지 않는다. 삼성에서도 시리를 만들었다고 알려진 ‘viv’를 인수하는 등 자연어 이해 처리 시장을 주목하고 있다.

네이버도 이 시장에서 아미카를 통해 글로벌 업체들과 어깨를 나란히 하겠다고 자신감을 내비쳤다. 글로벌 서비스는 영어에 최적화돼 있지만, 네이버는 한국어에 집중해 경쟁력을 키울 계획이다.

“한국어는 영어와 다릅니다. 영어는 단어 위치에 따라 뜻을 파악하는 고립어로 넘어가고 있지만, 한국어는 어떤 조사와 어미, 어간이 붙느냐에 따라 뜻이 달라지는 교착어입니다. 형태소 분석이 중요하지요. 네이버엔 이 연구를 오래한 사람이 많습니다. 좀 더 정확한 자연어 이해 서비스를 선보일 수 있다고 생각합니다.”

의견 0 신규등록      목록