아이티랩 - “데이터분석으로 진화하는 언어학습 도우미, 듀오링고”

데이터와 머신러닝. 요즘 대기업이든 스타트업이 관심을 갖는 기술이다. 미국 에듀테크 기업인 듀오링고도 최근 데이터 분석에 한창이다. 데이터로 사용자에게 알맞는 맞춤 교육을 제공하는 게 이들의 목표다. 이를 위해 기술에 많은 투자를 하고, 현재 직원 중 절반 이상이 기술직이다. 마침 얼마 전 듀오링고 리서치팀에 소속돼 있는 마사토 하기와라 연구원 겸 소프트웨어 엔지니어가 한국에 방문했다. 그는 3주 동안 한국에 머물면서 국내 유명 대학과 IT 기업에서 교육 기업이 어떻게 데이터를 활용하고 연구하고 있는지 공유했다고 한다. 오랫동안 일본에 거주하다 미국 에듀테크 기업에 근무하는 그의 삶은 어떨까? 그에게서 듀오링고의 기업 문화 그리고 그가 다루고 있는 기술 이야기를 들었다.

모두 직원이 외국어 공부를 즐기는 기업

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });

듀오링고는 게임 방식을 활용해서 외국어를 배울 수 있게 도와주는 서비스로 유명하다. 처음에는 영어 콘텐츠가 많았지만 현재는 60개가 넘는 언어 수업을 제공한다. 한국인을 위한 영어 교육 서비스는 2014년 처음 나왔다. 한국어 사용자는 현재 300만명 정도다. 올해 9월 초에는 영어권 사용자가 한국어를 배울 수 있는 서비스도 새롭게 출시했다.

▲영어권 사용자를 위한 듀오링고의 한국어 강의 (사진 : 듀오링고)

듀오링고는 설립 초기부터 ‘무료’ 서비스를 강조하며 성장해 왔으며, 최근까지 1억830만달러(약 1228억원)를 투자받았다. 그 외에 영어 시험 서비스, 기업용 서비스 등으로 다양한 수익원을 만들고 있다. 듀오링고 설립자인 루이스 폰 안 CEO는 자동 가입방지 도구인 캡챠/리캡챠를 발명한 사람으로 알려져 있고, 그가 이전에 설립한 회사는 구글이 인수했다.

마사토 하기와라는 대학원 시절까지 일본에서 컴퓨터과학을 연구하는 학생이었다. 그러던 어느날 답답한 일본 기업 문화에서 벗어나 미국 스타트업으로 이직을 준비하던 중 듀오링고를 알게 됐다.

“큰 회사에선 제가 어떤 일을 해도 큰 기여를 할 수 없는 경우가 많아요. 또 일본 기업문화는 좀 경직돼 있거든요. 사용자를 위해 일을 하는 게 아니라 항상 상사를 먼저 생각해야 했죠. 상사를 위해 제안서를 만들고, 상사가 있으면 늦게 퇴근하고요. 그런 면에서 미국 스타트업은 조금 다르다고 들었어요. 그렇게 해서 듀오링고에 오니 내가 만든 기술이 서비스에 바로 적용되고, 회사에 더 의미있는 기여를 할 수 있더라고요. 상사도, 부하직원도 의사결정은 사용자에게 무엇을 줄수 있느냐에 따라 달라지고 훨씬 유연한 것 같습니다.”

듀오링고는 외국어 학습 서비스를 개발하는 만큼 외국어 공부에 대해 관심이 많은 사람들이 모여 있다고 한다. 상당수가 2-3개 언어를 구사할 수 있다. 다양한 언어를 구사하는 사람이 많으니 그만큼 다양성도 높다. 마사토 하기와라도 모국어인 일본어 외에 영어와 중국어는 유창하게 말할 수 있으며, 현재 한국어 공부에도 푹 빠져 있다. 듀오링고에는 ‘랭귀지 테이블’이라는 독특한 문화가 있다. 랭귀지 테이블 시간에는 같은 언어를 공부하는 직원끼리 모여 그 나라 음식도 먹고, 그나라 언어를 연습한다고 한다. 일종의 사내 외국어 스터디 모임이다. 한국어 랭귀지 테이블도 존재하는데, 여기에는 10명 이상이 꾸준히 참여한다고 한다.

“외국어 공부 성공? 매일 같은 시간에 하세요”

마사토 하기와라 연구원이 일하는 팀은 직접 서비스를 만들기 보단 다른 팀을 도와주기 위해 일한다. 예를 들어 그로쓰해킹팀이나 마케팅팀, 제품 개발팀이 어떤 방향으로 제품을 만들지 조언하고 이를 위해 데이터를 분석한다. 가령, 1년 이상 듀오링고 사용자와 1주일 만에 앱을 지운 사용자를 뽑아내고 특징을 알아내는 것이다. 그렇다면 어떤 사용자가 외국어를 성공적으로 습득할까? 마사토 하기와라는 ‘지속성’에 답이 있다고 말한다. 오히려 공부 시간의 총량은 언어 능력과 연관성이 떨어진다고 한다. 즉 3일 동안 10시간을 몰아서 공부한 사람보다 매일 조금씩 공부하는 사람이 훨씬 더 외국어를 잘 습득한다는 것이다.

가장 중요한 건, 같은 시간에 공부를 반복하는 것이다. 마사토 하기와라의 연구에 따르면 하루 10분을 공부할 때 어느 날은 아침, 다른 날은 저녁, 이렇게 공부 시간이 뒤죽박죽인 것보다 ‘퇴근 후 10분’처럼 매일 같은 시간에 공부하면 습득 능력이 훨씬 높아졌다. 그래서일까 듀오링고 서비스는 ‘바이트 사이즈(bite-sized)’ 분량, 즉 하루 5-10분 정도 학습할 수 있도록 서비스를 구성하고 반복학습을 할 수 있도록 알람을 보내기도 한다. 공부 습관을 만들어주는 셈이다.

마사토 하기와라 연구원은 말하기 연습도 외국어 향상에 큰 도움이 된다고 말한다. 실제로 그는 대학 시절까지는 영어회화에는 전혀 소질이 없었다. 문법과 독해 위주로 공부하다보니 토익 점수는 매우 높았으나 영어로 말할 자신감이 전혀 없던 것이다. 그러다 구글, 마이크로소프트 등 미국 기업에서 인턴을 하면서 영어로 이야기해야 하는 환경이 주어지니 실력이 확 늘었다고 한다.

“말하기는 듣기, 독해, 문법 등을 다양하게 고려해야 할 수 있는 부분인 것 같아요. 그러다보니 3개월 동안 짧게 거주해도 말하기를 집중적으로 하니 실력이 크게 늘수 있는 것이죠.”

이러한 맥락과 비슷하게 최근 듀오링고에서 투자하고 있는 것이 ‘챗봇’이다. 챗봇은 애플의 ‘시리’처럼 사용자가 직접 입력한 말이나 텍스트에 따라 반응한다. 듀오링고는 회화 연습에 챗봇을 활용하고 있다. 사용자는 챗봇을 통해 자연스레 일대일 회화 과외 선생님을 얻는 효과를 얻는다. 아직 듀오링고의 챗봇은 한정적인 기능만 지원되지만 이후 더 고도화될 예정이라고 한다.

 

▲듀오링고 챗봇 서비스 예시(사진 : 듀오링고 홈페이지)

“기계는 인간 언어를 100% 이해 못 하지만, 이해한 척 보이게 만들 수는 있다”

데이터분석, 머신러닝 분야가 확장되면서 가장 많이 성장하고 있는 분야가 바로 자연어 분석 서비스다. 챗봇이나 인공지능 스피커 등이 이러한 기술을 적극 도입해서 나온 결과다. 대학시절부터 오랫동안 자연어 처리(Natural Language Processing) 분야를 연구했던 마사토 하기와라 연구원은 현재 기계의 자연어 처리 성능에 대해 어떻게 평가하고 있을까? 그는 “5-10년 동안 컴퓨터가 인간의 언어를 완벽하게 이해하는 건 불가능하다고 생각한다”라며 “하지만 컴퓨터가 마치 인간의 언어를 이해하는 것처럼 최대한 흉내낼 수는 있을 것”라며 그 대표적인 예로 챗봇을 들었다.

“인간이 언어를 이해하는 방식은 자전거 타는 법을 배우는 것과 비슷합니다. 즉 외우지 않습니다. 자연스레 익히는 것이지요. 다리를 이렇게 움직여야, 허리를 이렇게 움직어야 앞으로 나갈 수 있다고 생각하면서 움직이는 게 아닙니다. 모국어를 생각해보세요. 우리가 문장을 말할 때 무엇인가 외워서 말하던가요? 자연스럽게 익힌 것을 내뱉는 것이지요. 컴퓨터는 다릅니다. 사람이 모두 목표를 정해주고, 이와 관련해서 최대한 적합한 답을 할 수 있도록 유도하는 것입니다. 기술이 발전하면서 컴퓨터는 이러한 답을 더 잘 찾을 수 있을 것입니다. 그러면 사람처럼 보일 수는 있겠죠.”

음성인식 기능이 날로 높아져가고 있다는 점도 강조했다. 실제 마사토 하기와라 연구원은 운전하면서 구글 번역 도구를 자주 이용한다. 그런 도구는 ‘가까운 레스토랑이 어딨니?’ 같은 간단한 문장은 대부분 잘 해석한다고 설명한다. 최근 구글은 기존 알고리즘을 뉴럴 네트워크 알고리즘으로 변경했는데, 이로 인해 영어와 일본어간 품질이 상당히 높아졌다고 덧붙였다.

▲마사토 하기와라 듀오링고 연구원 겸 소프트웨어 엔지니어(사진:듀오링고 제공)

데이터 분석이나 머신러닝 분야는 굉장히 넓고, 깊이 있는 지식을 다룬다. 10년 넘게 이 분야에 일하면서 공부하기에 버겁지는 않을까? 마사토 하기와라는 이쪽 업계에 종사하기 위해 기본 개념을 충실히 배워놓고, 영어 능력도 쌓아두는 게 중요하다고 말했다. 그는 “머신러닝도 결국 선형대수학, 통계, 확률 등 기본 개념 위에서 만들어져서 생긴 학문”이라며 “새로운 기술은 그만큼 빨리 변화지만 기본은 오랫동안 지속하기 때문에 계속 활용할 수 있다”라고 말했다. 영어의 중요성 역시 강조하면서 “빨리 변화하는 데이터분석 업계에서 누군가가 한국어로, 일본어로 번역해주길 기다리긴 너무 늦다”라며 “좋은 무료 콘텐츠가 많으므로 이것을 영어로 곧장 이해할 수 있는 실력이 있어야 한다”라고 조언했다.

MOOC(온라인 공개강좌)를 듣는 것도 제안했다. 그는 대학교 때 관련 전공을 했지만 부족한 부분은 MOOC로 채워서 깊은 내용을 습득했다고 한다. 대표적으로 UC 버클리 전자컴퓨터공학과 피터 애빌의 인공지능(Artificial Intelligence) 과목스탠포드대학 다프네 콜러 교수의 확률 그래프모델(Probabilistic Graphical Model) 과목을 수강했다. 마사토 하기와라 연구원은 “MOOC는 졸업 이후 회사에 근무하면서 수강했다”라며 “전문 용어를 영어로 학습하는 데도 MOOC가 좋았다”라고 설명한다.

마사토 하기와라 연구원의 미래 목표는 크다. 앞으로 듀오링고가 언어 학습 분야를 이끄는 리더이자 강력한 브랜드가 될 수 있도록 기여하는 것이다. 개인적으로는 아직 배우고 싶은 외국어가 많아서, 한국어를 끝낸 뒤 아랍어에 도전할 계획이다.

“전세계에 많은 사용자가 있지만 특히 어떤 나라에는 학교에 가기 어렵고 교과서나 스마트폰을 사기 힘든, 가난한 학생들도 존재합니다. 듀오링고는 그러한 학생들도 무료로 공부할 수 있도록 돕겠다는 확고한 목표를 공유하고 있죠. 저 역시 듀오링고 속에서 더 많은 사람이 양질의 무료 교육을 받을 수 있도록 계속 기여하고 싶습니다.”

의견 0 신규등록      목록