아이티랩 - 가짜 계정 솎아내고, 맞춤 광고 만들고…‘라인’ 메신저 속 AI 기술들

블록체인이 미래라면, 인공지능은 현재다. 인공지능은 장밋빛 희망 대신 손에 잡히는 현실을 제공한다. 사람이 손으로 하고, 오랜 시간이 걸리고, 결과에 비해 효율이 높지 않던 작업들을 자동으로, 짧은 시간에, 효율적으로 수행한다. 질병을 빠르고 정확하게 진단하고, 사진이나 영상 속 배경을 감쪽같이 바꾸거나, 눈으로 구별하기 힘들었던 멸종위기동물을 추적하고, 사람의 목소리를 똑같이 흉내내거나, 작곡을 하고 시나리오를 쓰기도 하고, 사망 시기를 예측하기도 한다. 공상과학이 아니다. 엄연히 구현되고 있는 현실이다. 현실 속 인공지능은 위대한 마법사보다는 영특한 일꾼에 가깝다.

인공지능이 숨쉬려면 방대한 데이터가 공급돼야 한다. 기계는 산더미처럼 쌓인 다양한 유형의 데이터를 반복 학습하며 규칙을 찾고 오류를 줄여나간다. 그 과정을 거쳐 똑똑해진 알고리즘은 다양한 영역에 활용된다. 예컨대 수많은 이용자가 방대한 데이터를 쏟아내는 ‘메신저’가 그렇다. 왓츠앱이나 텔레그램, 카카오톡 같은 메신저가 인공지능 기술을 수혈하는 건 그래서 자연스런 수순이다. 이용자 분석부터 서비스 고도화, 수익 창출까지 다양한 영역에서 인공지능 기반 알고리즘이 적용된다.

메신저 ‘라인’도 마찬가지다. 라인을 서비스하는 라인플러스에는 인공지능을 서비스에 결합하려는 다양한 실험이 진행 중이다. 이용자가 쌓아둔 데이터를 가공해 서비스 품질을 높이려는 시도들이다. 예컨대 라인 메신저 속 커뮤니티 서비스인 ‘스퀘어’를 보자. 스퀘어에선 1억건에 이르는 이용자 데이터를 기반으로 머신러닝을 거쳐 관심사와 일치하는 커뮤니티를 추천해주거나, 읽지 않은 메시지나 타임라인 새 글을 알려준다. 알고리즘이 휴면 이용자를 판단해 접속을 유도하는 알림 메시지를 쏘기도 하고, 친밀한 이웃의 프로필이나 접속 상태가 변경될 때도 자동으로 푸시 알림을 준다.

이 과정에서 ‘그로스해킹그로스해킹이란 한마디로 서비스나 브랜드의 성장을 도모하기 위해 수행하는 각종 기술적 방법론이나 실험을 일컫는다.close’도 병행된다. “커뮤니티가 활성화하려면 이용자가 관심 있어 할 커뮤니티를 추천해줘야 합니다. 이용자 성별이나 나이, 관심사에 따라 제각각이겠죠. 이때 추천 메시지 종류에 따라 가입률이나 이탈률이 달라집니다. 이를 수치화해 맞춤형 알림 메시지나 추천 커뮤니티를 띄워주는 방식을 다각도로 실험하고 있어요.”

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });

라인 메신저를 만드는 데브4의 박원준 님(※라인플러스는 일부 조직 리더나 임원을 제외하고는 직급을 없애고 호칭을 모두 ‘-님’으로 통일하고 있다_편집자)은 이용자 분석과 이탈방지부터 대량 스팸 광고를 내보내는 ‘어뷰징 계정’을 잡는 데도 머신러닝을 활용한다고 말했다. “자동 가입하고 광고 메시지를 보내는 계정들이 있어요. 대개는 다른 이용자의 신고를 받아 계정을 차단하는 방법을 씁니다. 사람이 일일이 약관을 기반으로 처리하기엔 한계가 있죠. 어뷰징 계정을 가입 단계에서 차단하기도 하고요. 인증을 통과한 뒤에도 시간을 두고 활동하거나 가짜 친구를 만드는 식의 패턴을 분석해 차단하는 방법도 쓰고 있어요.”

라인 메신저와 패밀리 서비스에 쓰는 미디어 파일 시스템을 관리하는 데브7에서도 머신러닝은 유능한 직원 몫을 한다. 미디어 플랫폼 팀 백준식 님은 이미지나 동영상을 분석해 부적절한 콘텐츠를 걸러내는 데 머신러닝을 활용하고 있다. “라인의 미디어 플랫폼 ‘픽셀’에서 하루 2천만건 정도의 데이터를 필터링합니다. 지난 1년 동안 필터링해야 할 콘텐츠 양이 15배나 늘어났어요. 그에 비해 운영진은 3배 정도 늘었고요. 1차로 머신러닝이 성인용 콘텐츠를 걸러내고, 이를 사람이 다시 확인하는 식으로 업무 효율을 높였습니다.”

‘타임라인’에서 이용자별로 어떤 게시물을 상위에 띄워줄지 결정하는 것도 인공지능 몫이다. 데브7 유찬우 님은 “페이스북에서 어떤 친구 게시물을 상위에 보여줄 지 결정하듯, 라인 타임라인에서도 이용자 행동을 바탕으로 흥미있어할 만한 콘텐츠를 추천하고 선호하는 콘텐츠를 상위에 올리는 데 데이터 분석을 활용하고 있다”라고 설명했다.

방대한 데이터를 기반으로 한 머신러닝의 결과물은 수익으로도 이어진다. 광고 플랫폼을 개발하는 데브8의 역할이 그것이다. 광고 플랫폼에선 특정 기술을 개발하기보다는, 보다 다양한 형태로 머신러닝을 활용한다. 송민철 리더 말을 들어보자. “광고 클릭률(CTR)을 예측하는 데 머신러닝을 활용하고 있어요. 이를테면 ‘이 광고를 보내면 이용자가 클릭할 거야’라고 예측하는 건데요. 예측률이 98%에 이릅니다. 그걸 기반으로 광고 단가를 예측하고, 광고 이미지도 GAN생성적 적대 신경망(Generative Adversarial Networks)의 약자. 딥러닝을 기반으로 진짜 같은 가짜를 만드는 기술로, 이미지나 음성 등을 학습해 똑같거나 비슷한 사람 얼굴이나 목소리를 만들어내는 데 활용된다.close 기반으로 생성합니다. 똑같이 스포츠를 좋아해도, 이미지가 달라지면 클릭률도 달라지거든요.”

성과도 눈에 띄게 달라졌다. 광고 플랫폼을 개발팀 김수영 님은 “실제 트래픽 1건 당 얼마를 벌었는지 측정하는 eCPM이 있는데, 지난해 초에 기존 데이터에 머신러닝을 적용하면서 eCPM 수치가 2배 올라갔다”라고 말했다. 올해는 더 많은 수익을 기대하는 눈치다. “지난해까진 실시간 머신러닝은 아니었어요. 하루 전 데이터를 쓰는 식이었죠. 최근엔 실시간 머신러닝을 도입해 1분, 5분 전 데이터를 적용하고 있어요. 그만큼 성능이 더 좋아지고 있는 거죠.”

| 라인플러스 데브8 송민철 리더

머신러닝과 딥러닝은 광고 소재 최적화 기능인 DCO(Dynamic Creative Optimization)의 핵심 기술이다. 이용자가 여행 광고를 본다고 치자. 그가 뉴욕에 있으면 뉴욕에서 일본 가는 여행 상품을 보여주고, 한국에 있는 이용자에겐 한국에서 호주 가는 비행기 티켓 광고를 보여주는 식이다. 같은 옷 광고라고 해도 계절이나 배경, 색깔에 따라 다른 광고 효과를 낸다. 딥러닝이 단순히 이미지를 생성하는 단계를 넘어 이용자가 좋아할 만한 광고를 판단, 제작, 추천해주는 것이다.

“머신러닝의 경쟁력은 결국은 데이터 양의 차이입니다. 태국에선 이용자가 휴대폰을 사면 유심을 바꿉니다. 그러면 아이디도 함께 바뀌죠. 1-2년 전 아이디와 지금의 아이디를 매칭해 동일 아이디인지 판별하는 데도 머신러닝을 씁니다. 성별이나 나이 정보가 없어도 머신러닝으로 이름을 분석해 동일성 여부를 추정하죠. 심지어 이름으로 성별을 추정하기도 합니다. 방대한 데이터를 정제하는 기술이 경쟁력이 되는 셈입니다.” (김수영)

송민철 리더는 “실제 인공지능 범주에 포함될 기술이나 활용사례는 훨씬 넓고 다양하다”고 말했다. “바깥에선 인공지능이라고 부르지만, 본질은 데이터 분석입니다. 데이터 엔지니어는 데이터 클러스터를 모으고 운영하고, 데이터 사이언티스트는 이를 분석하고 알고리즘을 운용해 산출물을 내죠. 인공지능은 특이한 기술이 아니라 대중적 기술입니다. 라인 광고 플랫폼만 봐도 몇 가지가 쓰이는지 모를 정도로 인공지능 기술은 대중화돼 있어요.” 송민철 리더는 “라인의 방대한 데이터를 기반으로 데이터를 정제하고, 분석하고, 운용할 동료들을 많이 찾고 싶다”라고 덧붙였다.

의견 0 신규등록      목록