[NDC 2016] "트렌딩 키워드 분석으로 게임 이슈에 빠른 대응"

[게임동아 조광민 기자] 금일(27일) 넥슨 개발자 컨퍼런스(이하 NDC) 2016에서 넥슨 인프라 기술팀의 이태윤 시니어 프로그래머가 '실시간 트렌딩 키워드 뽑아내기'라는 주제로 이용자가 작성한 방대한 게시물과 데이터를 분석해 게임 이슈에 대응하는 노하우 공유에 나섰다.

NDC 2016 트렌딩 키워드
세션
NDC 2016 트렌딩 키워드 세션

이태윤 시니어 프로그래머의 설명에 따르면 현재 넥슨 인프라기술팀이 지원하는 게임은 15개 이상이다. 지원하는 게임이 많아진 만큼 데이터가 많아져 자연스럽게 점점 놓치는 게임 내 이슈가 많아졌다. 이에 게임 내 사건이 터진 뒤 이를 분석해보면 대부분의 사건은 이미 게임의 커뮤니티 등에서 게이머들 사이에서 화제가 되고 있는 경우가 많았다고 한다.

이에 넥슨에서는 게임 내 이슈에 발빠르게 대응하고자 트렌딩 키워드를 뽑아 분석하는 시스템을 마련했다. 트렌딩 키워드는 우리가 일반적으로 만날 수 있는 포털의 인기 검색어와는 조금 다른 개념이다. 검색어는 사람들이 필요한 정보를 찾고자 입력한 것이지만, 트렌딩 키워드는 자연어처리에 가깝다. 게이머들이 게시한 글이나 각종 정보에 등장하는 단어를 분석해 중요도에 따라 점수를 매겨 중요한 키워드를 정리하는 것이다.

NDC 2016 트렌딩 키워드
세션
NDC 2016 트렌딩 키워드 세션

다만, 한국어는 자연 언어 처리가 단어 단위로 쪼갤 수 있는 영어에 비해 어려움이 있고, 신조어와 줄임말도 많다. 게다가 각 게임마다 접근해야하는 용어가 너무 달라 다르게 접근 해야 한다.

넥슨에서는 트렌딩 키워드를 분석하고자 각 게임에 맞춘 한국어 명사 사전을 구축해 트렌딩 키워드 점수 매기는 방식을 준비했다. 점수가 높은 키워드를 상위권으로 올려 해당 키워드에 대한 리포트를 제공해 빠른 대응에 나설 수 있도록 준비하는 시스템을 구축하고자 한 것이다. 사전 구축 과정에서는 명사 뒤에 조사가 오거나 하나의 명사 뒤에 다양한 조사가 오는 한국어의 특성이 반영됐다.

다만 이 과정에서 단순히 많이 나오는 단어와 조사에 높은 트렌딩 점수를 부가하는 것을 방지하고자, IDF(inverse document frequency) 기법으로 분석해 점수에 차별을 뒀다. 도배글 같은 경우 단어 점수 갱신에 문제가 있을 수 있어 반영 한도를 정하는 등의 체계도 구축했다. 사전 구축 이후 트렌딩 키워드를 분석할 때는 안, 저, 그, 말, 다 등 일상에서 자주 사용하는 언어들이 트렌딩 키워드 상위권에 자리하고 있을 경우 데이터를 가공해 보고서를 전달했다고 한다. 보고서에 안, 저, 그 등의 의미 없는 노이즈가 많을수록 신뢰도가 떨어지기 때문이다. 해당 단어들이 큰 의미가 없다면 데이터를 가공하는 것이 큰 문제가 없다는 얘기다.

NDC 2016 트렌딩 키워드
세션
NDC 2016 트렌딩 키워드 세션

이태윤 시니어 프로그래머는 실제로 넥슨이 구축한 해당 시스템을 통해 인기 예능인 무한도전의 지난 2년을 분석해 현장에서 결과를 보여줬다. 실제 결과도 고개를 끄덕일 수 있는 모습으로 나왔다. 특정 멤버가 사건에 얽혔을 때나 90년대의 인기 가수들의 무대를 다시 꾸민 '토토가' 등이 방영된 시점을 살펴보면 해당 사건과 방영에 딱 맞아 떨어지는 키워드가 상위권을 차지하는 모습을 보였다.

그렇다면 실제로 트렌딩 키워드 분석이 게임 서비스에 어떤 도움이 됐을까. 트렌딩 키워드 분석은 주 단위는 물론 매일 실시간으로 진행할 수 있는 만큼 빠르게 특정 단어가 급부상하고 있는 것을 파악할 수 있다. 넥슨은 이를 활용해 모 퍼블리싱 게임에서 핵과 관련한 이슈가 있는 것을 보고 빠르게 대처했다고 한다. 일부 이용자가 알고 있는 이슈가 더욱 확대되기 전에 대응에 나선 사례다.

NDC 2016 트렌딩 키워드
세션
NDC 2016 트렌딩 키워드 세션

게임동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.