엔씨소프트, 연세대와 한국어 AI 데이터 구축 위한 공동 수업 개설
㈜엔씨소프트(대표 김택진, 이하 엔씨(NC))가 연세대학교 문과대학(이하 연세대)과 함께 2020년 한국어 구어 AI 학습 데이터 구축을 위한 학부 공동 수업을 진행한다.
엔씨(NC)와 연세대 문과대학 인문융합교육원은 대학혁신지원사업 디지털 인문융합 교육 프로그램의 일환으로 산학 연계 강의를 기획했다. 우리말을 AI로 활용하는데 필요한 양질의 언어 데이터를 확보하고, 인문학 기반의 4차 산업혁명 인재 양성에 기여한다는 취지다.
올해 1학기에 개설되는 수업은 '컴퓨터를 활용한 언어 분석'이다. 연세대 문과대학 김한샘 교수가 진행한다. 엔씨(NC)는 실제 언어 분석에 사용되는 온라인 작업 도구를 제공한다. 수업의 결과물이 실제 산업 현장에 활용되는 경험을 학생들에게 공유할 예정이다.
또 2학기는 '디지털 언어 데이터와 인문학' 수업을 개설한다. 감성, 감정, 욕구 등 인간 내면의 언어적 표출과 관련한 학습 데이터를 구축하는 수업이다. 연세대 언어정보학 협동과정 대학원과 산학과제도 진행할 계획이다.
엔씨(NC) NLP(Natural Language Processing, 자연어처리)센터에서 언어 AI R&D를 총괄하고 있는 이연수 실장은 "이번 연세대와의 산학협력 수업으로 구축될 '생략 복원 데이터'를 통해 AI가 우리말의 문맥을 더욱 잘 이해하고, 인간과 AI가 이를 기반으로 더욱 효율적인 대화를 할 수 있게 될 것으로 기대한다"고 말했다.
한편, 엔씨(NC)는 현재 연세대 언어정보연구원의 언어 자원 구축에 대해 자문 역할을 하고 있으며, 2019~2020년에 걸쳐 AI 챗봇 서비스의 성능 향상을 위해 연세대와 데이터/언어학 관점에서의 연구를 공동으로 진행하고 있다.