배너 닫기
맨위로

SK텔레콤, 국립국어원과 AI 한국어 모델 개발 협력

한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지

등록일 2021년04월09일 14시59분 URL복사 기사스크랩 프린트하기 이메일문의 쪽지신고하기
기사글축소 기사글확대 트위터로 보내기싸이월드 공감 네이버 밴드 공유

SK텔레콤, 국립국어원과 AI 한국어 모델 개발 협력

한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지, 인공지능 개발에 필요한 언어 정보자원을 지속해서 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축할 것

 

왼쪽부터 SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장과

국립국어원 정희원 어문연구실장이 협약을 체결한 후 기념 촬영을 가졌다

 

SK텔레콤이 국립국어원과 국립국어원의 언어 정보를 활용해 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하기 위해 업무 협약을 체결했다.

차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3*와 유사한 성능을 발휘하는 한국어 범용 언어 모델(이하 GLM, General-Purpose Language Model)이다. 언어 관련 문제 풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에도 구현할 수 있다. GLM은 일상의 감성 대화, 다양한 업종의 고객센터 대화뿐만 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대한다.

SKT가 개발하는 GLM은 1500억개의 매개변수*를 가진 거대 언어 개발 모델이다. 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고 더욱더 높은 정확도와 넓은 활용도를 가진 점을 고려하면 GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다.

SKT는 올해 말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한 한국어 언어 모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다.

SKT는 2018년부터 AI 언어 모델을 개발해 왔으며, 2019년 KoBERT를 개발해 챗봇 등에 활용하고 있다, 2020년 4월 KoGPT-2를 개발 완료해 챗봇의 대화를 더욱더 자연스럽게 발전했으며, 2020년 10월에는 뉴스나 문서를 고품질 요약문으로 만들어내는 능력 등 텍스트 처리 역량이 뛰어난 KoBART를 개발해 자연어 이해 처리 영역의 기술력을 강화해 왔다.

이와 함께 국립국어원은 ‘2021년 국어 정보처리 시스템 경진대회’를 SKT의 AI 언어 모델을 활용해 AI의 언어소통 능력을 겨루는 방식으로 개편해 한글 주간에 개최하기로 했다.

SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장은 “SKT는 한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다”며 “이번 국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 이바지할 계획”이라고 밝혔다.

국립국어원 정희원 어문연구실장은 “앞으로도 인공지능 개발에 필요한 언어 정보자원을 지속해서 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다”고 말했다. ANN

 

*GPT-3은 Open AI가 개발한 영어 기반의 최신 AI 언어 모델로 기존 GPT-2보다 자연스러운 언어 표현이 가능하고 범용적 사용이 가능하다.

*매개변수는 서로 다른 함수에 공통으로 영향을 미치는 변수로 일반적으로 매개변수가 많을수록 언어 모델의 성능이 높아진다.

 

박정호 SK텔레콤 대표이사, 소강춘 국립국어원 원장

자료_ SK텔레콤 

김정연‧전예원 기자 이기자의 다른뉴스
올려 0 내려 0
관련뉴스 - 관련뉴스가 없습니다.
유료기사 결제하기 무통장 입금자명 입금예정일자
입금할 금액은 입니다. (입금하실 입금자명 + 입금예정일자를 입력하세요)