한국어 능숙한 ‘K-챗GPT’ 기반 구체화…문체부, 3개 워킹그룹 발족
2023년 02월 22일(수) 20:10
고품질 한국어 말뭉치 구축 확대
2027년까지 10억 어절 구축 계획

챗GPT의 발달로 숙제나 시험에 활용하는 사례가 늘어나는 가운데 대학들도 대응책 마련에 부심하고 있다. 사진은 KT DS에서 출시한 부정행위 탐지 솔루션 아르고스.

전 세계적으로 인공지능 챗GPT의 관심이 높은 가운데 ‘한국어를 잘하는 K-챗GPT’ 기반을 마련하기 위한 움직임이 구체화되고 있다.

챗GPT는 AI기술을 활용해 정보를 제공받을 수 있는 컴퓨터 프로그램이다. 현재 챗GPT은 인터넷에 있는 정보를 검색해 완성된 문장 형태로 답변을 해주며 수준도 높은 편으로 알려져 있다.

문화체육관광부는 챗GPT로 대변되는 생성형 AI기술 변화에 따라 문화와 제도, 산업적 기반을 마련하기 위해 3개의 워킹그룹을 발족한다.

‘한국어 잘하는 AI’를 위한 한국어 말뭉치 학습, 저작권 제도 개선, 콘텐츠 창작과 산업에서의 AI 활용이 그것이다. 세 분야 워킹그룹을 통해 전문가와 문체부가 긴밀히 논의해 정책적인 답을 찾는다는 방침이다.

가장 눈에 띄는 부분은 ‘한국어를 잘하는 K-챗GPT’이다. 챗GPT이 영어권에서 개발된 탓에 한국어 대응이 아쉽다는 반응이다. AI의 한국어 학습을 위한 고품질 말뭉치의 필요성이 제기되는 이유다.

문체부와 국립국어원은 ‘한국어를 잘하는 K-챗GPT’ 개발을 지원하기 위해 고품질 한국어 말뭉치 구축을 확대한다는 복안이다. 문체부는 인공지능 개발 현장 수요를 파악할 수 있는 워킹그룹을 23일 준비회의를 거쳐 오는 3월 8일까지 운영할 계획이다.

워킹그룹은 인공지능과 말뭉치 구축 전문가, 학계 전문가, 문체부와 국어원 연구원으로 구성되며 인공지능 기술 개발에 필요한 말뭉치 수요를 파악한다. 이후 2027년까지 한국어 특성을 반영한 고품질 말뭉치 10억 어절 구축 계획을 세울 예정이다.

무엇보다 올해 한국형 챗GPT가 개발될 수 있도록 25종 약 1억2000만 어절의 고품질 한국어 말뭉치도 구축해 배포할 예정이다. 인공지능 언어모델이 한국어를 잘 이해하고 생성하는지 나아가 한국의 문화와 사회 지식을 갖추고 있는지 검증하는 평가시스템도 시범 운영한다.

AI 기술 발전에 따라 저작권 문제도 새롭게 대두되고 있다. 문체부는 24일 AI 저작권법 제도개선 워킹그룹을 발족한다. 이 워킹그룹에서는 AI 학습데이터에 활용되는 저작물의 이용 방안을 비롯해 AI 산출물의 법적 지위문제, 저작권 제도에서의 인정여부 등을 논의한다. 이러한 부분은 AI 활용과 맞물려 제기될 수 있는 저작권 침해와 이에 대한 책임 규정 방안과 연관돼 있다.

아울러 문체부는 콘텐츠 분야에서의 AI 활용에 대응하기 위한 차원으로 ‘콘텐츠 분야 AI TF’를 구성했다. 우리나라 AI 의 선구자인 김진형 한국과학기술원 명예교수 외에 AI 관련 학계와 업계 관계자 9명으로 구성됐다.

‘콘텐츠 분야 AI TF’는 지난 15일 첫 회의를 열고 AI 활용 범위가 문화, 콘텐츠로 확산되는 추세에 따라 콘텐츠 산업에 AI가 성공적으로 내재화할 수 있도록 정기적 회의를 개최한다는 방침이다.

한편 문체부는 TF를 통해 청취한 의견과 제언을 종합해 AI를 활용한 콘텐츠산업 분야 지원 대책을 오는 5월까지 마련한다는 계획이다.

/박성천 기자 skypark@kwangju.co.kr
오피니언더보기

기사 목록

광주일보 PC버전
검색 입력폼