광주일보

[굿모닝 예향] 챗 GPT 시대, 우리는 준비되어 있는가?

2024년 01월 15일(월) 19:20 가가

작가 ‘AI’
원하는 이미지 글로 묘사 이미지 생성…명령어 반복 실행 가능
데이터 풍부해야 다양한 그림 완성돼…복잡한 표현력엔 한계
이미지 생성은 가능하지만 창조적·예술적 영역은 ‘인간의 몫’

미드저니에 프롬프트를 입력해 생성한 ‘침대 위에 눈을 감고 누워있는 백설공주에게 왕자가 입맞춤’을 하고 있는 이미지. 유명 작가별 화풍을 추가로 명령해 레오나르도 다빈치, 파블로 피카소, 앤디 워홀, 빈센트 반 고흐 화풍으로 생성됐다. (사진 왼쪽부터) <박상지 씨 제공>

지난 2022년 11월 등장한 생성형 인공지능(AI) ChatGPT가 일상생활과 산업현장에 빠르게 스며들며 혁신적인 변화를 일으키고 있다. 인터넷(1994년)과 스마트 폰(2007년)을 뛰어넘는 AI혁명은 현재 진행중이다. 가까운 미래, 인간 수준의 ‘범용 인공지능’(AGI)개발은 인류에게 이익일까, 해악일까? 생성형 인공지능의 등장은 AI 시대에 인류의 미래에 철학적 물음표를 던진다. 인공지능(AI) 포털 서비스 스타트업 뤼튼테크놀로지스에서 선보인 ‘뤼튼’(Wrtn)을 활용해 그림 그리기에 도전한다.

챗GPT로 그림을 그린다? 쉽게 말해 글로 그림을 그린다는 얘기다. 그림에 소질이 없는 이들에게는 무척이나 솔깃한 주제임이 분명하다.

챗GPT 이용도 생소하지만 이를 이용한 그림 그리기에 도전해 보기로 한다. 생성형 AI를 이용한 그림그리기에 도전하기 전에 ‘프롬프트’라는 용어를 알고 있는 게 도움이 된다. 프롬프트는 일종의 명령어로, AI에 질문하는 기술, AI와의 대화법이라고 볼 수 있다. 프롬프트를 제대로 익혀야 활용 능력도 커진다.

이미지 생성 AI를 이용한 그림을 그릴 때 사용되는 대표적인 사이트는 오픈AI의 달리, 마이크로소프트의 빙, 스태빌리티AI의 스테이블디퓨전, 미드저니, 뤼튼 등 다양하다. 사용자가 원하는 이미지를 글로 묘사하면 해당되는 이미지를 ‘생성’해 보여준다. 대부분 유료 사이트로 운영되고 있다.

초보자인데다 아직은 특별히 상업적으로 이용할만한 필요 이미지가 없다보니 무료로 이용할 수 있는 뤼튼으로 선택했다. ‘뤼튼’은 우리나라 스타트업에서 출시한 생성형 AI 서비스이다. 문서 요약이나 이미지 생성, 코드 작성 등 다양한 작업을 수행할 수 있다는 장점이 있지만 무엇보다 무료 서비스라는 점이 높은 점수를 샀다.

무료사이트이긴 하지만 유료와 마찬가지로 회원가입부터 시작한다. 회원가입은 구글, 네이버, 카카오톡 이메일 주소 등 편한 것으로 가입하면 된다. 가입과 동시에 채팅창에 원하는 이미지를 설명하는 글을 쓰고 마지막에 ‘그려줘’ 또는 ‘Draw’라고 입력 후 엔터(Enter)키를 누르면 된다. 예상보다 훨씬 더 간단하다. 미드저니나 챗GPT처럼 영어로 가능한 서비스와 달리 뤼튼은 한국에 최적화 돼 있는 서비스라고 볼 수 있다.

뤼튼에게 요청해 생성한 ‘하늘로 오르기 전 도약을 준비하는 청룡’ 이미지. <뤼튼>

2024년이 용의 해이기도 해서 ‘하늘로 오르기 전 도약을 준비하는 청룡을 그려줘’라고 요청했다. 1분이 채 되지 않아 화면에 4가지 청룡 그림이 생성된다. 요청한 그림이긴 하지만 명령어를 인식해서 새롭게 그린 그림인지, 기존에 저장돼 있는 이미지를 가져온 것인지 알쏭달쏭하다.

좀 더 구체적인 이미지를 요청해 보기로 한다. ‘흰눈이 내리는 하늘에 청룡을 타고 날아가는 어린아이를 그려줘’ 명령어를 넣고 기다리는데 무응답이다. ‘청룡을 타고 날아가는 어린아이를 그려줘’로 줄였으나 여전히 답을 주지 않는다. 명령어에 익숙하지 않은 탓일 수도 있겠다.

기대감을 내려놓고 ‘고양이 그려줘’ 했더니 4가지의 각각 다른 고양이 이미지가 떠오른다. 문장체 보다는 간단한 단어로 요청하는 게 나을 것 같다는 판단이다. ‘노트북 작업 안경 여성 귀여운 캐릭터 그려줘’, ‘겨울 눈 강아지 그려줘’를 요청하자 어렵지 않게 결과물을 보여준다.

국내 스타트업에서 출시한 생성형 AI서비스 뤼튼이 생성한 ‘겨울 눈 강아지’ 이미지. <뤼튼>

실행자가 원하는 이미지가 나올 때까지 명령어를 더하거나 삭제하거나 여러차례 재반복해서 실행시킬 수 있다. 마음에 들지 않으면 ‘다시 생성’을 클릭해서 새로운 이미지를 받아볼 수도 있으며, 개별 이미지는 다운로드 받을 수도 있다.

무료 사이트라는 점 때문에 큰 기대를 하지 않은 게 사실이지만 복잡한 명령어나 형용사나 동사 등 일부 단어는 해석하지 못하는 것 같아 아쉽다. 실행자의 프롬프트 작성이 서툰 원인도 있을 것이다.

이미지 생성 AI를 보다 전문적으로 활용하고 있는 이를 만났다. AI를 기반으로 한 다양한 연구 작업을 진행하고 있는 박상지(전남대학교 대학원 문화학과 박사 수료)씨는 “AI가 그림을 그려준다고는 하지만 결코 간단하거나 쉬운 작업은 아니다”고 이야기한다.

“AI가 그림을 그려주기는 하지만 결국 한계에 부딪치게 돼요. 아무리 AI라고 해도 학습을 시켜야 됩니다. 인간이 피드백을 주며 하나하나 명령어를 입력해야 되기 때문에 실행자가 많은 정보를 알고 있는 게 도움이 돼요. 챗GPT와 협업을 해서 그림을 그리는 데에도 미술에 대한 기본적인 지식이 있어야 보다 나은 창작자의 그림이 완성됩니다. 머릿속에 있는 걸 말로 풀어낼 줄 알아야 하며, 미술에 대한 해박한 지식이 있다면 더욱 발전할 수 있겠죠. AI 이미지 제너레이터가 나왔다고 해서 인간의 영역, 예술가의 영역이 끝난 게 아니라는 걸 얘기하고 싶어요.”

박씨는 최근 ‘챗GPT와 미드저니를 활용한 AI 이미지 생성 연구’ 논문(교신저자 김경수)을 발표했다. 이미지 생성 AI인 미드저니가 유명 화가의 그림을 얼마나 잘 모사하는지, 또 프롬프터의 스토리별 명령을 얼마나 잘 수행하는지 직접 확인해보고 현재 이미지 생성 AI의 가능성과 한계성을 밝히기 위함이었다. 이같은 연구 결과물은 차세대컨버전스정보서비스학회 학술지 2023년 12월호에 게재됐다.

연구에는 챗GPT를 통한 이미지 생성 AI인 ‘미드저니’가 활용됐다. 유명동화인 ‘백설공주’를 12가지 챕터로 나누고 챕터별 이미지를 그려달라고 요청하는 것이다. ‘백설공주’를 택한 건 챗GPT 프롬프트에 ‘가장 유명한 동화’를 입력한 결과물이었기 때문이다.

챗GPT가 백설공주 스토리를 12개 챕터로 나누면 연구자가 이미지 생성을 위해 프롬프트를 단순화 시킨다.

‘일곱 난쟁이들이 긴 하루 일과를 마치고 집으로 돌아왔어요. 오두막집에서 잠든 아름다운 백설공주를 발견한 난쟁이들은 놀랍게도 백설공주가 잠들어 있는 것을 발견했습니다. 처음에는 조심스러웠지만 곧 백설공주가 해를 끼치려는 의도가 없다는 것을 깨달았습니다. 백설공주의 친절함에 감동한 그들은 백설공주를 따뜻하게 맞이하고 머물 곳을 제공했어요’의 스토리를 ‘일곱명의 난쟁이들이 오두막집 침대에서 깊이 잠들어있는 백설공주를 바라보고 있다’로 재구성하는 식이다.

여기에 보다 구체적인 명령어가 들어간다. 챗GPT가 추천한 서양미술 대표작가 4명 레오나르도 다빈치(르네상스), 빈센트 반 고흐(후기 인상파), 파블로 피카소(초현실주의), 앤디 워홀(팝아트)의 화풍, 기법, 스타일 등의 프롬프터를 추가로 명령했다. 이미지 결과물이 프롬프트와 다를 경우 삭제 요청을 하고, 누락된 경우 다시 구체적인 키워드를 추가 명령했다.

미드저니가 이해할 수 있을 때까지 최대 20회까지 명령한 후 가장 근접한 이미지 1장을 선택했다. 작가별로 12장씩 총 48장의 AI 이미지 결과물이 나왔다. 박씨는 결과물을 나열한 후 ‘작가별 모사 능력’과 ‘프롬프트별 이행 능력’ 미드저니의 2가지의 능력을 분석해 나갔다.

작가별 모사 능력을 분석한 결과 다빈치 이미지는 사실주의가 대부분 반영됐으며 특히 유화 느낌이 잘 드러났다. 고흐 이미지는 청색 계통만 주로 사용됐으며 인상주의 하풍은 거의 구현되지 않았다. 피카소 이미지는 대부분 색채주의와 큐비즘을 적용했으나 일부에만 적용된 경우가 많았다. 워홀 이미지는 극강의 색채, 인물중심의 묘사로 팝아트 화풍을 구현해 워홀 이미지에 근접하다는 느낌을 받았다.

프롬프트 이행력을 분석한 결과 다빈치와 고흐 이미지는 등장인물의 동작, 형태, 배경, 표정 등을 잘 이행했으며, 피카소 이미지는 인물, 형태, 동작, 개수는 잘 이행한 반면 표정의 반영은 부족했다. 워홀 이미지는 표정 반영은 잘 이행했으나 동작 이행은 부족했다.

박상지씨는 “이미지 생성 AI인 미드저니의 유명작가 모사 능력은 화법에 따라 다른 결과를 보였지만 프롬프트 이행능력은 대체적으로 양호한 결과가 나왔다”며 “모사 능력이 작가에 따라 차이가 나는 이유는 작가들의 그림 데이터가 적고 복잡한 그림의 표현력에는 한계가 있다는 방증이며, 반면 프롬프트의 이행력이 전반적으로 높은 이유는 백설공주 스토리의 많은 데이터를 축적하고 이해하고 있으며 표현할 수 있다는 의미다”고 결론 내렸다.

/이보람 기자 boram@kwangju.co.kr

실시간 핫뉴스

많이 본 뉴스