“유료 택한 GPT-4, 구체적 스펙 공개 않는다”

소프트웨어정책연 특집보고서 “악의적 질문에 대한 ‘면역력’ 강화”

챗GPT
챗GPT [오픈AI 홈페이지 캡처. 재판매 및 DB 금지]

오픈AI가 더 ‘똑똑해진’ 인공지능(AI) 툴 GPT-4를 유료로 서비스하면서 구체적인 스펙을 베일 속에 감춰둘 것이란 전망이 나왔다.

소프트웨어정책연구소는 16일 ‘GPT-4 개요와 특징’을 주제로 낸 특집 보고서를 통해 이같이 전했다.

연구소는 “오픈AI가 비영리 재단에서 영리 및 MS와 합작하는 형태로 전환하면서 GPT-4가 기존 대비 얼마나 더 크고, 왜 더 나은지에 대해 언급하지 않을 것”이라는 미국 MIT[038340] 테크놀로지 리뷰 분석을 소개했다.

소프트웨어정책연구소는 “GPT-4를 지난 2년간 개발하면서 악성 질문에 대한 대응 훈련을 통해 신뢰성이 향상되고 윤리적인 측면에서 답변하도록 진화했다”고 진단했다.

오늘날의 챗봇이 사용자가 악의적인 프롬프트(질문)를 입력하면 편향적이거나 거짓 정보를 학습해 대답하는 등 쉽게 오염되는 경향이 강했는데, GPT-4는 이들보다 ‘면역력’을 강화했다는 것이다.

오픈AI 개발진들은 GPT-4를 섬세하게 다듬는 작업(파인튜닝)에 6개월을 썼고, 결과적으로 기존 GPT 툴 대비 윤리적으로 82% 안전하고, 40% 더 정확한 GPT-4를 완성했다고 발표했다.

"유료 택한 GPT-4, 구체적 스펙 공개 않을 것" - 2

지난해 말 먼저 공개한 챗GPT 사용자들이 제출한 피드백과 50명 이상 전문가가 낸 피드백도 반영했다.

연구소는 “오픈AI는 챗GPT 실제 활용을 통해 얻은 결과와 데이터를 GPT-4 안전성 연구에 적용했으며 지속적인 업데이트를 진행 중”이라고 설명했다.

다만 연구소는 “GPT-4는 여전히 사회적 편견, 환각(할루시네이션), 악의적인 프롬프트에 대해 한계를 갖고 있고 이는 개발진도 언급한 사항”이라고 지적했다.

또, 음성, 이미지 등 입력값이 다양해지며 성능이 향상된 측면이 있지만, 챗GPT보다 GPT-4가 추론이 미흡한 사례도 있다고 소개했다.

연구소에 따르면 ‘너비가 무한한 출입구를 통과하기에 탱크와 자동차 중 어느 것이 더 나은가’라는 질문에 GPT-4는 “무한히 넓다는 것은 출입구의 폭 제한이 없으므로 둘 다 통과할 수 있다”는 다소 뻔한 답을 내놓았다.

반면, 전작인 챗GPT는 “둘 다 통과가 가능할 테지만, 출입구의 높이와 깊이에 대한 고려가 필요하다”고 답해 더 나은 추론 능력을 보이기도 했다.