챗GPT 취약점 발견하면 최대 2만달러 보상

오픈AI는 인공지능(AI) 챗봇 ‘챗GPT’ 등 자신들의 AI 시스템에서 취약점을 찾아내면 최대 2만 달러(약 2650만 원)를 주는 보상프로그램을 시행한다고 11일 밝혔다.

블룸버그통신 등에 따르면 오픈AI는 이날 공식 블로그를 통해 자신들의 AI 제품을 이용하는 과정에서 버그(오류)나 보안 취약점 등을 발견해 보고하면 현금보상을 하는 ‘버그 바운티'(bug bounty) 프로그램을 시행한다고 발표했다.

보안 총괄인 매튜 나이트가 작성한 이 게시물에서 오픈AI는 ‘버그 바운티’ 플랫폼인 버그크라우드와 제휴해 이 프로그램을 진행한다면서 이용자가 발견한 취약점의 정도에 따라 최대 2만 달러의 현금 보상을 할 계획이라고 말했다.

나이트는 “이 프로그램이 안전한 첨단 AI를 개발하는 노력의 필수적인 부분”이라며 “안전하고 신뢰할 수 있는 기술과 서비스를 개발하기 위해 여러분의 도움이 필요하다”고 강조했다.

버그크라우드에 게시된 오픈AI 바운티 프로그램 관련 페이지에는발견하는 데 있어 탈옥을 유도 명령어(jailbreak prompts)로 규정하고, 악성코드를 작성하게 만드는 질문과 나쁜 말을 하게 만드는 질문 등 보상금 지급 대상에서 제외되는 안전과 관련 내용들이 자세하게 설명돼 있다.

앞서 오픈 AI의 공동창업자이자 사장인 그레그 블록먼은 최근 트위터를 통해 취약점을 찾아내기 위해 바운티 프로그램 등의 시행을 고려하고 있다고 언급한 바 있다.

그는 챗GPT와 같은 챗봇의 안전장치를 우회하는 프롬프트를 모아놓은 웹사이트를 운영하는 22년 경력의 탈옥 전문가 알렉스 앨버트의 게시물에 대한 답변으로 이같이 말했다고 블룸버그는 덧붙였다.

버그크라우드에 게시된 오픈AI 바운티 프로그램 관련 페이지
버그크라우드에 게시된 오픈AI 바운티 프로그램 관련 페이지 버그크라우드 관련 페이지 캡처