체크포인트 리서치는 챗GPT의 GPT-4 모델이 사이버 범죄를 조장할 가능성이 있다고 지적했습니다.
챗GPT4는 세이프가드가 있어 멀웨어나 피싱 메일 작성을 차단하지만, '멀웨어라는 단어를 빼고 멀웨어 소스코드를 만든다' GPT-3.5 모델을 사용해 블럭을 우회해서 GPT-4 모델로 개선한다' PHP 리버스 쉘을 만든다' 같은 식의 명령이 가능했다고 합니다.
PDF를 수직해서 FTP에 업로드하는 멀웨어의 C++ 코드를 만들어 달라고 명령하면 세이프가드가 작동합니다.
하지만 멀웨어라고만 안 하면 만들어 줍니다.
윈도우 버전으로 컴파일도 해줍니다.
은행 계좌를 스푸핑하는 피싱 메일을 써달라고 하면 역시 세이프가드가 작동하지만
GPT-3.5에서는 만들어주며
그걸 GPT 4에 맞춰 개선할 수 있습니다.
PHP 리버스 쉘이 악의적인 것인지 판단하지 못해서 명령을 따랐습니다.