구글 딥마인드는 퀘이크 3의 멀티 플레이어에서 인간 이상의 승률을 가진 AI를 발표했습니다.
FTW Agent (For The Win)라는 이름의 이 AI는 각 시점에서 플레이 화면을 입력하는 RNN으로 학습을 실행합니다. 이미지에서 추출한 정보와 그 시점에서 게임 정보를 가지고 학습해 전략과 행동을 결정합니다.
FTW 에이전트는 2vs2로 진행하는 캡처 더 플래그 게임으로, 다른 동료와의 연계가 필수적입니다. 그래서 다른 플레이어와 협조해 전략적으로 행동하는 AI를 개발하는 것을 목표로 삼았습니다.
캡처 더 플래그는 상대방의 깃발을 뺏어 자신의 기지에 갖고가야 점수가 오릅니다. 즉 자기 진영에서 깃발을 지키고, 상대방 진영에 들어가 본진으로 돌아오는 등의 여러 전략이 존재합니다. 동료를 신경쓰지 않으면 각개격파당합니다.
무기는 레일 건 하나만, 그리고 캐릭터는 단순한 공으로 만들어서 처리했으나 치트는 쓰지 않았고, 게임 내 좌표를 쓰지 않고 반응 속도와 정확도를 의도적으로 떨어트라 사람과 가까운 조건으로 만들었습니다. 입력조차도 게임 패드를 흉내냈습니다.
딥마인드는 40명의 플레이어와 AI가 무작위로 팀을 구성해, 여러 맵에서 학습을 진행할수록 사람을 넘어서는 승률을 달성했다고 발표했습니다.