슈퍼 마리오의 32개 스테이지 중 29개를 통과한 AI입니다. PPO ( Proximal Policy Optimization) 알고리즘을 사용해 제작된 파이썬 소스 코드가 출처 링크에 있습니다.
32개 중에서 3개를 통과하지 못한 이유는, 길을 잘못 골랐을 경우 왔던 길로 되돌아간다고 하는군요. 그래서 최단의 경로를 찾아 앞으로 나아가는 방법으론 통과가 안됐다고 합니다.
참고/링크 | https://github.com/uvipen/Super-mario-bros-PPO-pytorch |
---|
슈퍼 마리오의 32개 스테이지 중 29개를 통과한 AI입니다. PPO ( Proximal Policy Optimization) 알고리즘을 사용해 제작된 파이썬 소스 코드가 출처 링크에 있습니다.
32개 중에서 3개를 통과하지 못한 이유는, 길을 잘못 골랐을 경우 왔던 길로 되돌아간다고 하는군요. 그래서 최단의 경로를 찾아 앞으로 나아가는 방법으론 통과가 안됐다고 합니다.
이미지분석을 사용하는거면 슈퍼마리오 메이커 기록 세우는 데에 사용할 수도 있겠군요