[Reinforcement Learning] 출구전략(1): Introduction
출구전략은 TV프로그램 대학전쟁2에서 소개된 게임이다.
출구와 장애물이 존재하는 7*7 크기의 격자 게임판에서 진행되는 게임으로, 전후좌우 4방향으로 직선 이동만 가능한 이동말 6개 중 2개를 먼저 탈출시키면 승리하는 게임이다.
이 게임을 웹 상에서 플레이할 수 있도록 KnY에서 개발하고 있다.
https://stockofjobless.tistory.com/69
웹게임 개발기 (1) - 웹게임을 만들어보자
웹게임을 개발하게된 계기는 대학전쟁2를 보던 중 출구전략2 라는 게임을 봤는데, 이건 친구들끼리 하기에도 매우 좋아보이는 구조로 돌아가는 게임이었다. 두 팀이 서로 돌아가면서 각 팀에서
stockofjobless.tistory.com
두 플레이어가 대결하는 PvP 모드 외에 싱글 플레이 모드도 개발하기 위해
출구전략 게임을 플레이하는 인공지능 모델을 강화학습을 통해 구현하고자 한다.

우선 모델의 학습 환경을 구현하면서 동시에 모델의 성능을 확인해볼 수 있는 시뮬레이션 게임을 만들어보기로 하자.
Python library인 streamlit을 이용해 유저가 플레이할 수 있도록 게임을 구현하였다.
https://app-test-4wbaujyuavq3gkqfovlazi.streamlit.app/
app
This app was built in Streamlit! Check it out and visit https://streamlit.io for more awesome community apps. 🎈
app-test-4wbaujyuavq3gkqfovlazi.streamlit.app

삐걱거리지만 어느정도 돌아가는 수준까지는 구현하였다.
이제 주어진 Map을 보고 적절한 말과 이동 방향을 결정하는 강화학습 모델을 구현하고 학습시킬 예정이다.