포켓몬 마스터에 도전하는 AI, 라이브 방송도 켰다

신승원 sw@gamedonga.co.kr

AI가 포켓몬 마스터에 도전한다.

지난 25일 앤스로픽은 자사의 최신 AI 모델 ‘클로드 3.7 소넷(이하 클로드)’이 포켓몬 레드를 플레이하는 트위치 방송을 시작했다. 해당 방송은 클로드의 강점과 한계를 평가하고, AI의 추론 능력을 실험하기 위해 기획된 프로젝트다. 클로드는 포켓몬에 대한 별도의 훈련을 받지 않았으며, 오직 일반적인 추론 과정을 통해 게임을 플레이한다.

클로드는 포켓몬 레드를 플레이할 수 있도록 다양한 시스템을 결합한 방식으로 작동한다. 먼저, 클로드가 가상 버튼을 눌러 게임을 제어할 수 있는 맞춤형 인터페이스를 사용한다. 게임 화면은 스크린샷을 통해 분석하며, 이를 통해 화면에서 어떤 일이 일어나고 있는지 해석한다. 다만 클로드의 게임보이 화면 이해 능력은 완벽하지 않아 종종 화면을 잘못 해석하는 모습을 보이기도 한다.

아울러 클로드는 게임 세계에 대한 메모 세트를 유지하며, 위치, 포켓몬 팀 상태, 게임 메커니즘에 대한 정보를 지속적으로 저장하고 업데이트한다. 또한 탐색 시스템을 통해 화면의 특정 지점으로 이동하는 최적의 경로를 찾으며 효율적인 탐색을 돕는다. 여기에 게임의 메모리에서 현재 위치나 파티 구성과 같은 정보를 얻는 메모리 리더 기능도 활용한다. 이를 통해 클로드가 화면을 잘못 해석하더라도 혼란스러운 상황을 줄이고, 안정적으로 게임을 진행할 수 있도록 한다.

사람의 도움 없이 플레이하는 만큼 클로드의 게임 진행 속도는 상당히 느리며, 막힌 벽 앞에서 한참 동안 고민하거나 같은 구간을 반복하는 모습도 자주 볼 수 있다. 하지만 이러한 시행착오에도 불구하고 클로드는 지금도 꾸준히 게임을 진행하며 포켓몬 마스터에 도전하고 있다. 방송은 트위치의 ‘클로드플레이스포켓몬(ClaudePlaysPokemon)’에서 확인할 수 있다.

앤스로픽의 한 관계자는 “이것은 클로드라는 이름의 대규모 언어 모델(LLM)이 고전 게임보이 게임인 포켓몬 레드를 완전히 혼자 플레이하는 실험이다. 미리 정해진 규칙을 따르는 기존 게임 봇과 달리 클로드는 무슨 일이 일어나고 있는지 직접 보고, 게임 상태를 이해한 뒤 사람처럼 스스로 결정을 내릴 수 있다.”라고 말했다.

클로드가 플레이하는 방송 화면
클로드가 플레이하는 방송 화면

게임동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.