이세돌 잡은 AI… 최강 프로게이머도 제압하다

유용하 기자

입력 2019-10-30 17:34

업데이트 2020-08-17 10:04

글씨 크기 조절
글자크기 설정

닫기

글자크기 설정 시 다른 기사의 본문도 동일하게 적용 됩니다.
- 가
- 가
- 가
- 가
- 가
프린트
공유하기
공유

닫기
- 페이스북
- 네이버블로그
- 엑스
- 카카오톡
- 밴드
https://www.seoul.co.kr/news/society/science-news/2019/10/31/20191031024003
URL 복사
댓글
14

바둑 이어 ‘스타크래프트2’까지 압승

알파스타, AI끼리 대전하며 학습 훈련
상위 0.2% ‘그랜드마스터’급 실력 갖춰
테란으로 프로토스 상대 땐 승률 100%
예측불가 상황 대처… 범용AI 적용 기대

이미지 확대

프로토스족으로 게임을 하는 알파스타가 저그족의 공중 공격을 피닉스와 아콘이라는 유닛으로 효과적으로 막고 방어하는 모습. 구글 딥마인드 제공 — 프로토스족으로 게임을 하는 알파스타가 저그족의 공중 공격을 피닉스와 아콘이라는 유닛으로 효과적으로 막고 방어하는 모습.
구글 딥마인드 제공

2016년 3월 이세돌 9단과 맞붙은 바둑 인공지능(AI) ‘알파고’는 압승을 거둬 바야흐로 AI의 시대가 다가왔음을 전 세계에 알렸다.

이세돌 9단과 맞붙었던 ‘알파고 리’를 개발해 AI에 대한 관심을 집중시켰던 구글 딥마인드는 이후 꾸준히 성능을 향상시켜 ‘알파고 마스터’, ‘알파고 제로’를 선보였다. 지난해 12월에는 바둑뿐만 아니라 체스, 쇼기(일본 장기) 등 모든 보드게임이 가능한 ‘알파 제로’를 공개해 세상을 놀라게 했다. 같은 달 ‘알파 폴드’라는 과학 AI로 생명의 기본 분자인 단백질 3차원 형태를 예측하는 국제학술대회에서 우승을 차지하기도 했다.

올해 초 딥마인드는 실시간 전략 시뮬레이션 게임인 ‘스타크래프트2’를 할 수 있는 AI ‘알파스타’를 공개했다. 알파스타는 세계 정상급 프로게이머와 대결해 압도적인 실력을 보였다. 구글 딥마인드 연구진과 네덜란드 프로게임팀 ‘팀 리퀴드’는 알파스타를 업그레이드시켜 전 세계 프로게이머들 중에서도 상위 0.2%에 해당되는 실력을 갖게 됐음을 확인하고 그 결과를 세계적인 과학저널 ‘네이처’ 31일자에 발표했다.

스타크래프트는 서로 다른 특성과 능력을 가진 3개 종족인 테란, 프로토스, 저그 중 하나를 선택해 상대와 승부를 겨루는 게임이다. 인간 프로게이머들은 ‘테란의 황제’나 ‘프로토스의 황제’ 같은 별명에서도 알 수 있듯 하나의 종족에 강점을 갖고 게임을 하는 경우가 많다.

이미지 확대

지난 1월 구글 딥마인드의 인공지능 알파고 개발을 이끈 데이비드 실버(가운데) 박사와 연구진이 새로 개발한 ‘알파스타’가 프로게이머들과 스타크래프트2 게임을 진행하는 것을 지켜보고 있는 장면. 구글 딥마인드 제공 — 지난 1월 구글 딥마인드의 인공지능 알파고 개발을 이끈 데이비드 실버(가운데) 박사와 연구진이 새로 개발한 ‘알파스타’가 프로게이머들과 스타크래프트2 게임을 진행하는 것을 지켜보고 있는 장면.
구글 딥마인드 제공

그런데 이번에 공개된 알파스타는 사람과 달리 3종족 모두에서 ‘그랜드마스터’급 실력을 갖춘 것으로 확인됐다. 온라인 게임이 이뤄지는 ‘배틀넷’에서 모든 게이머들은 실력에 따라 가장 낮은 브론즈에서 실버, 골드, 플래티넘, 다이아몬드, 마스터, 그랜드 마스터 7단계로 구분되는데 알파스타는 최고 수준에 이르렀다는 것이다.

실제로 알파스타의 전체 평균 승률은 99.8%로 나타났다. 승률이 가장 낮은 경우는 저그를 선택해 프로토스를 상대했을 때로 99.51%, 승률이 가장 높을 경우는 테란으로 프로토스를 상대했을 때인데 모든 게임에서 이겼다. 또 알파스타는 1대3의 승부에서도 99.76~99.93%의 승률을 보였다.

연구팀은 알파스타를 ‘멀티 에이전트 강화학습’(MARL) 알고리즘으로 훈련시켰다. MARL은 주어진 환경에서 높은 보상을 얻을 수 있는 행동이나 전략을 구상하라는 간단한 목적만 부여받은 여러 개의 AI(에이전트)들이 협업과 경쟁을 통해 학습할 수 있도록 한 알고리즘이다. 지금까지 나온 AI들은 스타크래프트처럼 자원 수집, 건설, 전투유닛 생산과 제어는 물론 상대방의 정보를 토대로 전략을 끊임없이 수정하는 등의 복잡한 사항들을 실시간으로 수행하는 데는 한계가 있어 인간 프로게이머와의 경기에서 승리는 쉽지 않을 것이라는 평가를 받아 왔다. 그런데 연구팀은 MARL 알고리즘으로 이 같은 우려를 날려버렸다.

이번 연구를 주도한 오리올 빈얄스 구글 딥마인드 수석과학자는 “AI가 실제로 활용될 것으로 예상되는 개인 비서, 자율주행차, 로봇 등 분야에서는 스타크래프트에서처럼 불완전한 정보로 최적의 답을 찾거나 실시간 결정을 해야 하는 상황에 맞닥뜨리게 된다”며 “이번 연구에서 보여 준 알파스타의 성공은 특정 분야가 아니라 모든 분야에서 활용할 수 있는 범용 AI 알고리즘이 실제 문제에서도 적용될 수 있다는 것을 보여 준다”고 말했다.

지난 27일부터 31일까지 미국 샌프란시스코에서 열리고 있는 ‘미국외과의사협회 2019 임상회의’에서는 외과 수술 이후 환자의 치료 방법을 선택할 때 인간 의사보다 AI 의사가 더 정확하고 올바른 선택을 한다는 미국 뉴욕대 의대 부설 랑곤병원 연구진의 연구 결과가 발표되기도 했다.

수술 환자들은 중환자실에서의 집중 치료, 장기 입원 치료, 단기 입원 후 통원 치료를 받게 된다. 지금까지 수술 후 치료 방법의 선택은 전적으로 의사 판단에 맡겨져 있었지만 연구진은 환자와 관련한 87개 임상 변수와 15개 기준을 바탕으로 AI 의사가 판단하도록 한 뒤 회복 속도와 환자의 만족도를 관찰했다. 그 결과 치료 방법 선택에 대한 의학적 정확도, 환자의 예후와 만족도 모두 인간 의사보다 AI 의사가 12~15% 높은 것으로 나타났다.

유용하 기자 edmondy@seoul.co.kr

2019-10-31 24면