알파고 vs 이세돌: 딥러닝이 바둑을 정복한 날 | AI 연대기 | NJOY-AI

'불가능한 게임'의 함락

바둑은 오랫동안 AI의 마지막 보루였습니다. 경우의 수가 우주의 원자 개수보다 많은 10의 170승에 달해, 체스처럼 무차별 탐색으로는 절대 풀 수 없는 게임이었습니다. AI 전문가들은 "컴퓨터가 프로 바둑 기사를 이기려면 10년은 더 걸릴 것"이라 전망했습니다.

2016년 3월, 그 예측이 완전히 빗나갔습니다.

딥블루와 달리 알파고는 딥러닝 + 강화학습의 결합이었습니다.

지도 학습(Supervised Learning): 인간 프로 기사들의 기보 16만 게임을 학습해 "이 상황에서 프로는 여기에 둔다"를 예측하는 정책 신경망(Policy Network)을 구축했습니다.

강화 학습(Reinforcement Learning): 알파고가 자기 자신과 수백만 게임을 두며 어떤 수가 실제로 승리로 이어지는지 학습했습니다. 인간의 기보를 넘어선 독자적 전략이 여기서 나왔습니다.

몬테카를로 트리 탐색(MCTS): 완전 탐색 대신 유망한 경로만 선택적으로 탐색해 계산 효율을 높였습니다.

이 대결에서 유일하게 이세돌이 이긴 4국은 AI 역사에서 특별히 기록됩니다. 78수 '신의 한 수'라 불리는 이 수에 알파고의 승률은 70% 이상에서 급락했습니다.

알파고 팀의 분석에 따르면, 이 수는 알파고가 학습한 수천만 게임의 기보에 단 한 번도 등장하지 않은 완전히 새로운 수였습니다. 인간의 창의성이 AI를 일시적으로 돌파한 역사적인 장면이었습니다.

이 대결은 AI에 대한 대중과 산업계의 시각을 영구히 바꿔 놓았습니다.

AlphaGo Zero(2017): 인간 기보 없이 자기 대국만으로 학습, 원래 알파고를 100전 100승으로 제압. "인간 지식 없이도 초인적 성능에 도달한다"는 충격적 발견
AlphaFold(2020): 같은 딥러닝+강화학습 접근으로 단백질 구조 예측을 해결, 생명과학의 판도를 바꿈
산업 전반의 AI 투자 급증: 알파고 쇼크 이후 전 세계 AI 스타트업 투자가 폭발적으로 증가

이세돌은 2019년 은퇴 선언과 함께 이렇게 말했습니다. "AI는 지지 않는다. 인간은 AI를 결코 이길 수 없다."