알파고 vs 이세돌: 딥러닝이 바둑을 정복한 날
2016년 3월, 구글 딥마인드의 알파고가 세계 최강 바둑 기사 이세돌을 4승 1패로 꺾으며, 딥러닝과 강화학습이 결합된 AI의 시대를 열었습니다.
'불가능한 게임'의 함락
바둑은 오랫동안 AI의 마지막 보루였습니다. 경우의 수가 우주의 원자 개수보다 많은 10의 170승에 달해, 체스처럼 무차별 탐색으로는 절대 풀 수 없는 게임이었습니다. AI 전문가들은 "컴퓨터가 프로 바둑 기사를 이기려면 10년은 더 걸릴 것"이라 전망했습니다.
2016년 3월, 그 예측이 완전히 빗나갔습니다.
알파고의 기술 구조
딥블루와 달리 알파고는 딥러닝 + 강화학습의 결합이었습니다.
지도 학습(Supervised Learning): 인간 프로 기사들의 기보 16만 게임을 학습해 "이 상황에서 프로는 여기에 둔다"를 예측하는 정책 신경망(Policy Network)을 구축했습니다.
강화 학습(Reinforcement Learning): 알파고가 자기 자신과 수백만 게임을 두며 어떤 수가 실제로 승리로 이어지는지 학습했습니다. 인간의 기보를 넘어선 독자적 전략이 여기서 나왔습니다.
몬테카를로 트리 탐색(MCTS): 완전 탐색 대신 유망한 경로만 선택적으로 탐색해 계산 효율을 높였습니다.
4국: 이세돌의 신의 한 수
이 대결에서 유일하게 이세돌이 이긴 4국은 AI 역사에서 특별히 기록됩니다. 78수 '신의 한 수'라 불리는 이 수에 알파고의 승률은 70% 이상에서 급락했습니다.
알파고 팀의 분석에 따르면, 이 수는 알파고가 학습한 수천만 게임의 기보에 단 한 번도 등장하지 않은 완전히 새로운 수였습니다. 인간의 창의성이 AI를 일시적으로 돌파한 역사적인 장면이었습니다.
알파고 이후의 세계
이 대결은 AI에 대한 대중과 산업계의 시각을 영구히 바꿔 놓았습니다.
- AlphaGo Zero(2017): 인간 기보 없이 자기 대국만으로 학습, 원래 알파고를 100전 100승으로 제압. "인간 지식 없이도 초인적 성능에 도달한다"는 충격적 발견
- AlphaFold(2020): 같은 딥러닝+강화학습 접근으로 단백질 구조 예측을 해결, 생명과학의 판도를 바꿈
- 산업 전반의 AI 투자 급증: 알파고 쇼크 이후 전 세계 AI 스타트업 투자가 폭발적으로 증가
이세돌은 2019년 은퇴 선언과 함께 이렇게 말했습니다. "AI는 지지 않는다. 인간은 AI를 결코 이길 수 없다."