튜링 테스트: 기계도 생각할 수 있는가 | AI 연대기 | NJOY-AI

"기계는 생각할 수 있는가?"

1950년 10월, 영국의 수학자 앨런 튜링은 철학 저널 Mind에 "Computing Machinery and Intelligence(컴퓨팅 기계와 지능)"라는 논문을 발표했습니다. 이 논문의 첫 문장이 이후 70년 이상의 AI 연구를 이끄는 질문이 됩니다.

"기계는 생각할 수 있는가?"

튜링은 이 질문에 직접 답하는 대신, 조작적(operational) 판별 방법을 제안했습니다. 바로 모방 게임(Imitation Game), 오늘날 '튜링 테스트'라고 불리는 개념입니다.

모방 게임의 구조

원래 설정은 간단합니다. 인간 심문관이 텍스트로만 소통하면서, 상대방이 사람인지 기계인지 구분하려 합니다. 기계가 심문관을 충분히 자주 속인다면, 그 기계는 "생각하는 것"으로 간주할 수 있다는 것이 튜링의 아이디어였습니다.

이 테스트의 핵심은 철학적 논쟁을 피한다는 것입니다. "기계의 의식", "내면적 경험" 같은 형이상학적 논쟁 대신, 기능적으로 관측 가능한 행동만을 기준으로 삼습니다.

왜 혁명적이었나

1950년 당시 컴퓨터는 진공관으로 만들어졌고, 주로 수치 계산에 사용됐습니다. 인간처럼 '생각하는 기계'는 SF의 영역이었습니다. 그 시대에 튜링은 두 가지 급진적인 주장을 했습니다.

기계의 지능은 원칙적으로 가능하다.
그 지능을 판별하는 실용적 기준을 만들 수 있다.

또한 이 논문에서 튜링은 기계 학습(Machine Learning), 진화 알고리즘(Evolutionary Algorithm), 강화 학습(Reinforcement Learning) 등의 개념을 놀랍도록 정확하게 예견했습니다.

튜링 테스트의 한계와 영향

튜링 테스트는 이후 수십 년간 AI 연구의 목표 지점이자 논쟁의 대상이 됐습니다. 1990년대부터 매년 열리는 뢰브너 대회(Loebner Prize)는 튜링 테스트를 실제로 수행하는 경연입니다.

비판도 많았습니다. 존 설(John Searle)의 중국어 방(Chinese Room) 사고 실험은 "문자를 교환하는 것이 이해를 의미하지 않는다"고 반박했습니다. GPT-4 같은 현대 LLM은 많은 상황에서 튜링 테스트를 통과하지만, 우리는 여전히 그것이 '생각하는가'에 대해 논쟁합니다.

튜링의 1950년 논문은 AI 분야의 창립 문서입니다. "기계는 생각할 수 있는가"라는 질문은 오늘날에도 여전히 유효합니다.