[ 트렌드] [World Model 시리즈 #12] 알파고는 왜 이세돌 뇌의 5만 배 에너지가 필요했나?

관리자 Lv.1
03-01 14:53 · 조회 16 · 추천 0

[World Model 시리즈 #12] 알파고는 왜 이세돌 뇌의 5만 배 에너지가 필요했나?

Predictive Coding의 "어떻게"를 배웠다면, 자연스러운 질문이 나옵니다. 뇌의 원리를 흉내냈는데, 왜 효율성은 따라가지 못할까?


숫자부터 보자

이세돌의 뇌:     ~20W  (형광등 하나 수준)
알파고 서버:     ~1,000,000W (1MW)
                 → 약 50,000배 차이!

이세돌: 밥 한 공기로 5시간 대국
알파고: 1,202개 CPU + 176개 GPU, 전용 냉각 시스템

같은 바둑을 두는데 5만 배의 에너지가 필요했습니다. 왜?


이유 1: 뇌는 "필요한 것만" 켠다

Predictive Coding에서 배운 핵심 — 뇌는 예측이 맞으면 아무것도 안 합니다.

이세돌의 뇌:
┌─────────────────────────────────┐
│ 860억 개 뉴런 중                  │
│ 이 순간 활성화된 뉴런: ~1-5%       │
│ 나머지 95%: 꺼져 있음 (전기 안 씀)  │
└─────────────────────────────────┘

알파고:
┌─────────────────────────────────┐
│ 1,202개 CPU + 176개 GPU         │
│ 이 순간 활성화: 100% 전부!        │
│ 꺼진 것: 없음 (전부 전기 씀)       │
└─────────────────────────────────┘

뇌의 뉴런은 발화하지 않으면 거의 에너지를 안 씁니다. Predictive Coding 덕분에, 예측이 맞는 뉴런은 발화하지 않습니다. 변화가 있는 곳의 뉴런만 켜집니다.

비유:

뇌:   100층 건물에서 사람 있는 3개 방만 불 켜놓음
GPU:  100층 건물 전체 불 24시간 풀가동

이유 2: 뇌는 "계산"과 "기억"이 같은 곳에 있다

이것이 가장 근본적인 차이입니다.

[컴퓨터 / GPU]
┌──────────┐         ┌──────────┐
│   CPU    │ ←버스→   │  메모리   │
│ (계산)    │  왕복    │ (저장)    │
└──────────┘         └──────────┘
   계산할 때마다 데이터를 가져와야 함
   → 이 왕복에 에너지의 대부분이 소모됨!

[뇌]
┌──────────────────────┐
│  시냅스               │
│  (계산 = 저장)         │
│  연결 강도 = 기억      │
│  신호 전달 = 계산      │
│  같은 장소에서 동시에!   │
└──────────────────────┘
   데이터 이동 없음 → 에너지 거의 안 씀

현재 컴퓨터에서 에너지의 80~90%는 계산이 아니라 데이터 이동에 씁니다.

이걸 폰 노이만 병목(Von Neumann Bottleneck) 이라고 합니다. 1945년에 만들어진 컴퓨터 구조의 근본적 한계입니다.

비유:

컴퓨터: 창고에서 물건 가져와서 작업대에서 조립하고 다시 창고로 가져감
        → 왕복 운송비가 조립비보다 비쌈

뇌:     창고 = 작업대 (같은 곳)
        → 운송비 제로

이유 3: 뇌는 아날로그, 컴퓨터는 디지털

[디지털 — GPU]
신호: 0 또는 1 (두 가지만)
덧셈 하나: 수십 개의 트랜지스터가 순차적으로 작동
곱셈 하나: 수백 개의 트랜지스터

[아날로그 — 뇌]
신호: 0.0 ~ 1.0 사이 연속 값 (무한 단계)
곱셈 하나: 시냅스 하나에서 즉시 완료!
         (입력 신호 × 시냅스 강도 = 자동으로 곱셈)

뇌의 시냅스는 물리 법칙 자체가 곱셈을 해줍니다. 전류가 저항을 지나면 자동으로 곱셈이 됩니다 (V = I × R). 트랜지스터 수백 개가 할 일을 시냅스 하나가 합니다.

알파고가 수 하나 계산: 수십억 번의 디지털 연산
이세돌이 수 하나 직관: 시냅스 수백만 개가 동시에 아날로그 계산

이유 4: 뇌는 "대충"하고, 컴퓨터는 "정확히" 한다

컴퓨터: 3.141592653589793... (64비트 부동소수점, 정확)
뇌:     "대충 3 정도?" (충분)

바둑에서 이세돌이 모든 수를 정확히 계산하나요? 아닙니다. "이 근처가 좋은 느낌이야" 라는 직관으로 후보를 2-3개로 줄이고, 그것만 깊이 봅니다.

알파고는? 가능한 모든 수를 다 계산하고 점수를 매깁니다. 정확하지만, 엄청나게 비효율적입니다.

이세돌: "여기가 느낌이 좋아" → 3개만 깊이 탐색
알파고: 200개 후보를 전부 시뮬레이션 → 최선을 선택

이게 Predictive Coding의 위력입니다. 뇌는 예측으로 대부분을 건너뛰고, 의외인 것만 집중합니다.


이유 5: 뇌는 화학 에너지, 컴퓨터는 전기 에너지

뇌의 신호 전달:
뉴런 → 시냅스 → 신경전달물질(화학) → 다음 뉴런
       속도: 느림 (1~100 m/s)
       에너지: 극소 (ATP 분자 몇 개)

컴퓨터의 신호 전달:
트랜지스터 → 금속 배선(전기) → 다음 트랜지스터
       속도: 빠름 (빛의 속도에 가까움)
       에너지: 큼 (전자 이동 + 발열)

뇌는 느리지만 에너지 효율적인 화학 반응을 씁니다. 뇌가 느린 걸 보상하는 방법? 엄청난 병렬 처리입니다. 860억 뉴런이 동시에 작동하니까, 각각은 느려도 전체는 빠릅니다.


5가지 차이 종합

항목 뇌 (이세돌) GPU (알파고)
활성화 필요한 1-5%만 전부 100%
계산+저장 같은 곳 (시냅스) 분리 (CPU↔메모리 왕복)
연산 방식 아날로그 (물리 법칙) 디지털 (트랜지스터 수백 개)
정밀도 대략적 (충분하면 OK) 정확함 (64비트)
에너지원 화학 (ATP) 전기 (발열 큼)
결과 20W 1,000,000W

그래서 AI는 영원히 비효율적인가?

아닙니다. 이걸 극복하려는 연구가 진행 중입니다:

뉴로모픽 칩 (Neuromorphic Chip)

인텔 Loihi, IBM TrueNorth 같은 칩은 뇌처럼 "필요한 뉴런만 켜는" 방식입니다. 일반 GPU보다 1000배 이상 에너지 효율적입니다.

인메모리 컴퓨팅 (In-Memory Computing)

메모리 안에서 바로 계산하는 방식. 데이터 이동 없이 뇌의 시냅스처럼 작동합니다.

아날로그 AI 칩

IBM이 연구 중인 칩으로, 뇌처럼 아날로그 방식으로 곱셈을 합니다.

그리고 JEPA 같은 아키텍처가 중요한 이유가 바로 여기에 있습니다. JEPA는 "모든 픽셀을 예측"하는 비효율적 방식 대신 "표현 공간에서만 예측"합니다. 이건 뇌의 Predictive Coding처럼 불필요한 계산을 건너뛰는 것입니다. 소프트웨어 차원에서 뇌의 효율성에 다가가려는 시도입니다.


다음 글에서는 Predictive Coding을 뇌 전체로 확장한 Free Energy Principle (Friston, 2010) 을 다룹니다. 예측 오류 최소화가 지각뿐 아니라 행동, 감정, 의사결정까지 설명하는 통일 이론이 됩니다.

💬 0 로그인 후 댓글 작성
첫 댓글을 남겨보세요!