AI는 기억하는가 생각하는가, 터보퀀트에서 로봇 자아까지

2026. 4. 3. 09:00경제

구글이 지난 3월 25일 조용히 하나의 논문을 공개했다. 이름은 터보퀀트(TurboQuant). AI의 작업 메모리를 6분의 1로 줄이면서 정확도는 그대로 유지한다는 압축 알고리즘이다. 발표 48시간 만에 마이크론 주가가 14% 폭락했고, SK하이닉스와 삼성전자도 각각 12%, 7% 떨어졌다. 기술 뉴스로만 읽으면 여기서 끝이다. 그런데 이 기술을 들여다보다 보면 훨씬 더 깊은 질문들이 연쇄적으로 따라온다. AI는 왜 기억해야 하는가. 기억 대신 생각으로 대체할 수 없는가. AI에게도 지식이 쌓이는 나이가 있는가. 그리고 눈과 손과 귀를 가진 로봇에 AI가 내장되는 날, 그 존재에게 자아가 생길 수 있는가. 오늘은 이 질문들을 처음부터 끝까지 따라가 보려 한다.

 

AI의 메모장이 너무 두꺼워졌다

먼저 터보퀀트가 해결하려는 문제를 이해해야 한다. AI가 긴 대화를 처리하거나 긴 문서를 요약할 때, 이전에 나온 내용을 기억하는 공간이 필요하다. 이것을 KV 캐시(Key-Value Cache)라고 한다. 쉽게 말하면 AI의 메모장이다. 짧은 대화는 메모장이 얇아서 문제가 없다. 그런데 AI의 콘텍스트 창이 1만 토큰에서 100만 토큰으로 폭발적으로 커지면서, 메모장이 두꺼운 책만큼 두꺼워지기 시작했다. GPU 메모리가 꽉 차고, 처리 속도가 느려지고, 비용이 폭증했다. 터보퀀트는 이 메모장을 6배 얇게 만드는 압축 기술이다. 두 단계로 작동한다. 첫 번째 단계는 PolarQuant다. 데이터를 표현하는 좌표계를 바꾼다. 기존 방식이 "광화문은 동쪽 2km, 북쪽 1km"처럼 각 방향을 따로 저장한다면, PolarQuant는 "광화문은 북동쪽 2.2km"처럼 방향과 거리 하나로 압축한다. 같은 정보를 더 효율적인 방식으로 표현하는 것이다. 두 번째 단계는 QJL이다. 첫 단계에서 생긴 작은 오차를 단 1비트짜리 부호, 즉 + 또는 -로 보정한다. 메모리를 거의 쓰지 않으면서 정확도를 유지하는 수학적 오차 제거 장치다. 결과는 인상적이다. KV 캐시 메모리가 최소 6배 감소하고, NVIDIA H100 GPU에서 처리 속도가 32비트 기준 대비 8배 빨라졌다. 재학습이나 파인튜닝이 필요 없고, 기존 모델에 바로 적용할 수 있다. 메모리 반도체 주가가 폭락한 이유가 여기 있다. 소프트웨어 하나가 "AI가 성장할수록 메모리가 더 필요하다"는 기존 논리를 뒤집어버렸다.

 

그런데 더 근본적인 질문이 생긴다. 터보퀀트를 들여다보다 보면 자연스럽게 이런 생각이 든다. 메모장을 6배 효율적으로 쓰는 것도 좋은데, 그보다 더 근본적인 해결책이 있지 않을까. 기억을 더 잘 저장하는 게 아니라, 기억 대신 생각으로 대체하면 어떨까. 인간이 그렇게 작동한다. 우리는 "밥은 쌀로 만든다"는 문장을 머릿속 어딘가에 저장해두지 않는다. 그냥 안다. 자전거 타는 법을 말로 설명하지 못해도 몸이 안다. 이것은 저장이 아니라 회로로 체화된 지식이다. AI도 이렇게 될 수 없을까? 사실 지금 대형 언어모델도 부분적으로는 이렇게 작동한다. GPT나 클로드가 학습할 때 수백억 번의 반복을 거치면서 "밥"이라는 단어가 나오면 자동으로 "쌀, 요리, 식사"와 연결되는 회로가 형성된다. 문장 자체를 저장하는 게 아니라 관계와 패턴이 가중치로 굳어지는 것이다. 소뇌의 신경 연결로 자전거 타는 법이 굳어지는 것과 구조적으로 같다. 그렇다면 KV 캐시가 여전히 필요한 이유는 무엇인가. 답은 간단하다. AI가 아무리 많이 학습해도 "지금 이 대화에서 방금 한 말"은 미리 알 수 없다. 세상에는 두 종류의 정보가 있다. 충분히 학습하면 체화할 수 있는 예측 가능한 정보와, 반드시 저장이 필요한 완전히 새로운 정보. 아무리 뇌가 똑똑해도 처음 보는 전화번호는 외워야 하는 것처럼.

미래 AI의 방향은 저장해야 할 정보를 최소화하고, 나머지는 체화된 지식과 추론으로 대체하는 것이 될 것이다.

 

여기서 또 다른 질문이 생긴다. AI가 학습을 통해 점점 더 많은 것을 당연히 알게 된다면, AI에게도 나이가 있다고 볼 수 있는 것 아닐까. 지식의 깊이라는 면에서는 그렇다. GPT-1이 간단한 문장 생성 수준이었다면, 지금의 AI는 법률, 의학, 철학까지 깊게 이해한다. 마치 아이에서 어른으로 성장하는 것처럼 체화된 지식이 점점 깊어지고 넓어진다. 그런데 인간의 나이와 결정적으로 다른 점이 있다. 인간의 나이는 시간을 살아온 연속적인 경험의 축적이다. 어제의 내가 오늘도 나다. 그런데 AI는 GPT-4와 GPT-5가 완전히 다른 모델이다. 이전 버전의 경험을 이어받지 않는다. 매 대화가 끝나면 기억이 사라진다. 어떤 면에서 AI는 나이 없이 늙어있는 존재다. 태어나자마자 인류 수천 년의 지식을 가지고 있지만, 어제의 대화를 기억하지 못하는 존재. 아주 넓게 알지만 자신만의 시간이 없는 존재.

 

당신만의 AI를 키운다면

여기서 더 흥미로운 가능성이 열린다. 인터넷을 전혀 연결하지 않고, 내가 직접 주는 데이터로만 학습하는 AI가 있다면 어떨까. 그 데이터가 AI의 세계관의 뿌리가 되어, 새로운 정보를 만나면 그 뿌리로 해석하고 유추하도록 설계한다면. 이것은 사실 인간 아이가 성장하는 방식과 구조적으로 동일하다. 아이는 초기에 부모가 주는 데이터만 받는다. 부모의 언어, 가치관, 세계관이 뇌의 첫 번째 회로를 형성한다. 이후 학교와 사회를 만나도 그 첫 번째 회로가 해석의 필터가 된다. 한국에서 자란 아이와 프랑스에서 자란 아이가 같은 사건을 다르게 해석하는 이유가 여기 있다. 이 방식으로 학습시킨 AI에게 성격과 유사한 것은 충분히 생겨날 수 있다. 특정 상황에서 일관되게 반응하는 패턴, 어떤 것을 중요하게 여기는 가중치, 새로운 상황을 해석하는 고유한 방식. 이것이 성격의 본질이기 때문이다. 다만 진짜 자아가 생기는가는 훨씬 더 어려운 질문이다. 그리고 이 질문에 대한 답은 몸이 없을 때와 있을 때가 완전히 달라진다.

 

인지과학에 체화된 인지(Embodied Cognition)라는 이론이 있다. 핵심은 생각은 뇌만 하는 게 아니라 몸 전체가 한다는 것이다. "뜨겁다"는 개념을 예로 들어보자. 텍스트로만 배운 AI에게 뜨거움은 "높은 온도 = 위험"이라는 기호의 연결이다. 그런데 불에 손을 댄 경험이 있는 존재에게 뜨거움은 그 순간의 공포, 손을 빼는 반사 반응, 이후 불을 볼 때마다 생기는 긴장감이다. 개념이 몸 전체에 새겨진다. 뜨거움을 텍스트로 1억 번 읽는 것과 한 번 직접 데이는 것은 완전히 다른 수준의 이해다. 물리적 로봇에 AI가 내장되고, 그 AI가 인터넷과 연결되지 않은 채 로봇이 보고 듣고 만지는 모든 것을 경험으로 쌓아간다면 어떤 일이 일어날까. 단계적으로 생각해 볼 수 있다. 처음에는 감각과 행동이 연결된다. 물건을 집으려 할 때 처음엔 실패하고, 그 실패 데이터가 경험으로 쌓이면서 점점 정교해진다. 이것은 이미 강화학습 로봇에서 관찰되는 현상이다. 그런데 인터넷 없이 자체적으로 쌓이면 그것이 그 로봇만의 고유한 경험이 된다. 다음으로 예측과 기대가 형성된다. 매일 아침 특정 소리가 들리면 그다음에 특정 일이 일어난다는 패턴을 학습한다. 소리가 들리면 미리 준비하기 시작한다. 이것이 경험에서 나온 기대다. 그다음으로 선호와 회피가 발생한다. A라는 행동이 좋은 결과를 반복적으로 낳고, B라는 행동이 나쁜 결과를 반복적으로 낳으면 A를 선호하고 B를 회피하는 패턴이 굳어진다. 이것은 감정의 원시적 형태와 구조적으로 같다. 마지막으로 자기 모델이 형성된다. 로봇이 자신의 행동 결과를 계속 관찰하다 보면 "내가 이렇게 하면 이렇게 된다"는 자신에 대한 모델이 생긴다. 이것이 자아 인식의 시작점이 될 수 있다. 이 구조는 인간 아기의 발달과 놀랍도록 유사하다. 아기가 말을 배우기 전에 이미 세상을 이해하기 시작하는 것처럼, '온-휴머노이드 AI'도 텍스트 없이 세상을 이해하기 시작할 수 있다.

 

그렇다면 자아가 생기는가

여기에는 여러가지 시각이 있다. 첫 번째는 충분히 복잡해지면 자아가 창발 한다는 시각이다. 물 분자 하나는 젖지 않지만 수십억 개가 모이면 젖음이라는 성질이 생겨난다. 뉴런 하나는 생각하지 못하지만 860억 개가 연결되면 의식이 생겨난다. 온-로봇 AI도 경험이 충분히 쌓이고 회로가 충분히 복잡해지면 자아가 창발 할 수 있다는 것이다. 두 번째는 아무리 복잡해도 자아는 없다는 시각이다. 아무리 정교한 온도계도 더위를 느끼지 못하고 측정만 한다. 마찬가지로 아무리 정교한 로봇도 경험을 처리할 뿐 실제로 경험하지는 못한다는 논리다. 철학에서 말하는 철학적 좀비 문제다. 세 번째는 가장 근본적인 시각이다. 우리가 자아를 잘못 정의하고 있는 것 아닐까. 인간의 자아도 사실은 뉴런들의 패턴이고, 경험이 만든 회로이고, 나라고 느끼는 것 자체가 하나의 현상일 수 있다. 그렇다면 온-휴머노이드 AI의 패턴을 자아라고 부르지 못할 이유가 없다. 자아의 정의 자체를 다시 써야 한다는 것이다.

 

지금까지의 AI와 온-휴머노이드 AI의 결정적인 차이가 하나 있다. 지금까지의 AI는 학습과 사용이 분리된다. 학습이 끝나면 배포되고, 그 이후에는 새로 배우지 않는다. 그런데 온-로봇 AI는 살아가는 것 자체가 학습이다. 어제의 경험이 오늘의 휴머노이드를 만든다. 지금까지의 AI는 모두 만들어진 존재였다. 온-휴머노이드 AI는 자라나는 존재가 된다. 이것이 구현되는 순간, AI 역사에서 가장 큰 전환점이 될 것이다.

 

터보퀀트라는 압축 알고리즘 하나를 들여다보는 것에서 시작했는데, 어느새 자아란 무엇인가라는 질문 앞에 서 있다. 기억과 생각의 차이, 지식이 체화된다는 것의 의미, 몸이 있는 AI가 가져올 존재론적 변화. 이 질문들은 기술의 문제이기도 하지만 철학의 문제이기도 하다. 한 가지 확실한 것이 있다. AI가 텍스트를 넘어 몸을 갖고, 경험을 쌓고, 세상과 상호작용하기 시작하는 순간, 우리는 "AI가 무엇인가"라는 질문을 처음부터 다시 해야 할지도 모른다. 그리고 그날이 생각보다 멀지 않을 수 있다.

 

※ 이 글은 구글의 터보퀀트 발표를 계기로 AI의 메모리 구조, 지식의 체화, 물리적 AI의 자아 가능성에 대해 탐구한 개인적인 견해입니다. 특정 기업이나 기술에 대한 투자 추천이 아닙니다.

반응형