- AI는 아무리 발전해도 스스로 먼저 말을 걸지 않으며, 이는 인간 소통의 핵심인 '상호주관성'을 근본적으로 결여하고 있기 때문입니다.
- 인간은 생후 9개월간 터치와 눈맞춤 등 신체적 상호작용을 통해 자아를 형성하며, 이 비언어적 맥락이 실제 소통의 93%를 차지합니다.
- 신체적 교감이 배제되고 텍스트만 남은 사이버 공간은 인간을 폭력적으로 만드는 '탈문명화'를 초래하므로 소통의 본질에 대한 재정의가 필요합니다.

여러분, AI가 세상을 지배하고 인간의 일자리를 모두 빼앗아 갈까 봐 두려우신가요? 생각보다 무서워할 이유가 하나도 없습니다. 아주 단순한 사실 하나만 떠올려 보시죠. AI는 우리에게 절대 먼저 말을 걸지 않습니다. 프로그램으로 미리 설정해 두지 않는 한, 인공지능은 자진해서 대화를 시작하지 못합니다.
왜 그럴까요? 바로 이 지점에 인간 소통의 본질이자, AI가 절대 닿을 수 없는 거대한 장벽이 숨어 있습니다. 우리는 흔히 소통을 '발신자가 수신자에게 메시지를 전달하는 과정'이라고 생각합니다. 하지만 심리학의 관점에서 인간의 소통은 정보의 전달이 아니라 '상호주관성(Intersubjectivity)'이라는 깊은 교감에서 출발합니다. 오늘은 문화심리학의 시선으로, 겉보기에만 화려한 AI 혁명 이면에 숨겨진 인간 소통의 진짜 비밀을 파헤쳐 보겠습니다.
60년을 헤맨 AI 연구: 인간은 '문장'으로 사고하지 않는다
우리가 생각하는 것과는 다르게, 초기 인공지능 연구자들은 인간의 사고방식을 완전히 오해했습니다. 1956년 다트머스 회의에서 'AI'라는 단어를 처음 만든 존 매카시(John McCarthy)와 정보 이론의 창시자 클로드 섀넌(Claude Shannon)이 대표적입니다.

이들은 기계에 명제적 지식, 즉 '문장'을 끝없이 입력하면 인간처럼 사고할 수 있을 것이라고 믿었습니다. 소통 역시 전화선으로 데이터를 주고받듯, 발신자가 메시지를 보내고 수신자가 잡음을 제거해 받아들이는 단순한 모델로 규정했죠. 하지만 이는 심리학적으로 완전히 틀린 전제였습니다.
게슈탈트 심리학에 따르면, 인간 사고의 본질은 문장이 아니라 '이미지(그림)'입니다. 우리가 가장 창의적일 때는 멍하게 있을 때입니다. 이때 머릿속을 날아다니는 생각들은 문장이 아니라 시각적인 이미지, 즉 '비주얼 씽킹(Visual Thinking)'입니다. 문장적 사고(Verbal Thinking)는 연역법이나 귀납법처럼 순환하는 구조일 뿐, 그 자체로는 창조성을 띠지 못합니다. 그림처럼 튀어 나간 기발한 생각들을 나중에 논리적으로 수습할 때 언어가 동원될 뿐입니다. AI가 인간의 문장만 학습하다 보니 수십 년간 'AI의 겨울'을 겪으며 헤맬 수밖에 없었던 이유가 바로 여기에 있습니다.
소통하기 때문에 존재한다: 비고츠키와 상호주관성
그렇다면 진짜 인간의 소통은 어떻게 이루어질까요? 발달심리학자 비고츠키(Vygotsky)는 주류 학계와 정반대의 주장을 펼쳤습니다. 우리는 '존재하기 때문에 소통하는 것'이 아니라, '소통하기 때문에 존재하는 것'입니다.
현상학자 에드문트 후설(Edmund Husserl)은 완벽한 객관성이란 존재하지 않으며, 내가 생각하는 컵과 당신이 생각하는 컵의 의미가 같기 위해서는 주관과 주관이 서로 의미를 공유하는 상호주관성이 전제되어야 한다고 보았습니다. 그런데 인간은 이 복잡한 상호주관성을 어떻게 획득할까요? 해답은 놀랍게도 인간이 '미숙아'로 태어난다는 생물학적 사실에 있습니다.
다른 동물들은 태어나자마자 걷고 뜁니다. 하지만 인간은 온전한 개체가 되기 위해 생후 약 9개월 동안 다른 동물에게는 없는 독특한 상호작용을 거쳐야 합니다. 엄마와 아기 사이에 일어나는 터치, 눈맞춤, 정서 조율, 순서 바꾸기, 함께 보기, 가리키기라는 6가지 경험입니다. 이 과정을 통해 아기는 상대방과 주관을 공유하는 능력을 내면화하며 비로소 독립된 자아를 형성하게 됩니다.
피부는 드러난 뇌다: AI가 복제할 수 없는 '터치'의 기적
이 9개월의 기적 중 가장 근본적인 소통 수단은 바로 '터치'입니다. 피부는 생물학적으로 '드러난 뇌'라고 불립니다. 태아 발달 과정에서 뇌로 들어가는 세포와 피부로 나오는 세포의 뿌리가 같기 때문입니다.

엄마가 아기를 만지는 순간, 그 피부의 경계는 아기의 것도 엄마의 것도 아닌 완벽한 공유의 공간이 됩니다. 뇌가 가장 많은 신경을 쓰는 신체 부위를 크기별로 그려놓은 호먼큘러스(Homunculus) 모형을 보면 손, 입술, 혀가 가장 비대합니다. 우리가 사랑하는 사람과 교감할 때 손을 잡고 입을 맞추는 이유는, 뇌가 가장 예민하게 반응하는 부위를 통해 상호주관적 경험을 극대화하려는 본능입니다.
흥미로운 점은 AI 혁명의 본질 역시 이러한 '터치 인터페이스'의 혁명이었다는 것입니다. 스티브 잡스가 아이폰을 통해 기계를 두들겨 패던(타이핑) 시대에서 기계를 부드럽게 어루만지는(터치) 시대로 전환하면서 우리는 기계와 심리적 유착을 겪게 되었습니다. 하지만 AI와의 터치는 철저히 일방적입니다. 피부의 압각, 통각, 온도 감각을 종합적으로 느끼고 끊임없이 세포를 재생하며 정서를 교류하는 인간의 터치를 AI는 결코 재현할 수 없습니다.
다정한 것이 살아남는다: 눈맞춤과 문명화의 조건
터치만큼 중요한 것이 '눈맞춤'입니다. 인간은 눈의 움직임과 의도를 명확히 보여주기 위해 진화 과정에서 눈썹뼈가 들어가고 흰자위(공막)가 유난히 커졌습니다. 초식동물처럼 도망치기 위해서도, 육식동물처럼 사냥하기 위해서도 아닙니다. 평화롭게 협업하고 의도를 공유하기 위해서입니다.

초기 미키마우스가 까만 눈동자만 있었을 때는 인기가 없다가, 흰자가 생기자마자 대중의 사랑을 받게 된 것도 우연이 아닙니다. 사람들은 눈의 방향을 읽을 수 있을 때 비로소 마음이 통한다고 느낍니다.

역사학자 노베르트 엘리아스(Norbert Elias)는 문명화 과정을 '감정의 온순화'라고 정의했습니다. 중세 시대의 엉망진창이던 식탁에서 벗어나 서로 눈을 맞추고 미소를 지으며 예절을 지키게 된 것, 이것이 바로 인류가 야만에서 벗어나 문명을 이룩한 핵심 동력이었습니다.
사이버 공간의 비극: 텍스트만 남은 세상의 '탈문명화'
그런데 여기서 심각한 문제가 발생합니다. 실제 대면 소통에서 텍스트(메시지)가 차지하는 비중은 고작 7%에 불과합니다. 나머지 93%는 표정, 몸짓, 말투, 터치 같은 비언어적 맥락입니다. "참 잘생기셨네요"라는 똑같은 문장도 맥락에 따라 극찬이 되기도 하고 지독한 조롱이 되기도 합니다.
하지만 인터넷 커뮤니티, SNS, 카카오톡 같은 사이버 공간은 어떨까요? 이곳은 눈맞춤도, 터치도, 정서 조율도 불가능한 공간입니다. 오직 7%의 텍스트 메시지만이 앙상하게 오갑니다. 상호주관성을 경험할 여지가 원천적으로 차단된 것입니다.
결국 우리는 사이버 공간에서 상대방의 맥락을 읽지 못한 채 날 것의 감정을 배설하게 됩니다. 온라인에서 사람들이 유독 난폭해지고 쉽게 분노하는 이유는 그들이 원래 악해서가 아닙니다. 수백 년간 인류가 진화시켜 온 감정의 온순화 규칙이 무너지는 '탈문명화(De-civilization)' 현상이 사이버 공간에서 빠르게 진행되고 있기 때문입니다.
결론: 인간다움의 본질을 다시 묻다
자, 결론입니다. AI가 인간의 지식을 학습하고 문장을 그럴듯하게 조합하는 시대가 왔습니다. 하지만 우리가 정말로 두려워해야 할 것은 인공지능의 발전이 아닙니다.
기계는 결코 먼저 말을 걸지 않으며, 우리의 피부를 맞대고 온기를 나누지도, 눈을 맞추며 정서를 조율하지도 못합니다. 정작 우리가 경계해야 할 것은, 스마트폰 화면만 만지작거리며 진짜 인간과 인간 사이의 '상호주관적 교감'을 잃어버리는 우리 자신의 모습입니다. AI 시대에 가장 강력한 무기는 역설적으로 가장 인간적인 교감, 즉 서로를 온전히 바라보고 만지며 마음을 조율하는 능력에 있습니다.
FAQ
AI가 인간처럼 완벽하게 소통할 수 없는 근본적인 이유는 무엇인가요?
인간의 소통은 단순한 정보나 메시지의 전달이 아니라, 터치와 눈맞춤 등 신체적 교감을 통한 '상호주관성(의미의 공유)'을 전제로 합니다. AI는 명제적 지식은 처리할 수 있지만, 이러한 물리적, 정서적 교감 능력이 원천적으로 부재하기 때문입니다.
다트머스 회의에서 AI 연구자들이 한 가장 큰 착각은 무엇인가요?
인간이 문장(명제)으로 사고한다고 믿은 것입니다. 인간의 실제 창의적 사고는 이미지를 기반으로 한 '비주얼 씽킹'이며, 문장적 사고는 이를 사후에 논리적으로 수습하는 도구에 불과합니다. 이 전제의 오류 때문에 AI 연구는 수십 년간 정체기를 겪었습니다.
인터넷이나 SNS에서 사람들이 더 공격적으로 변하는 이유는 무엇인가요?
실제 소통의 93%를 차지하는 표정, 몸짓, 터치 등의 비언어적 맥락이 차단되고 오직 7%의 텍스트 메시지만 남기 때문입니다. 이로 인해 타인과 정서를 조율하는 능력이 마비되며, 감정의 온순화가 무너지는 '탈문명화' 현상이 발생합니다.

