- 엔비디아는 AI 추론(Inference) 수요의 폭발적 증가를 근거로 2027년 데이터 센터 매출 전망치를 1조 달러로 기존 대비 두 배 상향했습니다.
- 클라우드 GPU 품귀 현상과 오픈라우터 토큰 사용량의 수직 상승은 단순한 기대감이 아닌 실질적인 AI 사용량 폭발을 데이터로 증명하고 있습니다.
- 수동적 언어 모델에서 코딩과 업무를 직접 수행하는 주도적 AI 에이전트로 진화함에 따라, 엔비디아의 하드웨어 역시 추론 고도화에 맞춰 세분화되고 있습니다.
{img}
새벽 3시 새벽의 남자 김단테 왔고요. 최근 시장 일각에서 끊임없이 제기되는 AI 버블 논란, 저는 실사용하는 입장에서 이제 이 논란 자체가 무의미해졌다고 생각합니다. 왜냐고요? 진짜 이유는 따로 있습니다. 바로 AI가 단순한 질문에 대답하는 수준을 넘어, 스스로 코딩하고 업무를 수행하는 '주도적 에이전트'로 진화하면서 추론(Inference) 수요가 역대급으로 폭발하고 있기 때문입니다. 오늘 영상에서는 엔비디아 GTC 컨퍼런스에서 발표된 충격적인 매출 상향 조정의 배경과, 실제 데이터로 증명되고 있는 기하급수적인 AI 사용량 증가의 원인을 짚어보겠습니다.
지정학적 위기와 어수선한 매크로 환경
본격적인 AI 이야기에 앞서 잠시 매크로 상황을 짚고 넘어가겠습니다. 도대체 무슨 일이 있었는지 한번 알아볼 건데, 이란의 아랍에미리트(UAE) 에너지 인프라 공격으로 WTI와 브렌트유 등 유가가 2% 넘게 상승하는 일이 있었습니다. 호르무즈 해협을 통과하는 선박도 급감하며 시장이 깜짝 놀랐죠.
여기에 트럼프 전 대통령은 나토(NATO) 동맹국들이 중동 군사 작전에 개입하지 않으려 하자 SNS를 통해 서운함을 토로하기도 했습니다. 서방 세계 사이에서도 균열이 보이고 매크로 환경은 다소 흉한 장세입니다. 하지만 이런 단기적 변동성 속에서도 나스닥 등 주요 지수는 견조하게 상승했습니다. 우리가 진짜 주목해야 할 것은 외부의 노이즈가 아니라, 세상을 바꾸고 있는 압도적인 기술 혁신과 기업의 본질적 가치입니다.
엔비디아의 1조 달러 매출 상향, 그 이면의 진짜 이유
자, 그러면 AI 산업에서는 도대체 어떤 일이 있었느냐? 전 세계에서 가장 비싼 회사인 엔비디아의 GTC 컨퍼런스를 보면 명확해집니다. 엔비디아는 2027년까지 데이터 센터 관련 매출이 1조 달러(1 Trillion) 정도 나올 것 같다고 발표했습니다. 기존 전망치가 5천억 달러 수준이었으니, 목표치를 갑자기 두 배나 상향한 겁니다.
불과 몇 달 전만 해도 2026년까지 5천억 달러의 칩 주문을 확보했다고 했던 젠슨 황이 왜 이렇게 전망을 세게 부른 걸까요? 저는 젠슨 황이 전혀 뻥카를 친다고 생각하지 않습니다. 한마디로 추론(Inference)의 수요가 폭발했기 때문입니다. AI가 교과서를 읽듯 학습(Training)하는 단계를 지나, 이제는 실제 사용자가 AI를 활용해 결괏값을 도출하는 추론 수요가 어마어마하게 늘어났습니다. 젠슨 황은 지난 2년간 컴퓨팅 수요가 100만 배 증가했으며, 결국에는 공급이 부족할 것이라고 확신하고 있습니다.
피부로 느껴지는 기하급수적인 토큰 사용량 폭발
제 말만 듣기보다 과거 데이터에 기반한 객관적인 자료를 보시는 게 좋을 것 같습니다. 클라우드에서 기존 GPU들이 얼마나 사용 가능한지 보여주는 지표를 보면, 최근 모든 그래프가 우하향하고 있습니다. 구버전부터 최신 칩까지 GPU를 사용하기 위한 수요가 폭발하면서 품귀 현상이 빚어지고 있는 겁니다.
{img}
[출처] 내일은 투자왕 - 김단테 제공 영상 · 06:16
더욱 소름 돋는 것은 오픈라우터(OpenRouter)를 통한 API 토큰 사용량입니다. 작년 하반기까지만 해도 완만하던 그래프가 올해 초를 기점으로 그야말로 수직 상승하고 있습니다. 토큰 사용량이 곧 AI 사용량입니다. 지난 한두 달 사이에 사람들의 AI 사용량이 완전히 급증한 거죠. 그럼 진짜 이유는 도대체 뭐냐? 바로 AI 발전의 거대한 변곡점이 일어났기 때문입니다.
수동적 챗봇에서 주도적 '에이전트'로의 진화
2025년 11월 엔트로픽이 '클로드 오퍼스 4.5'를 출시하고, 2026년 1월 '오픈클로(OpenDevin 등 에이전트)' 같은 서비스가 등장하면서 상황이 완전히 바뀌었습니다. 기존 언어 모델은 수동적이었습니다. 시키는 질문에 대답만 했죠. 하지만 이 에이전틱 AI(Agentic AI)로 넘어오면서 AI는 주도적으로 변했습니다. 내가 시키는 코딩과 업무를 실제로 수행해 냅니다.
{img}
[출처] 내일은 투자왕 - 김단테 제공 영상 · 09:24
제 주변만 봐도 개발을 전혀 모르는 비전공자들이 클로드 코드를 활용해 매일 새로운 서비스를 출시하고 있습니다. KBS 뉴스에서도 "누구나 앱을 만드는 시대가 왔다"고 보도할 정도죠. 개인이 기꺼이 돈을 내고 사용할 가치가 생겼고, 한 명의 개인이 사용하는 토큰의 양은 기하급수적으로 올라가고 있습니다. 저 역시 개인 비서 에이전트를 매일 유용하게 쓰고 있습니다. (제 비서 이름은 '카리나'로 세팅해 두고 '오빵'이라고 부르게 시키고 있는데... 아, 이거 더 나갔다가는 SM에서 진짜 고소당할 것 같아서 여기까지만 하겠습니다.) 어쨌든 실사용하는 입장에서 볼 때 버블 논란은 이미 끝났다고 봅니다.
프리필과 디코드: 추론 수요에 맞춘 하드웨어의 세분화
이러한 추론 수요 폭발에 대응하기 위해 엔비디아는 하드웨어 전략을 고도화하고 있습니다. 최근 S램 기반 추론 칩을 만들던 '그록(Groq)'을 인수한 것이 대표적입니다. AI가 질문에 답을 도출하는 인퍼런스 과정은 크게 두 가지로 나뉩니다. 질문을 읽고 이해하는 '프리필(Pre-fill)'과 답안지를 작성하는 '디코드(Decode)'입니다.
예전에는 추론용 칩이 하나로 뭉뚱그려져 있었다면, 이제 엔비디아는 프리필 전용 칩(루빈)과 디코드 전용 칩을 세분화하여 만들고 있습니다. 특히 디코드 과정 중 지금까지 쓴 글을 되돌아보고 다음 단어를 예측하는 FFN(Feed-Forward Network) 과정에서 그록의 기술을 활용해 계산 속도를 극대화하려는 것입니다. 고속도로를 4차선에서 8차선으로 넓히고(용량), 지나가는 자동차의 속도를 더 빠르게 만드는(대역폭) 고도화 작업이 진행 중인 셈입니다. 그록을 인수했다고 해서 기존 메모리에 대한 수요가 떨어지는 것이 아닙니다. 전체 파이 자체가 기하급수적으로 커지고 있기 때문입니다.
우주 데이터 센터 고찰과 투자자를 위한 당부
물론 폭발하는 인프라 수요를 감당하기 위한 고민도 깊어지고 있습니다. 엔비디아는 이번 GTC에서 '스페이스 베라루빈 모듈'이라는 우주 데이터 센터의 초기 개념까지 발표했습니다. 많은 분들이 현재 지구상에 존재하는 물건들로만 데이터 센터를 만든다고 가정하기 때문에 이를 불가능하다고 생각합니다. 하지만 우주 환경에 맞게 부품이 새롭게 설계된다면, 생각보다 우주 데이터 센터의 미래가 일찍 올 수도 있겠다는 업계 전문가의 의견에 저도 어느 정도 동의합니다.
오늘 영상도 언제나 매수 매도 추천이 아니라는 점 기억해 주시고요. 저는 고점을 판독할 수 있는 능력이 없습니다. 시장의 단기적인 움직임이나 맹목적인 환희를 예측하는 것은 불가능합니다. 다만 우리가 확인한 실적과 데이터의 변화 방향성은 명확합니다. 과도한 레버리지를 지양하고, 각자의 스타일에 맞는 안전하고 고지식한 투자를 이어나가시길 바랍니다. 저는 투자와 관련된 블로그를 작성하고 있고 또 인스타그램도 하고 있으니까 관심 있는 분들은 고정 댓글 참고해 주세요. 그럼 저는 또 돌아오도록 하겠습니다. 감사합니다.
FAQ
엔비디아가 2027년 데이터 센터 매출 전망치를 상향한 이유는 무엇인가요?
단순한 AI 학습(Training) 단계를 넘어, 사용자가 실제로 AI를 활용해 결괏값을 도출하는 추론(Inference) 수요가 폭발적으로 증가하고 있기 때문입니다. 이에 따라 젠슨 황은 2027년까지 관련 매출이 기존 전망치의 두 배인 1조 달러에 달할 것으로 예상했습니다.
엔비디아가 반도체 스타트업 '그록(Groq)'을 인수한 이유는 무엇인가요?
AI의 추론 과정을 질문을 이해하는 '프리필'과 답을 작성하는 '디코드'로 세분화하여 처리 속도를 높이기 위함입니다. 그록의 S램 기반 기술을 디코드 과정(특히 FFN 단계)에 적용해 계산 속도와 대역폭을 극대화하려는 하드웨어 고도화 전략의 일환입니다.
AI 버블 논란이 무의미하다고 보는 구체적인 근거는 무엇인가요?
클라우드 GPU의 품귀 현상과 오픈라우터(OpenRouter)의 토큰 사용량 급증 등 객관적인 1차 데이터가 이를 증명합니다. 특히 클로드 오퍼스 4.5나 오픈클로(OpenDevin) 같은 주도적 에이전트가 등장하면서, 비개발자도 앱을 만들 정도로 실질적인 가치 창출과 사용량 폭발이 일어나고 있기 때문입니다.
본 콘텐츠는 채널 발행인의 원본 영상을 기반으로 이글루스 AI가 편집·정리한 콘텐츠입니다.해당 콘텐츠는 제휴 또는 이용 허락을 기반으로 제공되며, 원본 저작권은 채널 발행인에게 있습니다.
