기업들이 AI 비용을 단속하기 시작했습니다

챗봇에서 에이전트 시대로 진입하며 글로벌 AI 지출이 급증하는 가운데, 무분별하게 토큰을 소모하던 '토큰 맥싱' 방식이 기업의 심각한 재정 부담으로 돌아오고 있습니다.
하버드와 퍼플렉시티 연구에 따르면 AI 에이전트는 업무 시간을 87% 단축하는 혁신적 효율을 보였지만, 개인의 속도를 조직이 받쳐주지 못하면 전체 성과는 정체됩니다.
이제 기업들은 기술 도입 자체에 열광하는 단계를 넘어, 비용을 제어하고 실질적인 마진과 성과를 창출하는 냉혹한 '실행의 변곡점'을 맞이하고 있습니다.

1. 지금 무슨 일이 일어나고 있는가: 걷잡을 수 없이 불어나는 'AI 청구서'와 ROI 검증 시대

안녕하세요! IT 커뮤니케이터 김덕진 소장입니다. 여러분, 혹시 한 달에 AI 서비스 사용료로 얼마 정도 내고 계시나요? 저 같은 경우에도 단순 정액제뿐만 아니라 쓰는 만큼 내는 종량제 API까지 이것저것 쓰다 보니, 요즘은 한 달에 100만 원이 훌쩍 넘고 조금 더 있으면 200만 원까지 가겠다는 생각이 들 정도로 많이 쓰고 있습니다. 개인이 이 정도인데, 수백 명에서 수천 명의 직원을 둔 기업 단위로 가면 이게 대체 얼마일까요? 실은 상상하기조차 힘든 엄청난 금액이 청구되고 있을 겁니다.

라디오 스튜디오에서 마이크 앞에 앉아 대화를 나누는 두 남성 출연자

기업 내 AI 도입이 늘면서 급증하는 사용료와 그에 따른 비용 효율성 검증의 필요성이 커지고 있습니다.

실제로 최근 조사에 따르면 올해 전 세계 AI 지출 규모는 무려 2조 5,900억 달러(우리 돈 약 3,500조 원)에 달할 것으로 추정됩니다. 불과 1년 만에 47%나 급증한 수치인데요. 특히 인프라 구축뿐만 아니라 실제 AI 모델을 돌리는 사용료 항목이 올해만 110% 가까이 폭증할 것으로 예상됩니다. 상황이 이렇다 보니 기업의 의사결정권자들 사이에서는 "우리가 AI에 돈을 쏟아부은 만큼 진짜 그만한 효과(ROI)를 거두고 있는 게 맞나?"라는 날카로운 의문과 회의론이 고개를 들기 시작했습니다.

2. 왜 이것이 지금 중요한가: 1년 치 예산을 4개월 만에 날린 '토큰 맥싱'의 부작용

그동안 기업들은 AI를 무조건 많이 쓰는 것이 혁신이자 경쟁력이라고 믿어왔습니다. 실리콘밸리에서는 아예 '토큰 맥싱(Token Maxing)'이라는 유행어까지 돌며, 최강의 모델에 토큰을 엄청나게 태우는 것을 일종의 능력치처럼 자랑하곤 했지요. 실제로 메타나 아마존 같은 빅테크 기업들은 사내에 직원별 토큰 사용량 순위표를 걸어두고 사용을 독려하기도 했습니다.

하지만 이러한 무분별한 경쟁은 아주 황당한 부작용을 낳았습니다. 마치 수능 시험을 준비할 때 공부는 안 하고 연습장만 많이 채워서 낙서하는 사람에게 장학금을 주는 꼴이 되어버린 것이죠. 실제로 우버는 엔지니어 5,000명에게 코딩 AI를 전면 배포했다가 1년 치 예산을 단 4개월 만에 다 써버렸고, 어떤 기업은 한 달 AI 요금만 5억 달러(약 7,000억 원)가 청구되는 소름 돋는 사태가 벌어지기도 했습니다.

특히 메타에서는 직원이 사내 토큰 사용량 순위표를 만들어 상위권에게 '토큰 레전드'라는 칭호를 주며 포상하자, 직원들이 인사고과 점수를 잘 받기 위해 의미 없이 에이전트를 계속 돌리거나 뻔히 아는 질문을 AI에 무한 반복하는 프로그램을 짜서 돌리는 기막힌 비효율이 발생했습니다. 이들이 한 달 동안 낭비한 토큰만 무려 60조 개로, 현금 가치로 환산하면 최소 1조 3,000억 원에 달하는 엄청난 규모였습니다. 결국 메타는 부랴부랴 순위표를 폐쇄해야만 했습니다.

3. 무엇이 이 변화를 이끄는가: 챗봇에서 '에이전트'로의 전환과 토큰 소모 메커니즘

그렇다면 왜 이렇게 갑자기 비용이 걷잡을 수 없이 폭증하게 된 것일까요? 질문 하나를 던지면 답변 하나를 해주고 끝나는 단순 '챗봇'의 시대에서, 스스로 목표를 해결하기 위해 움직이는 'AI 에이전트' 시대로 진입했기 때문입니다.

사실 기술이 발전하면서 AI 모델을 한 번 호출하는 단가 자체는 상당히 저렴해졌습니다. 리눅스 재단에 따르면 3년 전과 비교해 토큰 단가는 무려 98%나 싸졌거든요. 하지만 단가가 싸지니까 사람들이 훨씬 더 가벼운 마음으로 펑펑 쓰기 시작한 데다가, 결정적으로 AI 에이전트는 작동 방식 자체가 다릅니다.

에이전트는 사용자가 목표를 주면 혼자서 인터넷 검색을 하고, 코딩을 하고, 결과 문서를 만들고, 검증하는 단계를 스스로 판단하여 여러 차례 반복합니다. 이 과정에서 한 번의 명령만으로도 기존 챗봇보다 수십 배 이상의 토큰을 소모하게 되는 것이죠. 결국 단가는 내려갔지만 사용자의 자율성과 사용량이 비례해서 늘어나면서 전체 청구서의 총액은 기하급수적으로 불어나는 모순적인 구조가 만들어진 것입니다.

4. 누가 영향을 받으며 실무는 어떻게 바뀌는가: 개인의 생산성 향상 vs 조직 성과의 한계

이러한 변화 속에서 실무 환경은 엄청나게 바뀌고 있습니다. 최근 하버드 비즈니스 스쿨과 퍼플렉시티가 공동으로 진행한 흥미로운 연구 결과가 이를 잘 보여줍니다.

안경을 쓴 남성이 라디오 스튜디오에서 마이크 앞에 앉아 자료를 보며 이야기하고 있다.

AI 에이전트 도입으로 업무 처리 시간과 비용을 획기적으로 줄이면서도 품질은 높일 수 있다는 연구 결과가 주목받고 있습니다.

연구진이 동일한 작업을 기존 검색형 AI와 에이전트 AI에게 시키고 비교해 보았더니, 놀랍게도 기존 챗봇으로 여러 단계를 거치며 269분이 걸리던 작업이 에이전트를 통해서는 단 36분 만에 끝났습니다. 업무 시간이 무려 87%나 단축된 것이죠. 게다가 에이전트는 자율적으로 꼼꼼하게 검증을 거치기 때문에 사용자의 불만족률도 55%나 낮아졌습니다. 실무자들은 이제 자신의 고유 영역을 넘어 마케터가 데이터 시각화를 하거나, 창업자가 직접 투자 문서를 만드는 등 기존에 시도하지 못했던 비전문 영역까지 업무 범위를 확장하고 있었습니다.

하지만 여기서 가장 중요한 핵심이 있습니다. 개인 단위에서는 엄청난 효율을 맛보고 있지만, 이것이 기업 전체의 매출이나 이익 증대로 이어졌느냐는 질문에는 여전히 물음표가 붙어 있다는 점입니다.

라디오 스튜디오에서 마이크 앞에 앉아 대화를 나누는 두 남성의 모습이 화면 분할로 보입니다.

AI 도입이 개인의 생산성을 넘어 조직 전체의 일하는 방식과 성과 관리 체계에 미치는 영향에 대해 논의하고 있습니다.

왜 그럴까요? 바로 사람과 조직의 병목 현상 때문입니다. 아무리 A라는 직원이 AI 에이전트를 활용해 12주짜리 개발 작업을 단 1주 만에 뚝딱 끝내서 넘겨주더라도, 그 결과물을 받아서 검토하고 다음 단계로 진행해야 하는 B라는 팀원이나 조직의 의사결정 프로세스가 과거의 수작업 방식 그대로 멈춰 있다면 어떻게 될까요? 결국 전체 프로젝트의 완성 속도는 빨라지지 않고 정체될 수밖에 없습니다. 개인은 빨라졌지만 조직의 협업 구조가 바뀌지 않으면 전체 성과 향상은 지극히 제한적이라는 뜻입니다.

5. 앞으로 무엇을 주목해야 하는가: 효율성과 마진을 남기는 냉혹한 실행의 시대

결국 이제는 단순히 "우리 회사가 AI를 도입해서 신기한 걸 해봤다"라며 감탄하는 단계는 완전히 끝났습니다. 이제는 AI를 활용해 실제 기업의 마진을 남겨야 하는 냉혹한 실행의 해가 도래한 것이지요.

앞으로 기업들은 AI를 단순히 많이 쓰라고 독려하는 것이 아니라, 어떻게 하면 토큰 사용량을 최소화하면서도 명확한 업무 성과로 연결할 수 있을지 '비용 효율화'를 치열하게 고민하게 될 것입니다. 실제로 앤트로픽과 같은 기업들이 더 비싼 고성능 요금제를 내놓을 조짐을 보이는 상황에서, 비용을 제어하는 능력은 기업의 생존과 직결됩니다.

동시에 조직의 구조 자체를 AI 시대에 맞게 재설계하는 움직임이 빨라질 것입니다. 기술 도입보다 중요한 것은 일하는 방식의 변화입니다. 저희가 다음 시간에 더 자세히 다루겠지만, 이러한 비용 효율성 이슈 때문에 최근에는 미국에서도 상대적으로 저렴하고 가성비가 높은 대안 모델들을 적극적으로 탐색하고 있습니다. 과연 우리 조직은 불어나는 AI 비용을 통제하고 진짜 성과를 만들어낼 준비가 되어 있는지, 차분하고 냉정하게 점검해 보아야 할 시점입니다.

FAQ

AI 에이전트를 도입하면 왜 기존 챗봇보다 비용이 훨씬 많이 드나요?

기존 챗봇은 사용자의 질문 하나에 한 번만 답변하고 끝나는 구조인 반면, AI 에이전트는 하나의 목표를 달성하기 위해 스스로 검색, 코딩, 문서 작성, 검증 등 여러 단계를 자율적으로 반복 수행합니다. 이 과정에서 한 번의 명령만으로도 기존보다 수십 배 이상의 토큰을 소모하기 때문에 전체 비용이 폭증하게 됩니다.

실리콘밸리에서 유행했다는 '토큰 맥싱(Token Maxing)'이란 무엇이고 어떤 문제가 있었나요?

직원이나 조직의 AI 활용 역량을 평가할 때 '토큰 사용량'을 주요 지표로 삼아 경쟁적으로 토큰을 많이 소비하던 문화입니다. 하지만 메타나 우버 등의 사례처럼 직원들이 순위를 올리기 위해 무의미한 에이전트 프로그램을 돌리거나 불필요한 질문을 반복하는 등 심각한 예산 낭비와 비효율을 초래했습니다.

개인의 AI 업무 효율이 87%나 향상되었는데도 기업 매출로 연결되지 않는 이유는 무엇인가요?

개인 실무자의 업무 속도가 아무리 빨라지더라도, 그 결과물을 공유받아 협업하는 동료나 조직의 의사결정 프로세스, 즉 일하는 방식과 구조가 과거의 수작업 단계에 머물러 있다면 전체 프로세스에서 병목 현상이 발생하기 때문입니다. 결국 조직 구조의 변화 없이는 개인의 생산성 향상이 기업 전체의 성과로 이어지기 어렵습니다.

M2T 콘텐츠 저작권 안내

원본 영상 보기

# AI비용

# AI에이전트

# IT트렌드

# ROI

# 김덕진

# 메타

# 생산성

# 토큰맥싱

# 퍼플렉시티

# 하버드비즈니스스쿨