비개발자도 깃허브로 AI 에이전트 만드는 끝내주는 방법

최근의 AI 모델은 매우 뛰어나지만, 의도대로 움직이게 하려면 프롬프트를 넘어 스크립트와 규칙으로 꼼꼼히 제어하는 '하네스 엔지니어링'이 필수적입니다.
업무용으로는 통제가 강력한 클로드 코드를, 일상용으로는 유연한 컴퓨터 화면 조작이 가능한 오픈클로를 활용하면 내 업무의 상당 부분을 자동화할 수 있습니다.
비개발자라도 깃허브 링크를 AI에게 주어 벤치마킹을 지시하거나, 오토 리서치를 통해 스스로 결과물을 개선하도록 만들면 전문가급의 에이전트를 쉽게 구축할 수 있습니다.

{img}

지난 한 달 동안 저, 장피엠은 제 업무의 대부분을 AI 에이전트로 전환하는 실험을 진행했습니다. 현재 총 18명의 AI 에이전트 군단과 함께 일하고 있죠. AI 에이전트를 만들고 운용할 때 진짜 중요한 것은 어떤 새로운 도구나 기능을 쓰느냐가 아닙니다. 핵심은 똑똑해진 AI를 내 의도대로 완벽하게 통제하고 설계하는 방법에 있습니다. 오늘은 단순한 도구 소개를 넘어, 제 실제 업무와 일상을 AI 에이전트로 전환하면서 깨달은 '하네스 엔지니어링(Harness Engineering)'의 개념과 비개발자도 쉽게 에이전트를 세팅하는 끝내주는 방법을 소개해 드리겠습니다.

하네스 엔지니어링: AI라는 적토마에 안장 얹기

최근의 AI 모델들은 놀라울 정도로 똑똑해졌습니다. 마치 하루에 천 리를 달리는 적토마와 같죠. 하지만 이 적토마들은 길들여지지 않았기 때문에 때로는 엉뚱한 길로 튀어버리곤 합니다. 이 강력한 AI가 내 의도에 맞게 정확히 목적지까지 가도록 안장(Harness)을 얹고 고삐를 쥐는 작업, 그것이 바로 '하네스 엔지니어링'입니다.

예전에는 프롬프트(명령어)만으로 AI를 통제하려 했습니다. 챗GPT의 GPTs가 대표적이죠. 하지만 요즘 AI 에이전트의 하네스 엔지니어링은 차원이 다릅니다. 프롬프트뿐만 아니라 코드 스크립트, 상세한 규정 문서, 참고 파일, 양식 파일 등을 동원해 훨씬 더 빡빡하게 AI의 행동을 규율합니다. "이 단계에서는 이걸 하고, 다음 단계에선 이걸 판단해"라고 프로세스를 명확히 정의해 두는 거죠. 이렇게 하네스 엔지니어링이 잘 된 AI 에이전트는 복잡한 업무도 순식간에 안정적으로 처리해 줍니다. 사실상 디지털 기반의 지식 노동은 이 설계만 잘하면 대부분 에이전트로 전환이 가능합니다.

{img}

[출처] 일잘러 장피엠 제공 영상 · 04:01

빡빡한 업무 비서와 느슨한 일상 비서의 분리

저는 에이전트 시스템을 업무용과 일상용, 두 층으로 나누어 운영하고 있습니다. 업무 비서는 '클로드 코드(Claude Code)'가, 일상 비서는 '오픈클로(OpenClaw)'가 담당합니다.

업무 목적이라면 클로드 코드가 훨씬 더 적합합니다. 빡빡한 하네스 엔지니어링이 가능해 일정 수준 이상의 퀄리티가 담보되기 때문입니다. 저는 업무별로 18개의 프로젝트 폴더를 쪼개두고, '자비스'라는 이름의 비서실장 에이전트에게 라우터 역할을 맡겼습니다. 자비스에게 일을 시키면 알아서 적절한 하위 에이전트를 찾아 업무를 분배합니다. 예전에는 몇 시간씩 걸리던 맞춤형 교육 시나리오 기획, HTML 기반의 강의 PPT 슬라이드 생성, 심지어 쿠팡 리뷰나 나라장터 공고를 수집하는 크롤링까지 클로드 코드가 직관적이고 편리하게 처리해 줍니다.

{img}

[출처] 일잘러 장피엠 제공 영상 · 10:10

반면, 일상 비서인 오픈클로는 하네스를 느슨하게 잡는 대신 컴퓨터 유즈(Computer Use) 기능을 활용해 유연하게 접근합니다. 마치 사람처럼 컴퓨터 화면을 보고 클릭하며 일을 처리하죠. 텔레그램으로 "내일 오전 오송-서울 KTX 좌석 모니터링해 줘"라고 하면, 안 쓰는 구형 안드로이드 폰을 통제해 코레일 앱을 조회하고 빈자리를 감시합니다. 카카오톡 '나에게 보내기'로 모아둔 링크들을 하루 두 번씩 자동으로 긁어와 구글 시트에 데이터베이스로 정리해 주는 놀라운 마법도 오픈클로가 담당합니다.

비개발자가 깃허브를 벤치마킹하는 끝내주는 방법

AI 에이전트 시대의 가장 놀라운 점은, 이제 무엇이 가능한지만 알면 AI가 그 목표점까지 어떻게든 데려다준다는 것입니다. 저 역시 IT 업계에 오래 있었지만 개발자가 아니었기에 코딩에 대한 두려움이 컸습니다. 하지만 이제는 누군가 어떤 방법으로 문제를 해결했다는 아이디어만 있어도 충분합니다.

{img}

[출처] 일잘러 장피엠 제공 영상 · 22:38

가장 강력한 벤치마킹 도구는 깃허브(GitHub)입니다. 비개발자 여러분들은 깃허브 링크만 보면 복잡한 폴더 구조와 영어 때문에 막막하실 텐데요, 전혀 걱정하실 필요 없습니다. 그저 클로드 코드에게 깃허브 링크를 던져주고 "이 깃허브처럼 나도 하려면 어떻게 해야 해?"라고 묻기만 하시면 됩니다. 클로드 코드가 알아서 코드를 이해하고 여러분의 업무 환경에 맞춰 에이전트를 세팅해 줍니다. 심지어 "PPT를 생성하는 깃허브 프로젝트를 찾아줘"라고 심층 리서치를 시킨 뒤, 그중 마음에 드는 것을 골라 적용해 달라고 할 수도 있습니다.

오토 리서치: 스스로 진화하는 AI 에이전트

에이전트를 한 번 만들었다고 끝이 아닙니다. 진짜 중요한 것은 그때부터 시작되는 '검증과 개선의 루프'입니다. 저는 에이전트에게 명확한 평가 기준을 알려주고, 이 기준에 부합할 때까지 스스로 결과물을 평가하고 개선 과제를 도출해 다시 시도하도록 지시합니다. 이를 '오토 리서치(Auto-Research)'라고 부릅니다.

강의 PPT 제작 에이전트에게 이 방식을 적용해 보니, 첫 번째 버전에서는 엉성했던 결과물이 열 번째 실험에서는 놀라울 정도로 완벽해졌습니다. 신입사원 OJT를 하듯 피드백을 줄수록 에이전트는 실수를 반복하지 않고 시스템 자체가 성장합니다. 코딩용 에이전트 두 개를 서로 토론하게 만들어 스스로 내적 완결성을 높이는 자아비판을 시키는 것도 굉장히 유용한 팁입니다.

정리하면, AI 에이전트는 이미 닥친 현실입니다. 우리 직장인들의 업무 핵심은 이제 '실행'에서 '설계'로 넘어갔습니다. 실행과 디테일은 AI가 압도적인 생산성으로 다 알아서 해줍니다. 우리는 평가 가능한 지표를 세우고, 에이전트를 관리하며, 더 근본적인 연구와 인간관계에 집중해야 합니다. 여러분들도 한계 짓지 마시고 꼭 한 번 에이전트 전환을 시도해 보시길 강력히 추천합니다. 똑똑하게 일하는 방법, 여러분도 충분히 하실 수 있습니다.

FAQ

하네스 엔지니어링(Harness Engineering)이란 무엇인가요?

AI 모델이 사용자의 의도대로 정확히 동작하도록 프롬프트뿐만 아니라 스크립트, 규칙, 참고 파일 등을 통해 행동을 상세히 규율하고 통제하는 설계 방식을 의미합니다.

비개발자도 깃허브(GitHub)를 활용해 AI 에이전트를 만들 수 있나요?

네, 가능합니다. 깃허브의 복잡한 코드를 직접 이해할 필요 없이, 원하는 기능이 담긴 깃허브 링크를 클로드 코드와 같은 AI에게 전달하고 "이것처럼 내 환경에 맞춰 세팅해 줘"라고 지시하기만 하면 AI가 알아서 구현해 줍니다.

클로드 코드와 오픈클로는 실무에서 어떻게 다르게 쓰이나요?

업무용으로 적합한 클로드 코드는 강력한 하네스 엔지니어링을 통해 정해진 프로세스를 정확하게 처리하는 데 유리합니다. 반면 오픈클로는 하네스를 느슨하게 잡고 컴퓨터 화면을 직접 조작(Computer Use)하는 기능이 뛰어나 웹사이트 모니터링이나 일상적인 자동화 비서로 활용하기 좋습니다.

원본 영상 보기

# AI에이전트

# 비개발자

# 생산성

# 업무자동화

# 오토리서치

# 오픈클로

# 일잘러

# 클로드코드

# 프롬프트엔지니어링

# 하네스엔지니어링