Hermes Agent - Nous Research의 자기 개선형 AI 에이전트

2026-04-09

Hermes Agent는 Nous Research가 개발한 오픈소스 AI 에이전트로, 지속적으로 실행되며 경험을 통해 자신의 능력을 개선하는 특징을 갖고 있습니다. 2026년 2월에 MIT 라이선스로 공개되었으며, 기존의 AI 에이전트 프레임워크들과는 근본적으로 다른 접근 방식을 취하고 있습니다.

Hermes Agent의 정의

Hermes Agent는 단순한 챗봇이나 IDE에 연결된 코딩 어시스턴트가 아닙니다. 사용자의 서버에서 실행되는 자율적인 에이전트로, 장기간 실행될수록 더욱 능력이 높아집니다. 일반 대화형 AI와 달리 다음과 같은 특징을 가지고 있습니다.

지속적인 학습 루프: 경험으로부터 스킬을 자동 생성하고, 사용 과정에서 이를 개선합니다.
영구적인 메모리: 세션 간 일관성 있는 기억을 유지하며, FTS5 기반의 검색으로 과거 대화를 활용합니다.
사용자 모델링: Honcho 방식의 변증법적 모델링으로 시간에 따라 사용자를 더 깊이 이해합니다.
다중 플랫폼 접근: Telegram, Discord, Slack, WhatsApp, Signal 등 15개 이상의 플랫폼에서 통일된 경험을 제공합니다.
배포 유연성: $5 VPS, GPU 클러스터, 서버리스 인프라(Daytona, Modal) 등 다양한 환경에서 실행 가능합니다.

핵심 아키텍처 구성

학습 루프(Learning Loop)

Hermes Agent의 차별점은 폐쇄적 학습 루프에 있습니다. 이는 매 세션마다 메모리, 스킬, 세션 검색이 연속적인 피드백 사이클로 작동함을 의미합니다.

주기적 탐촉(Periodic Nudge): 세션 중 설정된 간격마다 에이전트는 최근 활동을 되돌아보고 보존할 가치가 있는 정보를 판단합니다. 사용자의 명시적 입력 없이 시스템 수준에서 작동하며, 메모리는 모든 상호작용의 더미가 되지 않고 선별된 상태를 유지합니다.

스킬 자동 생성: 작업이 완료되면 에이전트는 취한 경로가 문서화할 가치가 있는지 판단합니다. 트리거는 구체적입니다. 다섯 개 이상의 도구 호출, 오류 복구, 사용자 정정, 또는 성공한 비자명한 워크플로우가 이에 해당합니다. 조건을 만족하면 ~/.hermes/skills/ 디렉토리에 로그가 아닌 재사용 가능한 명령어 집합을 스킬 파일로 작성합니다.

스킬 자체 개선: 작성된 스킬은 고정되지 않습니다. 에이전트는 계속해서 이를 사용하면서 더 나은 경로를 발견하면 실행 중에 업데이트합니다. 스킬 관리 도구를 통해 생성, 수정, 편집, 삭제, 파일 쓰기 및 제거 작업이 가능하며, 대부분의 업데이트에 전체 재작성이 아닌 부분 수정(patch) 방식을 선호합니다.

네 계층의 메모리 시스템

메모리는 하나의 저장소에 모든 것을 섞지 않고 네 가지 뚜렷한 계층으로 분리됩니다. 각 계층은 특정한 역할, 디스크상의 위치, 읽혀지는 시기를 가집니다.

1계층: 프롬프트 메모리(Prompt Memory)
매 세션마다 추가 요청 없이 자동으로 로드되는 항상-온 레이어입니다. ~/.hermes/memories/ 디렉토리의 MEMORY.md와 USER.md 파일이 여기에 해당하고, 첫 번째 메시지가 처리되기 전 시스템 프롬프트에 직접 주입됩니다. 의도적으로 3,575자라는 엄격한 제한을 두어 축적보다 선별을 강제합니다.

2계층: 세션 이력(Session History)
일화적 메모리로서 무엇이 언제 일어났는지를 기록합니다. SQLite 데이터베이스에 저장되며 FTS5를 통해 인덱싱되므로, 에이전트는 전체 과거 세션을 컨텍스트에 로드하지 않고 필요할 때 검색합니다. 검색 결과는 LLM 요약을 거쳐 현재 작업에 관련된 것만 주입됩니다.

3계층: 스킬(Skills)
절차적 메모리로서 어떻게 일을 하는지를 다룹니다. ~/.hermes/skills/ 디렉토리에 마크다운 파일로 저장되고, 번들된 스킬은 설치 시 복사됩니다. 기본적으로 스킬 이름과 짧은 요약만 시스템 프롬프트에 포함되며, 전체 내용은 에이전트가 현재 작업과 관련이 있다고 판단할 때만 로드됩니다. 이는 스킬이 몇 개든 토큰 비용을 일정하게 유지합니다.

4계층: 사용자 모델(User Model - Honcho)
에이전트가 명시적으로 무언가를 작성하기를 기다리지 않고, 세션 전반에 걸쳐 수동적으로 사용자의 선호도, 소통 방식, 도메인 지식을 추적하는 선택적 레이어입니다. Honcho는 변증법적 모델링 접근으로 12개의 정체성 계층을 모두 당신과 에이전트를 연관 관계로 모델링합니다. 일반적인 작업 자동화의 경우 처음 세 계층으로 충분하지만, Hermes를 일일 개인 어시스턴트로 사용할 때 응답이 실제 업무 방식에 맞춰진 느낌을 주는 데 큰 역할을 합니다.

게이트웨이(Gateway)

학습 루프와 메모리 시스템은 에이전트가 언제든 접근 가능할 때만 유용합니다. 게이트웨이는 지속적인 백그라운드 서비스로 Hermes를 실행 중인 상태로 유지하고 페어링한 모든 플랫폼에서 연결된 상태로 유지합니다.

Hermes는 CLI, Telegram, Discord, Slack, WhatsApp, Signal, Email 등에 연결되며, 각각의 고유 어댑터가 있지만 모두 공유 세션 라우팅 계층으로 흘러들어갑니다. Telegram에서 시작한 대화를 터미널에서 계속할 수 있는 이유는 세션이 플랫폼이 아닌 ID에 연결되어 있기 때문입니다.

게이트웨이는 5가지 주요 기능을 담당합니다: 메시징, 세션 라우팅, 전달, 페어링, 크론 틱킹. 이 모든 것이 hermes gateway 명령으로 시작되는 시스템 서비스로 실행되어, 터미널을 닫은 후에도 백그라운드에서 계속 실행됩니다.

에이전트 루프(Agent Loop)

모든 메시지는 CLI, Telegram, 또는 다른 플랫폼에서 온 것이든 run_agent.py에서 구현된 동기적 오케스트레이션 엔진을 통과합니다.

메시지가 도착하면 에이전트는 작업 ID를 생성하고 캐시된 시스템 프롬프트를 로드하거나 메모리 계층, 스킬 인덱스, 관련 컨텍스트 파일에서 새 것을 구성합니다. API 호출 전에 프리플라이트 압축 확인이 실행되어 대화 이력이 컨텍스트 제한에 접근하지 않는지 확인합니다.

모델이 도구 호출을 반환하면 에이전트가 이를 실행하고 결과를 추가한 후 다른 API 호출을 위해 루프백합니다. 모델이 최종 텍스트를 반환하면 세션이 SQLite에 지속되고 응답이 게이트웨이를 통해 나갑니다.

프리플라이트 확인이 긴 대화를 플래그하면 하드 컨텍스트 제한에 도달하기 전에 센티널이 트리거됩니다. 보조 모델이 전체 대화를 스캔하여 3,575자 제한 내에서 메모리에 보존할 가치가 있는 내용을 추출하고 중간 턴을 삭제하지 않고 요약합니다.

도구와 스킬

도구와 스킬은 모두 Hermes의 능력 확장의 일부이지만 서로 다른 수준에서 작동합니다.

도구는 에이전트가 호출할 수 있는 것들입니다. 터미널 명령 실행, 웹 검색, 이미지 생성 등 개별 기능입니다. Hermes는 40개 이상의 내장 도구를 제공하며, 다섯 가지 광범위한 범주로 나뉩니다.

실행 도구: 터미널 명령과 코드 실행
웹 도구: 검색과 브라우저 자동화
미디어 도구: 비전, 이미지 생성, 텍스트-음성 변환
조정 도구: 서브에이전트 위임과 다중 모델 추론
메모리와 계획 도구: 에이전트가 세션 중 자신의 메모리 계층과 프로그래밍 방식으로 상호작용

스킬은 에이전트가 도구로 무엇을 하는지 아는 것입니다. 도구 호출을 워크플로우로 연결하는 재사용 가능한 절차로, 에이전트가 한 번 이미 파악하고 작성했습니다. Hermes는 agentskills.io 오픈 표준을 따르므로 스킬은 호환 에이전트 간에 이동 가능하고 커뮤니티를 통해 공유 가능합니다.

번들된 상태로 40개 이상의 스킬이 제공되며, MLOps, GitHub 워크플로우, 연구, 생산성 작업 등의 영역을 다룹니다.

MCP(Model Context Protocol) 통합

Hermes는 MCP를 두 방향으로 지원합니다.

MCP 클라이언트: 외부 MCP 서버에 연결하여 도구에 접근합니다. 데이터베이스, API, 파일 시스템 등에 접근할 수 있습니다. ~/.hermes/config.yaml에 MCP 서버를 등록하면 됩니다.

MCP 서버 모드: Hermes 자체를 MCP 서버로 노출하여 IDE와 다른 도구들이 Hermes를 백엔드로 사용할 수 있게 합니다.

실행 중인 채팅 세션에서 /reload-mcp 명령을 실행하면 Hermes를 다시 시작하지 않고 새로 추가된 서버에 연결할 수 있습니다.

배포와 스케일링

Hermes는 다양한 환경에서 실행 가능합니다.

터미널 백엔드: 여섯 가지 옵션 제공

Local: 컴퓨터에서 직접 실행
Docker: 컨테이너 격리
SSH: 원격 서버 실행
Daytona: 서버리스 퍼시스턴스
Singularity: HPC 및 연구 환경
Modal: 비활성 시 거의 비용이 없는 서버리스

Docker 배포: 읽기 전용 루트 파일 시스템, Linux 기능 제거, 네임스페이스 격리가 아키텍처 기본값으로 설정되어, 에이전트는 지정된 디렉토리 밖에 쓸 수 없고 권한을 상승시킬 수 없습니다.

프로덕션 배포: Nebius Token Factory는 Hermes-4-405B와 같은 대규모 모델을 위한 관리형 추론 플랫폼입니다. GPU 프로비저닝, 로드 밸런싱, 콜드 스타트를 자동으로 관리하므로, 인프라 관리 부담 없이 프로덕션 규모의 배포가 가능합니다.

주요 기능 정리

기능	설명
폐쇄적 학습 루프	에이전트 선별 메모리, 자율적 스킬 생성, FTS5 크로스 세션 검색
다중 플랫폼	Telegram, Discord, Slack, WhatsApp, Signal, Email 등 15개 이상
어디든 실행	6개의 터미널 백엔드, 로컬부터 서버리스까지
모델 유연성	200개 이상의 모델, 코드 변경 없이 전환 가능
스킬 시스템	agentskills.io 오픈 표준 호환, 포팅 가능한 스킬
정시 자동화	자연어 크론 스케줄링, 모든 플랫폼으로 전달
에이전트 위임	병렬 워크스트림을 위한 격리된 서브에이전트
웹 제어	검색, 추출, 브라우징, 비전, 이미지 생성, TTS
MCP 지원	외부 MCP 서버 연결, 확장 도구 기능
연구 준비 완료	배치 처리, 궤적 내보내기, RL 훈련

기술 스택과 요구사항

운영체제: Linux, macOS, WSL2
프로그래밍 언어: Python 3.11+
데이터베이스: SQLite (FTS5 지원)
메시징 게이트웨이: 자체 구현
LLM 호환성: OpenAI 호환 API, Ollama, 200+ 모델 지원
라이선스: MIT

설치와 초기 설정

빠른 설치

# macOS
brew install hermes-agent

# Linux / WSL2
pip install hermes-agent

# 버전 확인
hermes --version

첫 설정

# 에이전트 초기화
hermes init

# 이 과정에서:
# 1. LLM 프로바이더 선택
# 2. API 키 설정
# 3. 메시징 채널 구성 (선택사항)
# 4. 페르소나 설정

# 에이전트 시작
hermes start

OpenClaw와의 비교

OpenClaw와 Hermes Agent는 근본적으로 다른 철학을 가집니다.

OpenClaw: 다중 에이전트 오케스트레이션 중심, 게이트웨이 중심 아키텍처
Hermes: 단일 에이전트 학습 중심, 폐쇄적 학습 루프

OpenClaw의 게이트웨이는 전달만 담당하고, 스킬 생성, 메모리 쓰기, 자동화 출력은 별도 메커니즘으로 처리됩니다. Hermes에서는 게이트웨이가 같은 루프의 일부입니다. 들어오는 메시지는 스킬 생성을 트리거할 수 있고, 정시 자동화가 같은 게이트웨이 계층으로 출력을 다시 작성하며, 플랫폼 간 연속성은 세션 라우팅이 시스템에 연결되어 있기 때문에 작동합니다.

Hermes는 사용자가 단순하고 단기적인 작업만 필요하면 오버 엔지니어링된 느낌일 수 있습니다. 하지만 일일 사용 에이전트를 원하거나, 반복되고 진화하는 작업을 처리하거나, 장기적으로 학습하는 어시스턴트를 구축하려면 Hermes는 더 적합한 선택지입니다.

결론

Hermes Agent는 자기 개선 능력을 갖춘 진정한 개인 AI 어시스턴트를 원하는 개발자들에게 강력한 선택지입니다. 폐쇄적 학습 루프를 통해 사용할수록 더 똑똑해지고, 다중 플랫폼 지원으로 언제 어디서나 접근 가능하며, 완전한 오픈소스 MIT 라이선스 하에서 자신의 방식으로 커스터마이징할 수 있습니다.

특히 장기적으로 에이전트를 개발하고 유지보수할 계획이 있거나, 에이전트의 능력이 시간이 지남에 따라 증가해야 한다면, Hermes Agent는 현재 가장 잘 설계된 프레임워크 중 하나입니다.

참고 자료