Docs
구성
토큰 캐싱

토큰 캐싱 및 비용 최적화

Gemini CLI는 API 키 인증(Gemini API 키 또는 Vertex AI)을 사용할 때 토큰 캐싱을 통해 API 비용을 자동으로 최적화합니다. 이 기능은 이전 시스템 지침과 컨텍스트를 재사용하여 후속 요청에서 처리되는 토큰 수를 줄여줍니다.

토큰 캐싱은 다음 사용자에게 제공됩니다:

  • API 키 사용자 (Gemini API 키)
  • Vertex AI 사용자 (프로젝트 및 위치 설정이 된 경우)

토큰 캐싱은 다음 사용자에게 제공되지 않습니다:

  • OAuth 사용자 (Google 개인/기업 계정) - Code Assist API는 현재 캐시된 콘텐츠 생성을 지원하지 않습니다.

/stats 명령을 사용하여 토큰 사용량과 캐시된 토큰 절약량을 확인할 수 있습니다. 캐시된 토큰을 사용할 수 있는 경우 통계 출력에 표시됩니다.