editoy

앤스로픽의 클로드 코드 캐시 TTL 무단 변경 및 비용 상승 논란

4/12/2026

토킹 포인트

  • 클로드 코드 프롬프트 캐시 유지 시간(TTL)의 갑작스러운 단축(1시간 -> 5분)
  • 캐시 재생성 비용 20~32% 증가 및 구독 사용자 쿼터 소모 가속화
  • 서버 측 설정의 무단 변경으로 인한 사용자 비용 부담 전가
  • 장시간 코딩 세션에서의 효율성 저하 및 비용 패널티 심화

시황 포커스

  • 서비스 제공자의 불투명한 설정 변경 및 성능 조정에 대해 사용자들의 불신이 매우 깊은 상태임.
  • 단순한 기술적 오류가 아닌, 비용 절감 및 인프라 부하 관리를 위한 의도적인 조치로 해석하는 경향이 강함.
  • 추론 능력 저하 및 무한 루프 현상 등 모델 성능의 실질적 하락(너프) 의혹이 광범위하게 확산됨.
  • 구독제 모델임에도 불구하고 실제로는 API 과금 체계와 유사하게 비용 부담이 사용자에게 전가되는 구조에 강하게 반발함.
  • 성능과 비용 효율성 면에서 경쟁 서비스인 Codex로 이탈하려는 사용자 움직임이 구체적으로 관찰됨.
  • GPU 공급 부족 등 물리적 인프라의 한계가 서비스 품질 저하의 근본 원인이라는 분석이 지배적임.
  • 기업용 플랜 사용자들조차 성능 저하와 불투명한 소통 방식에 대해 심각한 우려를 표명함.
  • 초기 시장 점유율 확보를 위해 보조금을 투입하다가, 수익화 단계에서 서비스 질을 낮추는 전형적인 플랫폼 쇠퇴 과정으로 인식함.
  • 모델의 응답 속도나 정확도보다 '신뢰할 수 있는 일관성'이 전문 개발자 도구의 핵심 경쟁력임을 확인 시켜 줌.
  • 인프라 한계를 극복하기 위한 무리한 최적화가 오히려 사용자 경험을 해치고 브랜드 가치를 훼손하는 역효과를 낳고 있음.

트렌드 키워드

  • TTL (Time To Live):

    데이터가 유효하게 유지되는 시간

    앤스로픽이 프롬프트 캐시의 기본 TTL을 1시간에서 5분으로 조용히 변경한 것으로 보임.
  • 프롬프트 캐싱 (Prompt Caching):

    반복되는 입력 데이터를 저장해 비용과 시간을 줄이는 기술

    5분 TTL 설정 시 세션 중 5분만 멈춰도 전체 캐시가 만료되어 다시 작성 비용이 발생함.프롬프트 캐싱
  • 쿼터 소모 (Quota Consumption):

    사용자에게 할당된 API 사용량 제한

    캐시 생성 토큰은 전체 속도로 쿼터에 반영되어 구독 사용자들이 평소보다 빨리 한도에 도달함.쿼터 소모
  • 서버 측 설정 (Server-side Configuration):

    클라이언트 수정 없이 서비스 제공자가 직접 변경하는 설정

    클라이언트 버전이나 사용 패턴 변화 없이 서버 측에서 TTL 계층을 변경한 것으로 판단됨.서버 측 설정
  • 양자화 (Quantization):

    모델의 정밀도를 낮춰 메모리와 연산량을 줄이는 최적화 기법

    1 / 2
    수요 급증과 컴퓨팅 자원 부족으로 인해 모델을 양자화하여 성능 저하가 발생했다는 가설이 제기됨.