editoy logo

구글 딥마인드, '프로젝트 지니'를 통한 AI 기반 인터랙티브 세계 생성 실험 시작

1/30/2026

토킹 포인트

  • 구글 딥마인드 월드 모델 '지니 3'를 기반으로 텍스트 및 이미지를 통해 상호작용 가능한 3D 가상 세계를 실시간으로 생성하는 기술 구현.
  • 미국 내 구글 AI 울트라 구독자들에게 실험 연구 프로토타입인 '프로젝트 지니'에 대한 접근 권한을 선별적으로 부여하여 사용 사례 및 피드백 수집.
  • 인공일반지능(AGI) 개발 목표의 핵심 단계로, 로봇 에이전트 트레이닝 및 영화 제작, 교육용 미디어 등 다양한 분야로의 응용 가능성 제시.
  • 60초의 짧은 탐색 시간, 720p 해상도, 낮은 프레임률, 그리고 일관성 및 제어 지연 문제 등 실험 단계에서 나타나는 명확한 기술적 한계점 존재.

시황 포커스

  • Genie 3 출시 및 초기 반응: Google DeepMind의 차세대 월드 모델 Genie 3 기반의 Project Genie가 미국 Gemini Ultra 구독자에게 공개됨. 초기 사용자들은 실시간 상호작용이 가능한 가상 세계 생성 능력에 대해 압도적으로 긍정적인 반응을 보임.
  • 기술적 강점: 텍스트 또는 이미지 프롬프트만으로 무한한 가상 세계를 생성하고, 실시간으로 탐험 및 수정이 가능함. Nano Banana Pro를 활용한 이미지 프리뷰 조정 기능과 실시간 물리 엔진 시뮬레이션이 특징임.
  • AGI 가능성 언급: 일부 시장 참여자들은 Genie 3를 ‘진정한 월드 모델’로 평가하며, AGI(범용 인공지능)에 한 걸음 더 다가섰다는 의견을 제시함. Holodeck과 유사한 경험을 제공할 잠재력에 주목함.
  • 접근성 제한에 대한 비판: 현재 미국 Gemini Ultra 구독자에게만 제공되는 점에 대한 불만과 함께, 구독 모델의 지속 가능성에 대한 의문이 제기됨.
  • 사업적 목적에 대한 질문: 기술 자체의 혁신성은 인정하나, 구체적인 사업화 전략 및 수익 모델에 대한 논의 필요성이 언급됨.
  • 저작권 문제 제기: 생성형 AI 기술의 발전에 따른 저작권 침해 우려가 표출됨. 창작자의 권리 보호에 대한 중요성이 강조됨.
  • 게임 산업과의 연관성: GTA6와 같은 게임 개발에 활용될 가능성에 대한 기대감이 있음.

트렌드 키워드

  • 월드 모델 (World Model):

    인공지능이 현실 세계나 가상 세계의 복잡한 물리 법칙과 객체 간 상호작용을 학습하고 예측할 수 있도록 훈련된 거대 인공지능 모델. 이 모델은 입력된 명령에 따라 결과 이미지를 생성하는 기존 생성형 AI를 넘어, 사용자의 움직임이나 조작에 따라 세계가 어떻게 변화해야 하는지를 이해하고 일관성 있게 환경을 구축하는 데 중점을 둠. 프로젝트 지니는 구글의 '지니 3 월드 모델'을 기반으로 하여, 높은 일관성을 유지하는 동적 환경 생성을 가능하게 함

    1 / 3
    월드 모델은 환경의 역동성을 시뮬레이션하여 그것이 어떻게 진화하고 행동이 어떤 영향을 미치는지 예측하는 시스템입니다.
  • 프로젝트 지니 (Project Genie):

    구글 딥마인드에서 개발한 실험적인 연구 프로토타입으로, 텍스트 프롬프트나 참고 이미지를 기반으로 상호작용 및 탐색이 가능한 가상 세계를 실시간으로 생성하는 인공지능 도구. 정적인 3D 환경을 넘어 사용자의 행동에 따라 환경이 동적으로 반응하는 '월드 모델' 기술을 활용하며, 이는 단순한 게임을 넘어 로봇 공학 시뮬레이션이나 애니메이션 제작 등 광범위한 몰입형 콘텐츠 제작 분야에 혁신을 가져올 잠재력을 보유

    1 / 2
    프로젝트 지니는 사용자들이 자신만의 인터랙티브한 세계를 만들고, 탐색하고, 리믹스할 수 있도록 하는 실험적인 연구 프로토타입입니다.
  • Genie 3 (지니 3):

    프로젝트 지니를 구동하는 핵심적인 일반 목적의 월드 모델. 정적인 3D 환경 스냅샷과는 달리, 이 모델은 사용자가 움직이거나 상호작용하는 것에 따라 앞으로의 경로를 실시간으로 예측하고 생성하며, 이를 통해 역동적인 세계와 물리 법칙, 상호작용 등을 시뮬레이션할 수 있는 혁신적인 기술

    지니 3는 다양한 인터랙티브 환경을 생성할 수 있는 범용 월드 모델로, 당신이 움직이고 상호작용할 때 경로를 실시간으로 생성합니다.Genie 3
  • 나노 바나나 프로 (Nano Banana Pro):

    구글의 이미지 생성 모델 중 하나로, '프로젝트 지니'에서 사용자가 텍스트나 이미지를 통해 생성하고자 하는 세계의 예상 이미지(월드 스케치)를 미리 생성해 주는 도구. 사용자가 실제 3D 세계 탐색에 진입하기 전에 원하는 환경을 시각적으로 확인하고 프롬프트를 수정하여 원하는 결과물에 가깝게 정교하게 조정할 수 있도록 지원하는 역할

    1 / 2
    나노 바나나 프로와의 월드 스케칭 통합을 통해 세계에 뛰어들기 전에 미리보기 이미지를 보고 수정하여 세계를 미세 조정할 수 있습니다.
  • 오토-리그레시브 모델 (Auto-regressive Model):

    시계열 데이터에서 이전 단계의 출력값(프레임)이 다음 단계의 출력값을 생성하는 데 다시 입력으로 사용되는 모델 구조. 지니 3 모델이 이러한 구조를 가지고 있어, 사용자의 이동과 상호작용에 기반하여 다음 순간의 3D 환경 프레임을 실시간으로 예측하고 순차적으로 생성함으로써 일관성 있는 탐색 경험을 구현하는 핵심 기술

    지니 3는 오토-리그레시브 모델이므로, 생성된 환경을 탐색할 때 이전에 생성된 부분을 기억하고 일관성을 유지하는 능력이 있습니다.