editoy logo

구글 딥마인드, AI 모델 알파지놈으로 유전체 조절 변이 예측 성능 혁신

1/28/2026

토킹 포인트

  • 구글 딥마인드의 딥러닝 모델 알파지놈 출시, 100만 염기쌍 길이의 DNA 서열을 동시에 분석하여 유전체 기능 예측 능력을 제공.
  • 유전체의 98%를 차지하는 비암호화 영역('암흑 물질')의 복잡한 조절 코드를 해독하여 희귀 유전 질환 및 암 돌연변이 메커니즘 해석에 기여 가능성 제시.
  • 기존 모델 대비 긴 서열 컨텍스트와 높은 해상도를 통합하여, 규제 변이 효과 예측 26개 벤치마크 중 25개에서 최고 성능 또는 동등한 수준 달성.
  • 하나의 통합 모델로 유전자 발현, 스플라이싱, 염색질 상태 등 다양한 분자적 결과를 동시에 예측, 대규모 생물학적 가설 설정 및 실험 우선순위 지정 지원.

시황 포커스

  • AlphaGenome 모델이 인간 유전체 연구에 상당한 진전을 가져옴. 특히 질병 관련 변이가 주로 발견되는 비코딩 DNA 영역에서 기존 모델 대비 우수한 성능을 보임.
  • 유전체를 '다권 구성의 선택형 어드벤처 백과사전'에 비유하며, 유전체 연구의 복잡성을 효과적으로 설명함.
  • 모델은 최대 100만 염기쌍까지 처리 가능하며, 인간 및 마우스 유전체 데이터를 기반으로 학습됨. 유전자 발현, 스플라이싱, 염색질 구조 등 수천 개의 유전체 신호를 예측함.
  • AlphaGenome API 출시 이후 160개국 3,000여 명의 연구자가 활용 중이며, 모델 코드 및 가중치를 비상업적 연구 목적으로 공개함.
  • 인간 DNA의 약 2%만이 단백질 코딩 영역이며, 나머지 98%는 유전자 발현 조절에 관여함. AlphaGenome은 이러한 조절층을 대규모로 모델링하여 희귀 질환, 암 돌연변이, 유전자 치료 연구에 기여할 것으로 기대됨.
  • 26개 벤치마크 과제 중 25개에서 기존 모델과 동등하거나 더 나은 성능을 보임.
  • DeepMind는 모델 개발 과정을 유튜브를 통해 공개함.

트렌드 키워드

  • 알파지놈 (AlphaGenome):

    구글 딥마인드가 개발한 딥러닝 AI 모델로, DNA 서열을 입력받아 유전자 발현 수준, 스플라이싱 패턴, 염색질 상태 등 다양한 분자 표현형을 동시에 예측하는 통합 프레임워크

    구글 딥마인드의 푸시밋 콜리 연구 부사장은 '알파지놈은 복잡한 조절 코드를 해독하기 위한 우리의 해결책'이라고 말했습니다.
  • 유전체의 암흑 물질 (Genetic Dark Matter):

    인간 유전체의 약 98%를 차지하는 비암호화 영역(Non-coding region)으로, 단백질을 직접 코딩하지 않지만 유전자 발현의 시점, 위치, 정도를 조절하는 데 필수적인 지침을 포함하는 부분

    인간 유전체의 98%는 비암호화 영역으로 구성되어 있으며, 이는 유전체 암흑 물질로 알려져 있습니다.유전체의 암흑 물질
  • 서열-기능 모델 (Sequence-to-Function Model):

    DNA 서열을 입력으로 사용하여 유전체 트랙(실험 측정값을 나타내는 데이터 형식)을 예측하도록 학습된 계산 방법론으로, 염기쌍의 변화가 유전체의 의미와 기능에 미치는 영향을 분석

    알파지놈은 100만 염기쌍의 DNA 서열을 입력으로 사용하여 유전체 트랙을 예측합니다.서열-기능 모델
  • 규제 변이 효과 예측 (Regulatory Variant Effect Prediction):

    유전자 발현 및 조절 기능을 담당하는 DNA 영역(주로 비암호화 영역)에서 발생하는 미묘한 변이(돌연변이)가 크로마틴 접근성, 후생유전적 변형 및 유전자 발현 수준 등 생물학적 과정에 미치는 영향을 예측하는 과정

    알파지놈은 돌연변이가 유전자 조절 방식에 어떻게 간섭하는지를 예측하며, 유전자가 언제, 어느 세포에서, 얼마나 활성화되는지를 변화시킵니다.규제 변이 효과 예측
  • 다중 모달 예측 (Multimodal Prediction):

    유전자 발현(RNA 시퀀싱), 스플라이싱(접합 부위), 염색질 상태(DNase/ATAC-seq), 전사 인자 결합, 염색질 접촉 지도 등 여러 종류의 데이터 양식이나 소스를 통합하여 분석하고 예측하는 방식

    알파지놈은 유전자 발현, 상세한 스플라이싱 패턴, 염색질 상태 및 염색질 접촉 지도 등 11가지 양식에 걸쳐 수천 개의 인간 유전체 신호를 동시에 예측할 수 있습니다.다중 모달 예측