HSDP (Hierarchical Sharded Data Parallelism) MoE 모델의 가중치 특성에 따라 레이아웃을 분리하여 병렬 처리 효율을 높이는 방식 용례 "비전문가 가중치와 전문가 가중치에 대해 별도의 HSDP 레이아웃을 사용함." - 커서(Cursor) Composer 2.5 출시: 성능 최적화와 비용 혁신을 통한 AI 코딩의 진화