추론·에이전트 성능과 효율성을 동시에 높인 오픈 LLM

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

DeepSeek-AI, A. Liu, Aoxue Mei, B. Lin, Bing Xue, Bing-Li Wang, Bin Xu, Bochao Wu 외

인용 515인기 25.1

원문 보기 ↗

AI 분석

한줄 요약

DeepSeek-V3.2는 희소 어텐션, 강화학습 스케일링, 에이전트 태스크 합성 파이프라인을 통해 효율성과 추론·에이전트 성능을 모두 높인 오픈 LLM이다.

풀어야 하는 문제

기존 오픈 LLM은 긴 문맥에서 계산 비용이 높고, 복잡한 추론 및 도구 사용 환경에서 성능이 제한적이었다.

접근 방법

(1) DeepSeek Sparse Attention(DSA)으로 긴 문맥에서 연산량을 줄이면서도 성능 유지. (2) 강화학습 프레임워크를 확장하여 사후 학습 연산을 늘려 GPT-5 수준의 추론 능력 확보. (3) 대규모 에이전트 태스크 합성 파이프라인으로 도구 사용 시나리오에서의 훈련 데이터를 생성, 에이전트 사후 학습을 통해 일반화 및 명령 수행 강건성 향상.

결과·기여

DeepSeek-V3.2는 GPT-5와 비교 가능한 성능을 보였으며, 고연산 변형(Speciale)은 GPT-5를 능가하고 Gemini-3.0-Pro와 동등한 추론 성능을 달성했다. 2025 IMO와 IOI에서 금메달 수준 성과를 기록했다.