DeepSeek-R1-0528: 오픈소스 추론 모델이 O3 및 Gemini를 따라잡을까?
페이지 정보

본문
DeepSeek은 추론 모델의 업데이트된 버전인 DeepSeek-R1-0528을 출시했습니다. 이 모델은 완전한 오픈 소스로 유지되면서도 OpenAI의 O3와 Google의 Gemini 2.5 Pro와 같은 최고 독점 모델에 매우 가까워 졌습니다 .

???? R1-0528의 새로운 기능은 무엇인가요 ?
추론의 깊이와 추론 능력이 크게 향상되었습니다.
AIME 2025의 정확도는 70%에서 87.5% 로 뛰어올랐습니다 .
추론은 이제 질문당 평균 약 23,000개의 토큰을 사용합니다(이전에는 약 12,000개).
환각 감소, 함수 호출 개선, 그리고 "바이브 코딩" UX 개선.
???? 어떤가요 ?
DeepSeek-R1-0528(및 그 정제된 버전)을 다른 모델과 비교해 보세요.
기준 | 딥시크-R1-0528 | o3-미니 | 쌍둥이자리 2.5 | 퀀3-235B |
---|---|---|---|---|
AIME 2025 | 87.5 | 76.7 | 72.0 | 81.5 |
라이브코드벤치 | 73.3 | 65.9 | 62.3 | 66.5 |
HMMT 2월 25일 | 79.4 | 53.3 | 64.2 | 62.5 |
GPQA-다이아몬드 | 81.0 | 76.8 | 82.8 | 71.1 |
???? 중요 이유 :
이 업데이트는 DeepSeek이 수학, 논리, 코드 분야에서 최첨단 모델과의 격차를 줄이는 것을 보여줍니다. 이 모든 것이 오픈 소스 릴리스를 통해 제공됩니다. 로컬에서 실행하기에도 편리하며(양자화된 버전은 Unsloth에서 확인하세요), DeepSeek은 이제 시스템 프롬프트와 더 매끄러운 사고의 흐름 추론을 지원합니다.
???? 직접 체험해 보세요: huggingface.co/deepseek-ai/DeepSeek-R1-0528
???? 데모: chat.deepseek.com ("DeepThink" 토글)
???? API: platform.deepseek.com
관련링크
- 이전글DeepSeek-R1-0528 동적 1비트 GGUF 실행 25.06.09
- 다음글대학을 위한 설정 권장 사항 (H200 대 RTX 6000 Pro) 25.06.09
댓글목록
등록된 댓글이 없습니다.