AI 제품 톺아보기

Alibaba, ‘하이브리드 추론’ AI 모델 Qwen3 오픈소스로 공개

avantgarder 2025. 4. 29. 13:54

1. Alibaba, ‘하이브리드 추론’ AI 모델 Qwen3 공개

Qwen3
Qwen3

 

중국의 알리바바가 새로운 AI 모델 패밀리 Qwen3를 발표했어요.
알리바바는 Qwen3가 OpenAI와 구글 모델을 일부 벤치마크에서 뛰어넘었다고 주장합니다.

핵심 포인트는 이거예요:
👉 "Qwen3는 '생각하는' 모드와 '빠르게 응답하는' 모드를 유연하게 조정할 수 있는 하이브리드 AI 모델이다."


 

 

2. Qwen3의 주요 특징

Qwen3 Github
Qwen3 Github

 

📌 ① 다양한 크기의 모델 출시
Qwen3는 0.6B~235B 파라미터까지 다양한 크기로 구성.
가장 큰 모델은 아직 공개되지 않았지만, 일부 모델은 Hugging Face와 GitHub에 오픈 라이선스로 공개될 예정.

📌 ② 하이브리드 추론 모드

  • 복잡한 문제에 대해 "생각하는 모드(Reasoning)"로 더 정확한 답변 제공
  • 간단한 요청은 "빠른 응답 모드"로 신속 처리
    → 사용자가 작업에 맞게 '생각 예산(thinking budget)'을 설정 가능.

📌 ③ Mixture of Experts(MoE) 아키텍처 일부 채택
특정 모델은 MoE 구조를 적용해 효율성을 높임.
(작업을 쪼개 전문 모델에 분배하는 방식)

📌 ④ 119개 언어 지원 + 방대한 학습 데이터

  • 36조 토큰으로 학습 (교과서, Q&A 데이터, 코드, AI 생성 데이터 등 포함)
  • 다국어 대응 및 다양한 작업에 강점을 보임.

 

 

3. 성능 비교: Qwen3는 얼마나 강력한가

💥 Qwen-3-235B-A22B (최대 모델)

  • OpenAI o3-miniGoogle Gemini 2.5 Pro를 일부 벤치마크에서 능가
  • 수학(AIME)과 추론(BFCL) 테스트에서 o3-mini보다 우수

⚡ Qwen-3-32B (공개된 가장 큰 모델)

  • OpenAI o1 모델을 일부 코딩 벤치마크(예: LiveCodeBench)에서 능가
  • 중국 DeepSeek의 R1 모델과도 경쟁할 수준

📢 단, Qwen-3-235B-A22B는 아직 공개되지 않았습니다.


 

 

4. 공통된 트렌드

이번 소식을 통해 드러난 흐름은 다음과 같아요:

💡 오픈 소스 AI 모델도 이제 상용 클로즈드 모델(OpenAI, Anthropic 등) 과 경쟁 가능한 수준에 도달
💬 미국은 중국 AI 발전을 견제하려고 칩 수출 제한 강화 중,
하지만 Qwen3처럼 고성능 오픈 모델은 계속 등장할 전망

Tuhin Srivastava(Baseten CEO)의 말처럼:

"기업들은 자체 솔루션을 개발하는 동시에, 오픈 모델도 적극적으로 활용하는 현실을 반영합니다."


 

 

📌 정리: 이 소식이 중요한 이유

✔️ 오픈소스 AI 모델의 성능 향상이 빠르게 진행되고 있다는 신호
✔️ 중국발 AI 기술이 글로벌 AI 패권 경쟁에 본격적으로 합류했음을 의미
✔️ AI 모델 선택지가 넓어지면서, 기업들의 AI 도입 전략도 다변화될 가능성

특히 "추론 능력"을 강화한 하이브리드 모델이라는 점이 매우 주목할 만합니다.


원문 출처


📈 관련 태그
#Qwen3 #AlibabaAI #오픈소스AI #하이브리드AI #AI추론모델 #중국AI기술 #HuggingFace #오픈AI모델 #AI트렌드 #AI벤치마크