Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 gibi rakiplerini geride bırakarak önemli bir başarıya imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki iddialı yolculuğunu sürdürüyor.
QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI
Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan benzeri düşünme yeteneğiyle ön plana çıktığını gösteriyor.
ÇİNLİ YAPAY ZEKÂ GİRİŞİMİ DEEPSEEK VE GPT-4’E KARŞI BAŞARI
Alibaba, Qwen2.5-Max'in DeepSeek-V3, GPT-4 ve Llama-3.1-405B gibi rakip modelleri geride bırakmasının ardından, Çin'deki tatil dönemine denk gelen bu duyuruyu gerçekleştirdi. Qwen2.5-Max, insan tercihlerine yönelik yapılan Arena-Hard testinde, rakiplerinden daha iyi sonuçlar alarak bu alandaki üstünlüğünü kanıtladı.
QWEN2.5-MAX: GERÇEK KULLANIMDA NE SUNUYOR?
Alibaba, Qwen2.5-Max’i Owen Chat arayüzü üzerinden kullanıcılara sunmuş durumda. Yeni yapay zekâ modelinin gerçek kullanımda sunduğu performansı ise zamanla kullanıcılar tarafından yapılacak testler ortaya koyacak.Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 gibi rakiplerini geride bırakarak önemli bir başarıya imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki iddialı yolculuğunu sürdürüyor.
QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI
Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan benzeri düşünme yeteneğiyle ön plana çıktığını gösteriyor.