阿里云發(fā)表通義千問旗艦版宣稱全面超越DeepSeek

前沿科技

分享至

評(píng)論

2025-02-04 21:53:15　來源: 互聯(lián)網(wǎng)　瀏覽次數(shù)：

　　阿里云在大年初一發(fā)布通義千問旗艦版模型Qwen2.5-Max，并宣稱在指令模型版本性能測(cè)試中，幾乎全面超越深度求索DeepSeek-V3等其他模型。

　　阿里云1月29日凌晨在微信公眾號(hào)宣布，Qwen2.5-Max全新升級(jí)發(fā)布，并說新模型展現(xiàn)出極強(qiáng)勁的綜合性能，在多項(xiàng)公開主流模型評(píng)測(cè)基準(zhǔn)上錄得高分，全面超越了目前全球領(lǐng)先的開源混合專家（MoE）模型以及最大的開源稠密模型。

　　阿里云說，通義團(tuán)隊(duì)分別對(duì)Qwen2.5-Max的指令模型版本和基座模型版本性能進(jìn)行了評(píng)估測(cè)試。

　　在指令模型方面，Qwen2.5-Max在多個(gè)基準(zhǔn)測(cè)試中比肩美國(guó)的Claude-3.5-Sonnet模型，幾乎全面超越了另外三個(gè)美國(guó)模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

　　在基座模型方面，阿里云則說，通義團(tuán)隊(duì)將Qwen2.5-Max與目前領(lǐng)先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B，以及同樣位列開源稠密模型前列的Qwen2.5-72B進(jìn)行了對(duì)比。在所有11項(xiàng)基準(zhǔn)測(cè)試中，Qwen2.5-Max全部超越了對(duì)比模型。

　　另據(jù)外媒報(bào)導(dǎo)，選擇大年初一發(fā)布Qwen 2.5-Max是較為特殊的時(shí)間點(diǎn)，也顯示了深度求索過去三周迅速崛起，給中國(guó)境內(nèi)外競(jìng)爭(zhēng)對(duì)手帶來壓力。

　　深度求索1月20日發(fā)布推理模型DeepSeek-R1后，字節(jié)跳動(dòng)旗下豆包更新版大模型1.5-pro上星期三（22日）正式發(fā)布。

　　根據(jù)書生家電網(wǎng)報(bào)導(dǎo)，1.5-pro模型增強(qiáng)了綜合能力，在知識(shí)、代碼、推理、中文等多個(gè)評(píng)測(cè)基準(zhǔn)上，綜合得分優(yōu)于GPT-4o、Claude 3.5 Sonnet 等模型。

THE END

阿里云服務(wù)器價(jià)格 deepseek創(chuàng)始人梁文鋒簡(jiǎn)介人工智能大模型是什么意思