阿里巴巴AI To C業(yè)務旗下AI應用“阿里通義”在6日正式發(fā)布最新的開源推理模型通義千問QwQ-32B,其官方介紹稱,通過大規(guī)模強化學習,千問QwQ-32B在數(shù)學、代碼及通用能力上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上能實現(xiàn)本地部署。
使用者已可免費下載及商用QwQ-32B模型,或通過網(wǎng)頁版Qwen Chat體驗,該模型也將免費上架通義App。
阿里通義團隊表示,QwQ-32B模型針對數(shù)學和編程任務、通用能力分別進行2輪大規(guī)模強化學習,在32B的模型尺寸上獲得推理能力提升,印證了大規(guī)模強化學習(一種機器學習技術)可顯著提高模型性能。
該團隊指,千問QwQ-32B能提供極強的推理能力,以及滿足更低的資源消耗需求,背后關鍵在于強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規(guī)模強化學習,也許是一條通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中還集成了與智能體(AI Agent,指的是能夠自主做出決策、完成移動,且毋需人類介入的人工智能)相關的能力,能在使用工具的同時進行批判性思考,以及根據(jù)環(huán)境回饋調整推理過程。
受此消息影響,6日阿里巴巴集團港股早盤大幅高開漲逾6%,截至午盤漲逾7%。