3月21日,騰訊正式發(fā)布自研深度思考模型“混元T1”正式版,并同步在騰訊云官網(wǎng)上線。該模型基于騰訊3月初發(fā)布的“混元Turbo S”打造,是一款具備快速響應、高輸出速度和擅長超長文本處理的強推理模型。
據(jù)介紹,“混元T1”通過大規(guī)模強化學習,并結(jié)合數(shù)學、邏輯推理、科學和代碼等理科難題的專項優(yōu)化,進一步提升了推理能力。在超長文本推理領域,“混元T1”展現(xiàn)出獨特優(yōu)勢,能夠有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。
“混元T1”采用混合Mamba架構(gòu),針對長序列處理進行了專項優(yōu)化。通過高效的計算方式,在確保長文本信息捕捉能力的同時,大幅降低資源消耗。在相近的激活參數(shù)量下,解碼速度提升2倍。目前,“混元T1”已在騰訊云官網(wǎng)上線,輸入價格為1元/百萬tokens,輸出價格為4元/百萬tokens。