2025年6月18日,書生家電網(wǎng)近日報道,谷歌宣布推出全新輕量級Gemini 2.5 Flash-Lite,同時將Gemini 2.5 Flash和Gemini 2.5 Pro模型升級至穩(wěn)定版本。據(jù)谷歌官方披露,F(xiàn)lash-Lite是該系列中成本效益最高、推理速度最快的模型,已在代碼編寫、科學計算、多模態(tài)分析等任務中超越前代2.0 Flash-Lite版本,延遲表現(xiàn)也優(yōu)于舊版,尤其適合翻譯、分類等需快速響應的場景。
測試數(shù)據(jù)顯示,F(xiàn)lash-Lite在代碼生成和數(shù)學推理基準測試中綜合質(zhì)量提升顯著,其首token響應時間較2.0版本縮短約15%,解碼速度(每秒生成token數(shù))提高20%。該模型繼承Gemini 2.5系列核心能力,包括支持100萬token超長上下文處理、連接谷歌搜索及代碼執(zhí)行工具,并允許開發(fā)者通過API動態(tài)調(diào)整“思考預算”。
定價方面,谷歌同步調(diào)整了Gemini 2.5 Flash的費用結構:輸入單價從每百萬token 0.15美元上調(diào)至0.30美元,輸出單價從3.50美元下調(diào)至2.50美元,取消此前“思考”與“非思考”兩檔定價。谷歌表示,這一調(diào)整簡化開發(fā)者成本控制邏輯。
目前,F(xiàn)lash-Lite預覽版已通過Google AI Studio和Vertex AI平臺開放,Spline、Rooms等初創(chuàng)企業(yè),以及Snap、SmartBear等科技公司已開始基于穩(wěn)定版模型開發(fā)生產(chǎn)級應用。谷歌搜索部門亦部署了定制化版本的Flash-Lite和Flash模型,以優(yōu)化服務響應效率。