谷歌Gemini 2.5 Flash-Lite亮相

分享至

評論

2025-06-18 09:38:12　來源: 書生家電網(wǎng)　瀏覽次數(shù)：

　2025年6月18日，書生家電網(wǎng)近日報道，谷歌宣布推出全新輕量級Gemini 2.5 Flash-Lite，同時將Gemini 2.5 Flash和Gemini 2.5 Pro模型升級至穩(wěn)定版本。據(jù)谷歌官方披露，F(xiàn)lash-Lite是該系列中成本效益最高、推理速度最快的模型，已在代碼編寫、科學計算、多模態(tài)分析等任務中超越前代2.0 Flash-Lite版本，延遲表現(xiàn)也優(yōu)于舊版，尤其適合翻譯、分類等需快速響應的場景。

　測試數(shù)據(jù)顯示，F(xiàn)lash-Lite在代碼生成和數(shù)學推理基準測試中綜合質(zhì)量提升顯著，其首token響應時間較2.0版本縮短約15%，解碼速度（每秒生成token數(shù)）提高20%。該模型繼承Gemini 2.5系列核心能力，包括支持100萬token超長上下文處理、連接谷歌搜索及代碼執(zhí)行工具，并允許開發(fā)者通過API動態(tài)調(diào)整“思考預算”。

　定價方面，谷歌同步調(diào)整了Gemini 2.5 Flash的費用結構：輸入單價從每百萬token 0.15美元上調(diào)至0.30美元，輸出單價從3.50美元下調(diào)至2.50美元，取消此前“思考”與“非思考”兩檔定價。谷歌表示，這一調(diào)整簡化開發(fā)者成本控制邏輯。

　目前，F(xiàn)lash-Lite預覽版已通過Google AI Studio和Vertex AI平臺開放，Spline、Rooms等初創(chuàng)企業(yè)，以及Snap、SmartBear等科技公司已開始基于穩(wěn)定版模型開發(fā)生產(chǎn)級應用。谷歌搜索部門亦部署了定制化版本的Flash-Lite和Flash模型，以優(yōu)化服務響應效率。

THE END

谷歌X實驗室谷歌平板電腦使用說明書谷歌手機地圖導航