360開源FG-CLIP2模型 視覺語言理解能力全球領先

2025-11-05

在中國AI產業仍聚焦於大模型參數競爭之際,360集團以其開源的FG-CLIP2模型,於視覺語言理解領域取得突破性進展。該模型在圖像細節辨識能力上超越谷歌、Meta等國際大廠同類產品,被評為全球最強視覺語言模型。

FG-CLIP2的核心突破在於解決了「細粒度識別」難題,使機器能精準理解圖像中的細微特徵。此項技術對具身智能與商業智能化發展至關重要,例如家庭機器人可根據「拿起茶几上屏幕有裂痕的手機」等複雜指令準確執行任務,安防系統則能迅速鎖定「戴黑色鴨舌帽的可疑人員」等特定目標。

360憑藉其搜索、瀏覽器等核心業務積累的百億級圖文數據,以及自研的高質量數據集FineHARD,持續深耕AI底層技術。此次開源成果不僅展現技術實力,更推進中國建立自主可控的AI技術體系。