zh-tw

Mistral 3 全新登場:支援視覺辨識的開源模型與 WebGPU 本地端應用

December 3, 2025
Updated Dec 3
1 min read

Mistral AI 正式釋出 Mistral 3 系列模型,涵蓋 Ministral 3B、8B、14B 以及旗艦級 Mistral Large 3。全系列皆支援多模態視覺辨識能力,並採用 Apache 2.0 授權。其中最引人注目的 3B 模型,憑藉極致輕量化的優勢,可在瀏覽器端透過 WebGPU 流暢運行,為邊緣運算與本地端 AI 應用帶來全新的可能性。


Mistral 3 系列正式亮相:多模態與開源的新選擇

人工智慧領域的發展從未停歇。Mistral AI 近日宣布推出全新的 Mistral 3 模型家族。這次的發布並非單一產品的更新,而是一口氣帶來了四款不同量級的模型。這四款模型分別是三個屬於「Ministral」系列的小型模型(參數分別為 3B、8B 和 14B),以及一個採用混合專家架構(MoE)的 Mistral Large 3。

這次發布最關鍵的亮點在於「全系列支援視覺能力」(Vision Capable)。這意味著這些模型不再只能處理純文字,還能理解圖像內容。對於開發者和企業用戶來說,這無疑是一個巨大的好消息。而且 Mistral AI 延續了對開源社群的承諾,所有模型皆採用 Apache 2.0 授權發布。這代表著商業使用的門檻被大幅降低,開發者可以更自由地將這些技術整合到自己的產品中。

為什麼 3B 模型讓人這麼興奮?

在這次發布的陣容中,雖然 Large 3 性能強悍,但社群討論度最高的反而是最小的 Ministral 3B。為什麼?因為它打破了效能與體積的既有認知。

Ministral 3B 的檔案大小僅約 3GB。這是一個非常微妙且關鍵的數字。對於現代的智慧型手機、筆記型電腦甚至是某些物聯網設備來說,3GB 的記憶體佔用幾乎是微不足道的。這讓在終端設備上運行「有視覺能力」的 AI 變得觸手可及。

過去我們提到支援視覺的多模態模型,通常都會聯想到龐大的運算需求。但 Ministral 3B 證明了小模型也能具備強大的感知能力。更令人驚艷的是它的執行效率。透過 Hugging Face 提供的展示頁面,使用者可以直接在瀏覽器中,利用 WebGPU 技術來運行這個模型。不需要安裝複雜的 Python 環境,也不需要昂貴的伺服器,只要打開網頁就能體驗。

這種「接近即時」(Real-time)的反應速度,讓人聯想到 Apple 之前推出的 FastVLM。雖然 Apple 的技術當時主要作為研究展示且非商業開源,但 Mistral 3B 直接將這種體驗帶到了開源商業可用的層次。

你可以自行去體驗 Ministral_3B WebGPU 體驗連結

混合專家架構:Mistral Large 3 的技術細節

除了吸睛的小模型,Mistral Large 3 則展現了該公司在頂尖算力上的佈局。這是一個擁有 6750 億(675B)參數的龐然大物。不過這並不代表它每次運算都要調用所有資源。

Mistral Large 3 採用了混合專家(MoE, Mixture of Experts)架構。這就像是一個擁有各領域專家的顧問團。當問題來臨時,系統只會指派最相關的專家來回答。因此雖然總參數高達 675B,但實際參與運算(Active)的參數僅有 41B。

這種設計巧妙地平衡了「知識廣度」與「推論成本」。它讓模型能夠擁有處理複雜、廣泛知識的能力,同時在運行效率上保持在可接受的範圍內。對於需要處理高度複雜任務的企業級應用來說,這是一個兼具效能與成本效益的解決方案。

市場格局:與 Google Gemma 及 Qwen 的正面對決

目前的開源小模型市場競爭異常激烈。開發者在選擇 3B 到 8B 這個量級的模型時,最常考慮的替代品通常是 Google 的 Gemma 系列或是阿里巴巴的 Qwen(通義千問)系列。這兩者都已經建立了穩固的生態系與使用者基礎。

然而 Mistral 3 系列的出現切入了一個痛點:原生的視覺支援

雖然 Gemma 3n 在剛推出時也展示了令人驚豔的視覺能力,但 Mistral 這次將重點放在極致輕量化與 WebGPU 的整合上。對於那些希望在網頁前端、或是資源受限的邊緣裝置上加入「看圖說話」功能的開發者來說,Mistral 3B 提供了一個極具吸引力的選項。它不需要依賴雲端 API,完全在本地端運行,這對於隱私保護要求較高的應用場景來說至關重要。

Apache 2.0 授權的長遠影響

技術規格固然重要,但授權模式往往決定了一個技術能走多遠。Mistral AI 選擇將全系列模型以 Apache 2.0 授權釋出,這是一個非常聰明的策略。

Apache 2.0 是一種對商業應用非常友善的開源授權。它允許使用者自由地使用、修改、分發軟體,甚至將其用於專有軟體中,而無需公開原始碼。這與某些限制商業用途的「開放權重」模型形成了鮮明對比。

對於新創公司和大型企業而言,使用 Apache 2.0 授權的模型意味著沒有法律上的後顧之憂。他們可以放心地在 Mistral 3 的基礎上進行微調(Fine-tuning),開發出針對特定行業的應用程式,這將有助於加速 AI 技術在各行各業的落地應用。

Share on:

© 2025 拓遠資訊有限公司. All rights reserved.