關於模型
什麼是 Flux 2 AI?
Flux 2 AI 代表了生成人工智慧領域的一次量子飛躍。由黑森林實驗室(BFL)開發,該團隊是原始穩定擴散創新的背後推手,Flux 2 不僅僅是一個升級——它是對機器如何理解和合成視覺數據的完全架構重塑。 在其核心,Flux 2 將一個巨大的 Mistral-3 24B 參數視覺-語言模型 (VLM) 與一個高度優化的 整流流變壓器 整合在一起。這種混合方法使模型擁有的 '視覺推理' 能力遠超傳統的擴散模型。雖然之前的世代依賴於關鍵字概率,但 Flux 2 理解您場景的語義物理——每個像素的 '誰、如何和為什麼'。 提供多種變體,包括 Flux 2 Dev(用於開放權重實驗)、Flux 2 Pro(用於企業管道)和 Flux 2 Flex(用於細粒度控制),這個生態系統旨在服務於數位創作的整個範疇。從生成 4 百萬像素的超高解析度行銷資產到渲染具有完美拼寫的複雜 UI 模擬,Flux 2 是 AI 藝術下一個時代的決定性工具。
混合 VLM 架構
通過將 24B 參數的視覺-語言模型與流匹配結合,Flux 2 AI 實現了優越的提示遵循,理解複雜的空間關係(例如:'一隻貓坐在一本書上面的玻璃盒子裡')。
4MP 原生解析度
Flux 2 在原生生成支持上推動了保真度的邊界,支持高達 4 百萬像素的生成,提供無需外部升級器的印刷準備清晰度。
多參考一致性
新的身份鎖定機制允許用戶輸入多達 10 張參考圖像,確保角色、產品和風格在不同場景和角度中保持一致。
使用案例與好處
為什麼創作者和開發者選擇 Flux 2 Dev 和 Pro
在充斥著生成工具的市場中,Flux 2 以優先考慮 可控性 和 生產就緒性 脫穎而出。它解決了專業工作流程的具體痛點:可編輯文本的需求、一致資產的需求以及在消費者硬體上高效本地推理的要求(得益於新的 FP8 量化)。
先進的排版和 UI 設計
Flux 2 AI 破解了文本生成的密碼。設計師現在可以生成完整的網站模擬、書籍封面和信息圖元素,文本清晰且完美對齊,消除了舊模型中常見的 '無意義文字'。
開放權重的 Flux 2 Dev 創新
對於開發者和研究人員,Flux 2 Dev 提供了一個開放權重的 32B 參數模型,可以進行微調並在本地部署。與 NVIDIA 合作優化,使用 FP8 量化在 RTX GPU 上高效運行。
漫畫和電影的連續敘事
Flux 2 能夠保持多達 10 個參考輸入,使創作圖畫小說和故事板成為可能,主角的特徵不會漂移,從第 1 幀到第 100 幀保持視覺敘事的完整性。
範例結果


關於 Flux 2 AI 的常見問題
Flux 2 Dev、Flux 2 Pro 和 Flux 2 Schnell 之間有什麼區別?
Flux 2 Pro 是封閉源代碼的最先進 API 模型,提供最高的保真度和 4MP 解析度。Flux 2 Dev 是從 Pro 中提煉出的開放權重非商業模型,允許本地安裝和微調。Flux 2 Schnell(如果可用)是針對極速和低延遲應用優化的快速提煉變體。
我可以將 Flux 2 Dev 用於商業項目嗎?
Flux 2 Dev 的標準許可通常是非商業的。對於商業應用,您應使用 Flux 2 Pro API 或聯繫黑森林實驗室以獲取商業許可,以便自行托管 Dev 權重。
Flux 2 與 Flux 1 有何比較?
Flux 2 在提示遵循和解析度(高達 4MP)方面提供了巨大的升級。最重要的新增功能是多參考能力(最多 10 張圖像)和集成更大的視覺-語言模型(Mistral-3),以更好地理解複雜場景。
我需要什麼硬體才能在本地運行 Flux 2 Dev?
要運行完整的 FP16 模型,您需要大量的 VRAM(通常為 64GB 以上)。但是,使用 ComfyUI 中的優化 FP8 版本,您可以在高端消費者 GPU(如 NVIDIA RTX 3090 或 4090,24GB VRAM)上以可接受的性能運行 Flux 2 Dev。