FLUX.1-Krea [dev]
無AI痕跡的逼真AI圖像生成
FLUX.1 Krea [dev]
使用 FLUX.1 Krea Dev 模型創建令人驚豔的圖像
您生成的圖像將顯示在這裡
輸入提示詞並點擊生成來創建您的圖像
AI圖像生成的革命性方法
Black Forest Labs 和 Krea 聯合發布了一個名為 FLUX.1-Krea [dev] 的新開源圖像生成模型。該模型的目標是生成高度逼真的圖像,避免典型的「AI外觀」——如蠟狀皮膚、模糊背景和過度處理的光線。
FLUX.1-Krea [dev] 不追求基準分數或超寫實主義,而是專注於保留真實細節、自然紋理和美學完整性。它還與現有的 FLUX 生態系統完全兼容,這對尋求控制和真實感的創作者來說是一個重要的版本。
為什麼這很重要
大多數AI生成的圖像往往帶有某種可識別的特徵——過於完美的皮膚、合成光線、缺乏深度和統一的風格。這個模型通過提出一個簡單但有力的問題來反擊:
如果我們訓練AI不看起來像AI會怎樣?
FLUX.1-Krea 就是基於這個使命而建立的。它重新考慮了對基準驅動優化的傳統依賴,更加重視人類視覺偏好和藝術表達。
是什麼造成了「AI外觀」?
模型背後的團隊指出了一個關鍵問題:針對錯誤指標的優化。大多數模型被調整為在 FID、CLIP Score 或 LAION-Aesthetic 等基準測試中表現出色,但這些往往會促進某些視覺偏見——更亮的圖像、軟化的細節和通用的構圖。
這些指標無法捕捉人類的美學偏好。事實上,一些最廣泛使用的數據集本質上偏向於特定風格,特別是在描繪女性或光線條件等主題方面。這導致輸出感覺人工或同質化。
訓練理念
FLUX.1-Krea 的開發過程分為兩個主要階段:預訓練和後訓練,就像大型語言模型一樣。
1. 預訓練
這裡的目標是廣泛接觸——讓模型吸收各種風格、物體、紋理和光線。有趣的是,團隊強調在低品質或有缺陷的圖像上訓練可能是有用的。
理由是:為了讓模型理解不該做什麼(如渲染多餘的手指或扭曲的臉),它首先必須看到這些錯誤。
2. 後訓練
這個階段使用兩個步驟將模型朝著特定的美學方向精煉:
- 監督微調(SFT):使用精選的高品質圖像集來調整模型。
- 人類反饋強化學習(RLHF):來自理解視覺設計的真實人群的偏好數據。
關鍵見解
品質 > 數量
你不需要數百萬張圖像。不到100萬張精選的例子就足以顯著提高性能。
堅定的觀點
不要試圖取悅所有人,而是有意地調整到特定的美學或視覺風格。
從「原始」模型開始
許多開源模型過度訓練。FLUX.1-Krea 從乾淨的狀態開始,以獲得更多的靈活性。
適合誰使用?
創意工作者
為他們的項目尋求逼真、美學平衡的圖像。
設計師
認為當前的AI模型對他們的需求來說太「塑膠」或風格化。
開發者
構建優先考慮人類吸引力而非基準分數的圖像工作流程。