在线体验 FLUX.1 Krea [dev]
使用我们的交互式演示生成逼真图像,避免典型的AI外观
AI图像生成的革命性方法
Black Forest Labs和Krea联合发布了一个名为FLUX.1-Krea [dev]的新开源图像生成模型。该模型的目标是生成高度逼真的图像,避免典型的"AI外观"——如蜡质皮肤、模糊背景和过度处理的光照。
FLUX.1-Krea [dev]不追求基准分数或超现实主义,而是专注于保持真实细节、自然纹理和美学完整性。它还与现有的FLUX生态系统完全兼容,这使其成为寻求控制和真实感的创作者的重要发布。
为什么这很重要
大多数AI生成的图像往往带有某种可识别的特征——过于完美的皮肤、合成光照、缺乏深度和统一的风格。这个模型通过提出一个简单而有力的问题来反击:
如果我们训练一个AI不像AI会怎样?
FLUX.1-Krea正是带着这个使命而构建的。它重新考虑了对基准驱动优化的传统依赖,更加重视人类视觉偏好和艺术表达。
什么导致了"AI外观"?
模型背后的团队指出了一个关键问题:针对错误指标的优化。大多数模型被调整为在FID、CLIP Score或LAION-Aesthetic等基准上表现出色,但这些往往促进某些视觉偏见——更亮的图像、柔化的细节和通用的构图。
这些指标无法捕捉人类的美学偏好。事实上,一些最广泛使用的数据集本身就偏向于特定风格,特别是在描绘女性或光照条件等主题方面。这导致输出感觉人工或同质化。
训练理念
FLUX.1-Krea的开发过程分为两个主要阶段:预训练和后训练,就像大型语言模型一样。
1. 预训练
这里的目标是广泛接触——让模型吸收各种风格、对象、纹理和光照。有趣的是,团队强调在低质量或有缺陷的图像上训练可能是有用的。
理由是:为了让模型理解不应该做什么(比如渲染额外的手指或扭曲的面部),它首先必须看到这些错误。
2. 后训练
这个阶段使用两个步骤将模型细化到特定的美学方向:
- 监督微调(SFT):使用精选的高质量图像集来调整模型。
- 人类反馈强化学习(RLHF):来自理解视觉设计的真实人员的偏好数据。
关键见解
质量 > 数量
你不需要数百万张图像。不到100万张精心挑选的示例就足以显著提高性能。
强烈的观点
不是试图取悦所有人,而是有意地调整到特定的美学或视觉风格。
从"原始"模型开始
许多开源模型都过度训练了。FLUX.1-Krea从一个干净的状态开始,以获得更多的灵活性。
下载和资源
适合谁使用?
创意人员
寻求为他们的项目制作逼真、美学平衡的图像。
设计师
发现当前的AI模型对他们的需求来说太"塑料"或风格化。
开发者
构建优先考虑人类吸引力而非基准分数的图像工作流程。