FLUX：首个真正超越 Midjourney 等的开源 txt2img 模型——FLUX 备受期待……

FLUX 代表了开源文本到图像生成领域的一项突破性成就，其质量和提示遵循性超越了知名平台，如 Midjourney、Adobe Firefly、Leonardo AI、Playground AI、Stable Diffusion、SDXL、SD3 和 DALL-E 3。FLUX 由 Black Forest Labs 开发，团队主要由原始 Stable Diffusion 的创作者组成，输出效果令人惊叹。本文将演示如何轻松地在个人电脑和云服务（如 Massed Compute、RunPod 和免费的 Kaggle 账户）上安装和使用 FLUX 模型。

🔗 FLUX 指南帖子（无需登录即可访问）⤵️ ▶️
https://www.patreon.com/posts/106135985

🔗 FLUX 模型一键综合自动下载脚本 ⤵️ ▶️
https://www.patreon.com/posts/109289967

🔗 Windows SwarmUI 使用指南（查看使用说明）⤵️ ▶️
https://youtu.be/HKX8_F1Er_w

🔗 基于云的 SwarmUI 指南（Massed Compute — RunPod — Kaggle）⤵️ ▶️
https://youtu.be/XFUZof6Skkw

🔗 SECourses Discord 服务器以获取全面支持 ⤵️ ▶️
https://discord.com/servers/software-engineering-courses-secourses-772774097734074388

🔗 SECourses Reddit 社区 ⤵️ ▶️
https://www.reddit.com/r/SECourses/

🔗 SECourses GitHub 仓库 ⤵️ ▶️
https://github.com/FurkanGozukara/Stable-Diffusion

🔗 FLUX 1 官方发布公告博客帖子 ⤵️ ▶️
https://blackforestlabs.ai/announcing-black-forest-labs/

视频片段

0:00 介绍前沿开源 txt2img 模型 FLUX
5:01 将 FLUX 模型集成到 SwarmUI 的过程
5:33 精确手动下载 FLUX 模型的指南
5:54 FP16 和优化 FP8 FLUX 模型的一键自动下载过程
6:45 比较不同用例的 FLUX 模型精度和类型
7:56 FLUX 模型在文件结构中的正确放置
8:07 更新 SwarmUI 到最新版本以兼容 FLUX
8:58 SwarmUI 初始化后使用 FLUX 模型
9:44 调整 FLUX 模型的 CFG 比例
10:23 监控实时服务器调试日志
10:49 RTX 3090 Ti GPU 上的 Turbo 模型图像生成速度
10:59 某些 Turbo 模型输出可能出现模糊
11:30 使用开发模型生成图像
11:53 在 SwarmUI 中切换到 FP16 精度的 FLUX 模型
12:31 对比开发和 Turbo FLUX 模型
13:05 生成原生 1536x1536 图像并评估 FLUX 的高分辨率能力和 VRAM 使用
13:41 RTX 3090 Ti GPU 上使用 SwarmUI 生成 1536x1536 分辨率的 FLUX 图像速度
13:56 验证共享 VRAM 使用及其对生成速度的影响
14:35 无需本地 PC 或 GPU 的基于云的 SwarmUI 和 FLUX 使用
14:48 在 Massed Compute 的 48 GB GPU 上以 $0.31/小时使用预装的 SwarmUI 和 FLUX dev FP16 模型
16:05 在 Massed Compute 实例上的 FLUX 模型下载过程
17:15 在 Massed Compute 上的 FLUX 模型下载速度
18:19 在 Massed Compute 上下载所有高级 FP16 FLUX 和 T5 模型所需的时间
18:52 在 Massed Compute 上一键更新和启动 SwarmUI
19:33 通过 PC 浏览器使用 ngrok 访问 Massed Compute SwarmUI，包括移动兼容性
21:08 比较 Midjourney 和开源 FLUX 输出的相同提示
22:02 在 Massed Compute 上将 DType 配置为 FP16 以提高图像质量
22:12 分析来自相同提示的 FLUX 和 Midjourney 生成的图像
23:00 在 RunPod 上的 SwarmUI 安装和 FLUX 模型下载过程
25:01 比较 Turbo 和 Dev FLUX 模型之间的步骤速度和 VRAM 使用
26:04 在 SwarmUI 安装后在 RunPod 上的 FLUX 模型下载程序
26:55 在 pod 电源循环后重启 SwarmUI
27:42 解决 SwarmUI 中不可见的 CFG 比例面板
27:54 使用流行的 CivitAI 图像评估 FLUX 质量与顶级 Stable Diffusion XL (SDXL) 模型的比较
29:20 在 L40S GPU 上以 FP16 精度生成 FLUX 图像的速度
29:43 将 FLUX 输出与流行的 CivitAI SDXL 图像进行比较
30:05 增加步骤数量对图像质量的影响
30:33 生成更大的 1536x1536 像素图像
30:45 安装 nvitop 以监控 1536px 分辨率和 FP16 DType 的 VRAM 使用
31:25 从 1024px 增加到 1536px 时速度降低
31:42 在免费的 Kaggle 账户上实施 SwarmUI 和 FLUX 模型
32:29 加入 SECourses Discord 以获取支持和 AI 讨论

FLUX.1 [dev] 是一个拥有 120 亿参数的修正流变换器，能够根据文本描述生成图像。有关更多信息，请参阅我们的博客帖子。

关键特性

最先进的输出质量，仅次于我们的高级 FLUX.1 [pro] 模型。
竞争力的提示遵循性，匹配闭源替代品。
使用指导蒸馏进行训练，以提高效率。
开放权重架构，促进新的科学研究，赋能艺术家开发创新工作流程。

FLUX.1 套件的文本到图像模型在图像细节、提示遵循性、风格多样性和场景复杂性方面建立了新的基准。

为了平衡可访问性和模型能力，FLUX.1 提供三种变体：FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]：

FLUX.1 [pro]：FLUX.1 的巅峰，提供无与伦比的图像生成性能，具有卓越的提示遵循、视觉质量、图像细节和输出多样性。
FLUX.1 [dev]：一个开放权重、指导蒸馏的模型，适用于非商业应用。直接源自 FLUX.1 [pro]，在质量和提示遵循性上达到相似水平，同时比同类标准模型更高效。FLUX.1 [dev] 权重可在 HuggingFace 上获取。
FLUX.1 [schnell]：我们最快的模型，针对本地开发和个人使用进行了优化。FLUX.1 [schnell] 在 Apache2.0 许可证下免费提供。与 FLUX.1 [dev] 一样，权重可以在 Hugging Face 上找到，推理代码可在 GitHub 和 HuggingFace 的 Diffusers 中获取。

大规模的变换器增强流模型

所有公共 FLUX.1 模型都采用多模态和并行扩散变换器块的混合架构，规模达到 120 亿参数。FLUX 1 通过结合流匹配，改进了之前的最先进扩散模型，这是一种灵活且概念上简单的生成模型训练方法，其中扩散作为特殊情况。

此外，FLUX 1 通过集成旋转位置嵌入和并行注意力层，提高了模型性能和硬件效率。

图像合成的新标准

FLUX.1 在图像合成方面设定了新的基准。FLUX.1 [pro] 和 [dev] 在多个方面超越了流行模型，如 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra：视觉质量、提示遵循、大小/纵横比变化、排版和输出多样性。

FLUX.1 [schnell] 是迄今为止最先进的少步模型，不仅超越了同类竞争对手，还超越了像 Midjourney v6.0 和 DALL·E 3 (HD) 这样的强大非蒸馏模型。

FLUX 模型经过特别微调，以保持预训练的全部输出多样性。与当前的最先进技术相比，它们提供了显著增强的可能性。

None

视频片段

关键特性

大规模的变换器增强流模型

图像合成的新标准

推荐阅读：

图文

开始使用 Dify：无代码 AI 应用开发

赋迪奥本AI

上海赋迪网络科技