Midjourney面临危险：FLUX绝对构成威胁

Midjourney 处于危险之中：FLUX 绝对是一个威胁

FLUX与Midjourney：深入探讨排版、解剖学、提示遵循等方面

在这篇文章中，我们将深入探讨两个流行的AI艺术生成工具：FLUX和Midjourney。我们将分析它们在排版、解剖学准确性、提示遵循能力等方面的性能，以帮助用户了解哪个工具更适合他们的需求。

1. 排版（Typography）

FLUX： - FLUX在排版方面表现出色，能够生成具有高度可读性和视觉吸引力的文字设计。 - 支持多种字体和样式，用户可以轻松定制文本的外观。

Midjourney： - Midjourney同样在排版方面表现出色，提供了丰富的字体选择和设计选项。 - 用户可以通过调整参数来优化文本的布局和样式。

2. 解剖学准确性（Anatomy Accuracy）

FLUX： - FLUX在生成具有复杂解剖结构的图像时，如人体或动物，通常能够保持较高的准确性。 - 细节处理得当，即使是微小的解剖特征也能被准确捕捉。

Midjourney： - Midjourney在解剖学准确性方面也表现良好，尤其是在处理人物肖像时。 - 然而，在某些情况下，可能会有一些细节上的偏差，需要

生成艺术的景观正在不断演变，Black Forest Labs最近发布的FLUX引起了创作者们的极大兴趣。FLUX是一个开源的文本到图像模型套件，根据官方评估，它在性能上超越了许多该领域的领先模型，无论是开源的还是专有的——包括流行的Midjourney。

来源：blackforestlabs.ai 作为一个广泛探索并记录了Midjourney功能的人，我对围绕FLUX的声明感到好奇。带着健康的怀疑态度，我决定对FLUX进行测试，将其与Midjourney在几个关键维度上进行直接比较。这篇文章详细描述了我的发现，提供了这两个在生成艺术世界中的强大工具的全面比较。 对于喜欢通过视频内容深入了解稳定扩散技术的人，您被邀请查看与本文相辅相成的引人入胜的视频教程：

文本生成

我们首先来考察一下FLUX和Midjourney的文本生成能力。为了说明它们之间的差异，考虑两组图像：左边是FLUX Dev生成的图像，右边是Midjourney V6.1生成的图像。

1. 文本处理和纹理

两种模型都展示了处理简单单词拼写的能力。然而，当涉及到纹理细节时，FLUX似乎更胜一筹。例如，Midjourney生成的单词“HEAL”显示出类似饼干的纹理，这与预期的水果外观并不完全一致。相比之下，FLUX提供了更合适的纹理，使文本看起来更逼真，更符合提示。

当我们观察涉及文本叠加的图像时，质量差异变得更加明显，例如冰块的例子。FLUX生成的文本以其清晰度脱颖而出——单词“Cubes”周围的轮廓清晰且视觉上吸引人，而Midjourney的版本缺乏这种精确度。 2. 宽高比灵活性

FLUX的另一个显著优势是它支持各种长宽比，这一特性比Midjourney提供了更大的灵活性。例如，在1:1的长宽比下，FLUX生成的文本更小，间距更紧密，确保从正面观看时五个字母都能完美可见。然而，Midjourney在这方面表现不佳——它的字母看起来拥挤，并且不能从正面直接视角展示。结论

总体而言，FLUX在排版能力方面表现出色，甚至在这一领域超过了Midjourney。它处理不同长宽比和生成高质量、纹理丰富的文本的能力，使其成为生成艺术中文本生成的更多样化和强大的工具。解剖学

接下来，我们来探讨FLUX和Midjourney如何处理生成人体这一复杂任务——这是一个长期以来困扰AI模型的问题，比如肢体扭曲和不自然的肢体部位。

1️⃣解剖学准确性

FLUX在生成人物图像方面的一个显著改进是其能够避免早期模型如Stable Diffusion 3中常见的明显错误。在FLUX生成的图像中，人体被以高度的准确性描绘，没有重大的解剖错误。然而，仍有一些地方可以看出AI的影响，例如过于突出的肌肉。这些膨胀的肌肉可能看起来略显不真实，熟悉肌肉结构的人可以轻易识别出图像是由AI生成的。 Midjourney 另一方面，生成的肌肉结构看起来稍微更真实，特别是当添加了像汗水这样的细节时。这使得Midjourney图像中的健美运动员看起来更栩栩如生，有助于整体的真实感。 2️⃣ 空间关系

虽然Midjourney在肌肉真实感方面可能具有优势，但它在空间关系处理上存在显著困难。例如，在一张图片中，杠铃似乎穿过了女性的头部——这是一个明显的缺陷，破坏了生成场景的沉浸感。相比之下，FLUX在这方面表现出色。得益于其灵活的宽高比支持，FLUX能够准确描绘空间关系，使得整个杠铃得以展示，而不会挤占图像空间或引入尴尬的错误。 3️⃣ 动作与姿势：芭蕾舞者和瑜伽

在比较这些模型如何处理动态姿势时，例如芭蕾舞者和瑜伽练习者的姿势，FLUX和Midjourney都表现出色，尽管存在一些差异。

芭蕾舞者：两个模型生成的芭蕾舞者图像非常相似，每个都有一些小问题。然而，Midjourney的版本虽然略有瑕疵，但通过其对光影的运用，确实提供了更具戏剧性的美感。
瑜伽姿势：在瑜伽姿势方面，FLUX展现出了非凡的准确性，几乎完美地掌握了复杂的姿势。Midjourney也做得相当不错。结论

在生成人体方面，FLUX和Midjourney几乎不相上下。FLUX在空间关系和动态姿势的准确描绘方面表现出色，而Midjourney在渲染逼真的肌肉结构和戏剧性照明方面略占优势。总体而言，这两个模型都显示出显著的优势，使它们成为AI艺术中生成人物形象的强大工具。交互/提示遵循

接下来，让我们深入探讨“互动”这一概念——这些模型描绘人与人之间、人与物体之间自然互动的能力，或者它们如何准确地遵循给定的提示。这是生成艺术的一个关键方面，尤其是在处理需要对空间关系和人类情感有细微理解的复杂场景时。

1️⃣ 处理复杂角度和自然交互

想象一个场景，一个小男孩正在回头看——这对于任何模型来说都是一个挑战性的角度。在这种情况下，FLUX的表现超过了Midjourney。虽然FLUX图像中的蝴蝶并没有像提示所建议的那样准确地落在小男孩的肩膀上，但它落在了他的手臂上，创造了比Midjourney产生的效果更自然、更可信的互动。FLUX在捕捉小男孩的目光方面也表现出色，完美地传达了一种惊奇和好奇的感觉。

2️⃣ 提示遵循和表达

在另一组图像中，Midjourney展示了对提示更强的遵循性，几乎完全复制了它。相比之下，FLUX略逊一筹。例如，在一个男人应该表达惊讶的场景中，FLUX图像中男人的表情缺乏你从提示中期待的那种情感的强度或清晰度。在这里，Midjourney对细节的关注，特别是在面部表情上，产生了更有说服力且与提示一致的图像。 3️⃣ 图像质量和逼真度

当谈到整体图像质量时，Midjourney通常产生更逼真的结果，尤其是在皮肤纹理和细节方面。Midjourney的图像中的皮肤看起来更自然，具有增强现实感的微妙细节。另一方面，FLUX有时会产生略微塑料般的皮肤外观，从而降低了图像的整体现实感。结论

尽管存在一些不足，FLUX在某些情况下仍然能够超越Midjourney，特别是在创建自然互动和捕捉复杂角度方面。虽然Midjourney在特定情况下可能在图像质量和提示遵循方面胜出，但FLUX处理具有细微互动的挑战性提示的能力相当令人印象深刻。这使得FLUX成为在捕捉互动本质至关重要的场景中的一个吸引人的选择，即使它并不总是面面俱到。手

让我们讨论生成艺术中最臭名昭著的挑战之一：创造逼真的手部。许多人工智能模型在这方面都遇到了困难，经常产生看起来扭曲或不自然的手部。让我们来检查一下FLUX和Midjourney在这一领域的表现如何。 1️⃣ 手部生成的真实性

FLUX因其能够生成看起来令人印象深刻的逼真手部而脱颖而出。特别是，在处理具有挑战性的角度时，例如左手以不寻常的角度摆放，FLUX能够保持解剖学的准确性和自然的外观。这种细节水平对于创造令人信服的图像至关重要。另一方面，Midjourney 在手部生成方面存在一些明显的问题。即使在一些较好的示例中，Midjourney 在处理指甲盖等细节时也存在困难，尤其是在无名指和小指上。这些不准确之处可能会分散注意力，降低图像的整体逼真度。 2️⃣ 场景间的一致性

Midjourney在手部生成方面的问题并不是一次性的偶然事件；这是一个持续存在的问题。例如，在一组描绘某人弹钢琴的图像中——这是一个手部准确性至关重要的场景——Midjourney再次表现不佳。它生成的手部往往看起来笨拙或不正确，破坏了场景的视觉完整性。相比之下，FLUX在处理这项任务时更加精确，生成的手部看起来在图像的上下文中显得合适且自然。结论

当谈到生成手部图像时，FLUX明显优于Midjourney。无论是在不寻常角度下的解剖学准确性，还是在不同场景下的一致性，FLUX在处理AI生成图像中最具有挑战性的方面表现出了更优越的能力。对于需要可靠和逼真手部描绘的创作者来说，FLUX是更好的选择。人脸生成

生成逼真的人脸是人工智能模型的另一个重要测试，在这个领域，皮肤纹理和色调等微妙细节可以产生巨大的差异。让我们看看FLUX和Midjourney在这方面的表现如何。 1️⃣ 皮肤质感与真实感

当谈到皮肤质感时，Midjourney具有明显的优势。它生成的面孔看起来更加逼真，皮肤纹理能够捕捉到栩栩如生的品质。这种逼真感通过Midjourney反映提示中的暖色调进一步增强，创造出更加自然和令人信服的外观。相比之下，FLUX在这一领域表现不佳。FLUX生成的面孔皮肤常常显得油腻或塑料感，这降低了图像的整体真实感。与Midjourney甚至Stable Diffusion 3 Medium相比，这个问题尤为明显。值得注意的是，Stable Diffusion 3 Medium有时在皮肤纹理质量方面甚至能超越FLUX和Midjourney，产生更细腻自然的面部纹理。

2️⃣ 处理眼泪和情感细节

尽管FLUX在皮肤质感方面略逊一筹，但在某些面部细节方面，如生成眼泪，它还是能够与Midjourney相媲美。FLUX和Midjourney都能够在被提示时展示眼泪——这并非所有模型都能做到的成就。

例如，在与Juggernaut XL和Stable Diffusion 3 Medium的比较中，这两个模型都没有成功捕捉到眼泪，这突出了FLUX和Midjourney表现良好的一个领域。结论

在面部生成领域，Midjourney 由于其更优越的皮肤纹理和更准确地反映提示中的温暖色调的能力，主要超越了 FLUX。FLUX 虽然能够处理某些面部细节，如眼泪，但在提供逼真和自然的外观面部方面始终落后。对于重视面部现实感，尤其是皮肤纹理的创作者来说，Midjourney 仍然是更强的选择。最终想法

在彻底审查这些图像后，很明显，作为一个开源模型，FLUX在生成艺术方面取得了显著进展。它在几个方面超越了Midjourney，例如提示遵循和手部生成，展示了开源模型的潜力。虽然FLUX目前在整体图像质量上还有所不足，但其开源的特性允许它与其他模型合作，这可能导致快速的改进。围绕FLUX的热议表明，我们可以期待在不久的将来看到更多基于这项技术的精细模型。我将继续为你更新有关FLUX的教程，所以如果你还没有关注我，现在是一个很好的时机！保持关注，继续创作！ 💡想要深入了解吗？我的Midjourney和Stable Diffusion作品集在等着你。 [Midjourney 教程]

1. 排版（Typography）

2. 解剖学准确性（Anatomy Accuracy）

赋迪奥本AI

上海赋迪网络科技