这些“少即是多”的提示词技巧你必须知道！

我在 LinkedIn 上看到了一篇帖子，两个朋友也分享了这篇帖子（这就是我发现它的原因）。这让我思考了一下，我觉得为了更清晰的理解，有必要对这个话题进行探讨和阐述。

我想先做一些初步的声明：

1 • 我理解 Ismail 正在 Flux 上尝试长提示——这是另一个生成 AI 的文本到图像平台——而不是 Midjourney。

2 • 在大量文字和看似奇妙的图像中，大多数人不会深入挖掘——因此不会意识到这实际上并没有奏效。

3 • 这次深入探讨并不是在攻击帖子、发帖者或分享者，而是我希望能提供一些清晰的见解。

None

这是 Ismail 帖子中创建和分享的图像。

我在帖子中做了这个评论——我在这里分享它，因为这是问题的关键。

None

重点是什么？

在提示中，重要的是找到描述你想要的内容与避免无效术语之间的界限，并安全地保持在标记化的范围内，确保所使用的词汇不会在翻译中被遗漏。为了获得更好的结果，我们需要在提示中更加简洁和精炼。

我的朋友 Adrian Elton 也注意到了我所发现的……这个非常长的提示在第一行的请求中并没有得到遵循。

None

我去 ChatGPT-4o -

使用我的 12 个提示元素框架，将以下描述修改为简洁而有力的提示。

我随后粘贴了 Ismail 的长提示，ChatGPT 回复了：

None

我将这个简化的提示格式带到 Midjourney，添加了纵横比和风格。

None

这些是 — ar 5:3 和 3:5。

我使用 ChatGPT-4o 修改了提示。关键在于，成功的提示和渲染并不是依赖于大量的文字，而是基于简洁地陈述你想要的内容的精炼方法。

查尔斯·狄更斯在他那个时代是按字数收费的，因此 多余的词 对他的作品是有用的。然而在提示中，我们希望尽可能简洁，以获得最佳结果，因此更加简洁和有力意味着，确实是 少即是多。

在与 ChatGPT 的对话中，我要求 ChatGPT 使用这个提示创建一幅图像。它在使用 Dall-E 渲染之前，通常会修改自己的提示。以下是它生成的内容：

创建一幅超现实主义、抽象、对称的远景图，展示一个超级未来派的住宅建筑外立面，融合华丽的巴洛克风格和大胆的粗犷主义建筑。突出复杂的巴洛克曲线和精致的装饰，与强大的粗犷主义几何形状无缝结合。使用大气、柔和的光线来增强反射和折射特性，使外立面看起来几乎是活的。模拟 35mm 胶卷照片，带有细腻的颗粒感和梦幻般的温暖，赋予其永恒的电影质感。在催眠的视觉体验中挑战观众的尺度和视角，展示未来世界的建筑创新。纵向格式。

None

当给出大量文字时，AI 会决定关注哪些内容。原因在于标记化、解释和应用。这些是 AI 处理文本输入的一些核心方面，尤其是在生成图像或执行其他复杂任务的背景下。

像 Flux（Ismail 使用的那个）、Midjourney，甚至 Dall-E 这样的 AI 模型会将输入文本分解为称为标记的小单元，这些标记可以是单词或单词的一部分。这些标记帮助模型理解和生成响应。模型在一次处理时有一个最大标记限制，这可能会影响它如何处理冗长的输入。

以下是简化的分解：

标记化：模型将文本拆分为可管理的部分（标记）。如果文本超过模型的标记限制，它可能不会考虑输入的某些部分。
解释：AI 根据其在大量文本数据上接受的训练来解释标记。它试图理解上下文和需要执行的具体任务。
应用：模型将其解释的内容应用于生成响应或创建新内容，例如图像。在此过程中，它会根据标记与任务的相关性优先考虑某些标记。

当你提供大量详细信息时，例如图像的冗长提示，AI 旨在捕捉请求的本质，但可能会更关注某些方面而非其他方面。这不仅仅是一个限制，也是确保最关键元素（AI 理解的）得到处理的一种方法。

因此，虽然 AI 在一次处理时有实际的限制，但这也与 AI 如何在其能力和特定任务的背景下解释和优先考虑信息有关。

我想先做一些初步的声明：

重点是什么？

推荐阅读：

美图

提示词：

达斯·维德在雨中，他的冲锋队在背景中，光剑被激活 --ar 9:16

美图

提示词：

https://s.mj.run/KaqaC8_Z8ak https://s.mj.run/oMZ-8v7lKaw --ar 2:3

图文

电商留存中的生成式AI：通过定制化互动推动重复购买和倡导

美图

提示词：

图文

20 + 简单的 Midjourney 提示：生成照片真实感图像

美图

提示词：

赋迪奥本AI

上海赋迪网络科技