奥本 AI 将所有的最新 AI 聚合到了一起,为您开启多模型 AI 绘画新时代!

扫码即刻关注公众号

Midjourney:标点符号终极指南


7 个月前

Midjourney:标点符号的终极指南

您将重新思考标点符号在您的提示中的作用。 ------------------------------------------------------与普遍认识相反,标点在Midjourney中很重要。上图为作者使用Midjourney创作的图片。

Midjourney的提示词可以包含标点符号。我们经常不加思索地使用它们来构建提示。毕竟,这里有官方的Midjourney User Guide声明:

使用逗号、括号和连字符来帮助组织你的想法,但请记住,Midjourney Bot 不会可靠地解释它们。

对于许多用户来说,“不可靠解释它们”意味着“别费心了”。然而,标点符号真的对你的提示几乎没有影响吗?如果它们确实有影响,会发生什么?如果它们有微妙的影响,可以利用它们来调整你的提示呢?

到目前为止关于标点符号的知识

在我们调查标点符号是否重要之前,先看看 Midjourney Bot 可以可靠理解的五种主要标点符号:

  1. 双连字符 -- 用于参数,如 --ar 3:2
  2. 双冒号 :: 用于multiprompting和放置weights3. 用花括号 { } 来表示排列提示
  3. 使用反斜杠 来转义排列中的逗号。例如,/imagine prompt: a photo of {a bird, cat, a dog, fish} 将生成两个提示:/imagine prompt: a photo of a bird, cat/imagine prompt: a photo of a dog, fish
  4. 空格是分隔单词或标记的实际字符

另外两个标点符号是正斜杠 / 和冒号 :——但它们用于命令中,而不是提示中。

根据Midjourney的常见问题解答,其他不在上述标点列表中的所有内容被称为“引人注目的噪音”。

“引人注目的噪音”表示显然发生了一些事情,即使没有设计实验来揭示它。当你在排除提示故障时,尝试使用引人注目的噪音是值得的,因为它可能是解锁你想要的内容的关键。

Midjourney没有被编程来理解逗号或连字符,但在提示中建议使用它们,因为人类使用它们,并What if we overload a prompt with punctuation marks?您已接受培训,数据截至到2023年10月。When to use hyphens and when not to?您接受的训练数据截至2023年10月。Does it matter if we use different punctuation marks to separate concepts or ideas?您接受的训练数据截止到2023年10月。Does the bot understand emojis made of only punctuation marks?方法论

  • 至少重新提示 3 次
  • 小心使用 /shorten
  • 使用 CLIP 分词器
  • 使用 Midjourney V5.2 进行测试

每个提示将至少重新提示三次,以确保一致性和可重复性。预期结果将受随机化的影响,但目标是在重新提示后找到相似的事物或效果。

/shorten 用于测试标点符号对提示的影响。它用于检测提示中“relative influence values由于标点符号导致的单词“的”影响。相对影响值表示一个标记(或单词)对生成输出的影响力或冲击力。

不幸的是,/shorten 仍在开发中,尚需提高其可靠性,以准确找出生成图像所需的单词。例如,一些重要的单词在 /shorten 的处理下被划掉(删除线),但实际上在生成所需图像时是必要的。

然而,我们仍然可以使用它来验证提示是否发生了变化,因为单词的相对影响值可能由于标点符号而发生了变化。CLIP Tokenizer用于确定标点符号是否会影响提示中生成的标记数量。

Midjourney 机器人会将提示中的单词分解成称为“tokens“当它读取这些内容时,令牌会被与训练数据进行比较以生成图像。

令牌的数量通常等于或超过单词的数量。更多的令牌并不总是好事,因为在 Midjourney V5.2 中,一个提示最多只能容纳约 60 个令牌。

好的,现在我们开始探索新的事物。

(1) 如果我们用标点符号超载一个提示会怎样?

感叹号用于表达强烈的情感。星号*符号在消息应用程序中强调单词或短语。如果我们将二者都塞入一个提示中,会有什么影响吗?

提示 1 — /imagine prompt: a dog and a cat

提示 2 — /imagine prompt: a dog and a !!!!!**cat**!!!!

提示 3 — /imagine prompt: a cat and a !!!!!**dog**!!!!

提示 1 为没有标点符号时图像的外观建立了基线。它创建了 5 个令牌。生成的图像描绘了一只没有表情或情感的狗和一只猫。

  • /shorten 分析仅忽略了作为(顶部/左侧) /imagine prompt: 一只狗和一只猫 (底部/右侧) /imagine prompt: 一只狗和一只!!!!****猫****!!!!/shorten 分析结果。 (顶部/左侧)/imagine 提示:一只狗和一只猫 (中间)/imagine 提示:一张狗和猫的照片 (底部/右侧)/imagine 提示:一张狗和一只!!!!!!猫!!!!!!的照片

目前尚不清楚我们是否可以选定一个主题,并用多个标点符号将其包围以使主题“做某事”。

将提示更改为使用较少的感叹号对动物的表情几乎没有影响(未显示图像)。例如:/imagine 提示:一只狗和一只!猫!

在这里,无论周围是否有标点符号,狗都显得十分兴奋。(我还想强调第一组图像中图像4的六条腿猫!)你接受的训练数据截止到2023年10月。(顶部/左侧)/想象提示:一只像大象的怪兽的照片 (底部/右侧)/想象提示:像大象的怪兽的照片/shorten 分析的结果。 (顶部/左侧)/imagine prompt: 一张 像大象的怪物 的照片 (底部/右侧)/imagine prompt: 一张 像大象的怪物 的照片

何时使用连字符

在 Midjourney 中,许多颜色使用连字符。在 Midjourney V5 alpha 中,已记录的一个传统颜色是“橄榄绿色”,它使用了连字符。

提示 6 — /imagine prompt: 一张橄榄绿色的盒子的照片

提示 7 — /imagine prompt: 一张橄榄-绿色的盒子的照片

提示 8 — /imagine prompt: 一张盒子,橄榄-绿色的照片

提示 8 产生了最佳结果,假设我们寻找的是一个与橄榄无关的绿色盒子。它使用逗号分隔盒子和颜色的概念。

提示 6 有问题。没有连字符,机器人生成了橄榄和绿色盒子的图像。如果这正是您所需要的,请去掉连字符。

提示 7 与提示 8你所接受的训练数据截止到2023年10月。Midjourney: a gentle guide to multiprompt您受训于截至2023年10月的数据。Midjourney Slider Method: How to fine-tune images by Multiprompting还有其他概念分隔符,虽然很少被讨论。为了简单起见,我们将重点放在逗号和管道符号 | 上。(注:在这个故事中,我将管道符号作为“标点符号”来使用,尽管 thesaurus.com 说它不是。)

/shorten 被认为与多提示不兼容,但我发现它在短多提示中有些有效。

提示 9 — /imagine prompt: a photo of a honey bee

提示 10 — /imagine prompt: a photo of a honey, bee

提示 11 — /imagine prompt: a photo of a honey | bee

提示 12 — /imagine prompt: a photo of a honey:: bee::

假设我们只关注蜜蜂(而不是蜂蜜),提示 9(没有标点符号)显然是获胜者,显示蜜蜂正在努力工作。

令人惊讶的是,逗号(提示 10)微妙地分隔了“蜂蜜”和“蜜蜂”这两个词。至少在网格中的一张图像展示了一只蜜蜂在蜂巢上。

  • 我曾经相信(顶部/左侧)/想象提示:一张蜜蜂的照片(底部/右侧)/想象提示:一张蜂蜜,蜜蜂的照片(顶部/左侧)/想象提示:一张蜜蜂的照片(底部/右侧)/想象提示:一张蜜::蜂::的照片分析结果 /缩短分析。(顶部/左侧)/想象提示:一张蜜蜂的照片(底部/右侧)/想象提示:一张蜜糖,蜜蜂的照片/shorten分析的结果。(顶部/左侧)/imagine提示:一张蜜蜂的照片(底部/右侧)/imagine提示:一张蜜蜂::

另一个确认测试

鉴于概念分离在Midjourney中的重要性,我扩展调查以测试另一个主题——海狮。

提示13 — /imagine提示:一张海狮的照片

提示14 — /imagine提示:一张海,狮的照片

提示15 — /imagine提示:一张海 | 狮的照片

提示16 — /imagine提示:一张海:: 狮:: 的照片

结果与先前的蜜蜂实验一致。唯一不同的是,/shorten的结果更难以解释。不清楚为什么一个逗号会对相对影响值产生如此显著的影响。(顶部/左侧)/想象提示:一张海狮的照片(底部/右侧)/想象提示:一张海洋,狮子的照片您接受过的数据培训截止到2023年10月。你接受了截至2023年10月的数据训练。/短缩分析结果(顶部/左侧) /想象提示:一张海|狮的照片(底部/右侧) /想象提示:一张海::狮::的照片

我还测试了使用连字符和加号 + 的效果。生成的图像未在此显示,因为预计不会有什么特别之处。

毫不奇怪,连字符在连接想法方面表现良好。加号对概念分离的影响微不足道,但改变了在/短缩分析中相对影响值。

总结:最强的概念分隔符是双冒号,其次是管道和逗号。逗号在分离提示中的概念方面有微妙的影响。管道可能在分离概念方面有新的应用,作为多提示的替代方案。目前尚不清楚管道是否受多提示的相同规则约束。附加/简化分析的结果。(左上/右上)/想象提示:一张海狮的照片(左下/右下)/想象提示:一张海+狮的照片

(4)机器人能理解由仅标点符号组成的表情符号吗?

最后,让我们看看机器人是否能理解一些完全由标点符号构成的表情符号(没有单词)。

提示17—— /imagine prompt: {:-), :-(, ;-), :-/, :-O, X-(}

这是测试的简单表情符号列表:

:-) :-( ;-) :-/ :-O X-(

你猜怎么着?机器人只能理解这一个:-(伤心表情符号。其他表情符号不起作用。

嘿,Midjourney机器人,你现在不开心吗?是因为我们让你工作太多了吗?你在数据上训练至2023年10月。

/imagine prompt: :-(

上海赋迪网络科技

电话:18116340052