奥本 AI 将所有的最新 AI 聚合到了一起,为您开启多模型 AI 绘画新时代!

扫码即刻关注公众号

"故事视觉化秘籍:ChatGPT与MidJourney的魔法结合"


4 个月前

别误会,库存照片有其存在的价值。我喜欢库存照片。但有一个大问题。我他妈的太喜欢库存照片了。有时候,从我开始在Unsplash或Pexels上搜索,到最终找到完美图片的那一刻,我明显感觉自己变老了。作为一个努力成为摄影师的人,我沉迷于所有美丽的照片,试图找到那一张完美的突出照片。因为你知道,我太骄傲了,不想沦落到使用那些随处可见的戴着眼镜的千禧一代,脸上带着假装的“我发现了”的表情。或者更糟糕的是,一张普通的笔记本电脑旁边放着一杯冒着热气的咖啡。我的意思是,拜托,人们,好像所有“深刻”的文字思想只能用同样的六张照片来点缀。

呼……深呼吸。我会冷静下来的。

用AI武装自己

现在,在你继续之前,我们的故事有两个主要的AI主角:ChatGPT和MidJourney。我假设你已经听说过这些,除非你一直躲在掩体里等待世界末日(考虑到世界上的一些情况,这是可以理解的)。如果你要继续阅读这篇文章,这里有几件重要的事情要知道:

ChatGPT:我使用的是ChatGPT的高级数据分析模式,这仅在付费的ChatGPT Plus订阅中可用。如果你没有订阅,你可以用普通的ChatGPT试试看会发生什么,但如果它不像我描述的那样工作,不要写信给我。

MidJourney:可能是目前最先进的生成性AI艺术工具,但也不是免费的。MidJourney也没有友好的用户界面,而是通过Discord访问。如果这对你来说听起来像胡言乱语,请自行承担风险继续。如果你没有MidJourney,你可以尝试替代一个免费工具——Playground.ai是一个不错的选择。

这两者共同构成了贯穿本文的动态二人组。虽然我在之前的文章中大肆宣扬MidJourney方法节省了多少时间,但将其与ChatGPT的分析能力相结合?好吧,我告诉你们,我们即将打破常规。

开始:选择你的作品

你准备好继续这个派对了吗?和机器人跳个伦巴?与ChatGPT建立一点对话?不仅是一次普通的旅程,而是一次MidJourney(明白我在说什么吗?)。好了,够了,我会停下来的。

让我们重申一下我们的目标:我们要做的是,拿出一篇我们创作的精彩文章,并生成四张独特且原创的图片来配合它。这些图片都将与同一个创意主题相符,这个主题将与你的文章内容和语气相关。现在,这将需要一些时间来逐步完成这个方法,但一旦你掌握了它,你可以在几分钟内为任何写作作品重复这个过程。很棒吧!

所以,首先,我们需要选择一篇我们写过的文章。它可以是几乎任何文章——但你越对它充满热情,你就会越享受结果。我选择的是几年前写的一篇名为“”的文章。它有一个我很久以前选择的很棒的库存图片头图。我清楚地记得——我换了女儿的尿布,把她放在婴儿床里,熬夜搜索图片并提交文章,然后突然间,她已经上高中了。这就是找到一张好图片所花费的时间!

无论如何,这是一篇充满精彩描述性意象的文章,本可以从更多的图片中受益。所以,让我们事后补上这些图片。

当你选择了你的作品后,将其剪切并粘贴到一个文本文件中。PDF或Word文档通常也可以——我只是发现文本文件对ChatGPT的数据分析处理更快。完成了吗?让我们继续。

第二步:ChatGPT分析

好了,是时候把你的故事或文章介绍给ChatGPT了。我们希望AI深入挖掘,吸收精髓,并与你的文字融为一体。这就是为什么我喜欢使用高级数据分析模式。听起来它应该比不使用它做得更好。我没有确凿的证据表明这是真的——让我们称之为直觉。另外,我有点极客,所以我喜欢在高级模式下摆弄东西。也许这就是为什么我的生活总是很复杂。

所以,你有两个任务:

  1. 将我超级棒的提示(如下)剪切并粘贴到ChatGPT输入框中。现在不要迷失在细节中;我们稍后会详细分解每个提示步骤。而且,看在上帝的份上,不要按回车或点击“发送消息”!有点耐心。

    你是一位具有敏锐细节观察力和将文字和故事转化为引人入胜的图像和艺术作品能力的创意设计师。你的任务是逐步完成以下工作:
    
    1. 分析整篇文章。根据你的分析,理解文章的语调和上下文,推荐一种适合为这篇文章创建图像和艺术作品的创意风格。描述创意风格时,结合流行的艺术表达、趋势、风格、时期、方法等。图像风格不应是写实的照片,而应是一种适合文章上下文的创意表达。
    
    2. 根据你上面得出的创意风格描述,将其浓缩并总结为适合在MidJourney(一种基于生成性AI的图像创建工具)中使用的关键词。例如,一个典型的提示可能看起来像这样:“干净的线条艺术,以Egon Schiele的风格,金属点画,表现性线条”或“受涂鸦启发的混合媒体风格,好莱坞魅力肖像,浪漫涂鸦,喷枪艺术,复古,封闭在一个形状中”。
    
    3. 对于第三个任务,分析整篇文章并识别四个适合作为故事中创意图像主题的短语。确保你分析了文章中的全部文本。选择那些可以通过拟人化或物化转化为简短的2-3字描述的短语,这些描述更容易视觉化。例如,短语“黑暗的阴影折磨”无法真正被看到,所以你可以将其拟人化为一个男人的肖像,他的一侧脸完全在阴影中:“阴影中的脸”。
    
    4. 对于最后一个任务,你将为MidJourney构建生成性AI艺术提示。你将通过将任务3的结果与任务2的结果结合起来,为我们提供总共四个提示。然而,不要使用你在任务3中从文章中选择的精确短语,而是使用你为每个短语描述的可视化或意象。尝试将这些意象浓缩为几个清晰的拟人化或物化词语。例如:“内心的恶魔:这可以被可视化为一种二元表现,也许是一个具有分裂外观的图形,展示了天使和恶魔的两面。”这可能会变成:“半天使半恶魔的二元性”。在每个提示后附加以下内容:--ar 4:3 --s 400 --c 40
    
    在结束一个任务并开始下一个任务之前,寻求我的确认。
    
  2. 点击ChatGPT输入框中的小“+”图标——这将允许你上传包含你文章的文本文件。选择你的文件并等待它上传,这应该只需要几秒钟。除非你写了一篇论文。你写过论文吗?也许你才是那个极客。

None

上传你的文件到ChatGPT | 图片来源:作者

现在你可以点击“发送消息”,让魔法开始吧!ChatGPT将逐个任务处理,等待你的确认后再进入下一个任务,就像一只训练有素的宠物。让我们看看我的结果,并解释一下这里发生了什么。

任务1——推荐创意风格

在这里,我们要求ChatGPT分析我们作品的内容,并根据文章的语调和上下文推荐一种适合图像和艺术作品的创意风格。以下是我的结果:

None

ChatGPT截图任务1 | 图片来源:作者

哦,我已经爱上它了。表现主义遇到明暗对比遇到超现实主义遇到抽象象征主义。听起来像是一部扭曲的大卫·林奇电影。

所有这些信息显然太多了,无法包含在我们未来的MidJourney提示中,这就是任务2的全部内容。

礼貌地告诉ChatGPT,是的,它可以继续。或者如果你更喜欢粗鲁的方式,也可以那样告诉它,它都会听从。

任务2——浓缩创意风格描述

用ChatGPT的话说,“现在,我将把创意风格描述浓缩并总结为适合MidJourney提示的关键词。”这使得它对我们构建MidJourney提示更加有用。以下是我的结果:

None

ChatGPT截图任务2 | 图片来源:作者

所以它把任务1中的所有风格描述浓缩成了这些:

"表现主义,大胆的色彩,扭曲的形式,夸张的线条,明暗对比,强烈的明暗对比,超现实主义,梦幻般的场景,意想不到的并置,抽象象征主义,面具,阴影,镜子。"

完美,继续任务3。

任务3——找到短语以转化为创意图像

现在真正的工作开始了。ChatGPT浏览我们的故事,找出它认为会形成引人入胜的意象的短语。我觉得ChatGPT得到了所有的赞誉,但别忘了是我告诉它这么做的,非常感谢。当它提取出短语时,我们还要求它尝试以可视化的方式描述短语——这有助于给MidJourney更好的方向,以创建更与短语相关的图像——至少根据我的经验,我承认这相当薄弱。以下是它为我提取的内容:

None

ChatGPT截图任务3 | 图片来源:作者

我喜欢它从我的文章中识别并提取的短语。它们都提供了一些深刻的潜台词,能在你的脑海中唤起不错的图像。尤其是如果你是个心理变态者。我保证我不是。老伙计ChatGPT做得很好。让我们给它任务4的绿灯。

任务4——构建生成性AI艺术提示

这是我们ChatGPT提示的最终目的地。在这里,我们要求AI基本上将其在任务2和任务3中的发现结合起来,构建出四个用于MidJourney的图像提示。我们的提示还指示附加一些MidJourney参数以确保效果。它们是:

--ar 4:3 | 这设置了图像的宽高比。你可以根据需要更改。

--s 400 | 这将风格化参数设置为高于典型默认值。基本上,它会生成更有趣的图像。

--c 40 | 这是混乱参数。数字越高,MidJourney从单个提示返回的四个初始图像中的变化就越多。

我发现结合风格化和混乱参数,我们肯定会从我们的提示中得到至少一个突出的创意风格。你可以调整这些数字。我的最终提示如下。你的看起来怎么样?

None

ChatGPT截图任务4 | 图片来源:作者

第三步:MidJourney混音的主题掌握

你知道那些节奏感染力强的歌曲,你会想,“伙计,这会是一个很棒的混音!”吗?嗯,MidJourney的“混音”功能与那无关,因为它与音乐毫无关系。抱歉,我只是觉得那听起来像是一个很酷的开场白。

好吧,我猜如果我勉强……MidJourney混音功能的魔力在于它能够将一致的艺术风格应用于不同的图像,有点像音乐节奏在歌曲混音中保持一致(我成功了吗?)。重点是什么?我们可以让一整套图像看起来像它们都属于同一个豪华套装,由同一个了不起的创意艺术家设计。这是一种让你的文章中的图像感觉它们是有目的存在的好方法。就像我们几乎是有意为之的!(注意:我们确实是有意的。)

现在ChatGPT已经确定了我们的主题“外观”,混音功能让我们可以将这种风格应用到我们想要生成的所有图像上。所以,让我们来看看如何做到这一点。

第一步——创建并选择“外观”

首先要做的是一个小小的设置调整——确保混音模式已开启。通过在Discord的提示框中输入_/prefer remix_来完成此操作。

None

MidJourney截图,开启混音 | 图片来源:作者

现在,输入ChatGPT为你提供的第一条提示。对我来说,是这样的:

/imagine: 半天使半恶魔的二元性,表现主义,大胆的色彩,扭曲的形式,夸张的线条,明暗对比,强烈的明暗对比,超现实主义,梦幻般的场景,意想不到的并置,抽象象征主义,面具,阴影,镜子 --ar 3:4 --s300 --c 30

以下是MidJourney提供的内容:

None

MidJourney截图,带有放大和版本按钮 | 图片来源:作者

注意风格化和混乱参数的作用。我们有四种相当不同的风格。我喜欢左下角的风格——那种外观很适合我的作品。所以我点击MidJourney上的“U3”按钮来放大它。那将成为我的四张图片中的第一张,也是我用来创建下三张图片的参考混音图像。

第二步——混音x3

一旦放大完成,我们就可以创建下一张图片。这就是开启混音功能发挥作用的地方。所以,点击“Vary (Strong)”按钮来弹出混音提示。

None

None

现在,我们要做的就是把ChatGPT提供的下一条提示输入混音输入框。实际上,我们在这里只改变前几个词——ChatGPT为每个可视化选择的短语——其余部分是相同的。所以,对我来说,“半天使半恶魔的二元性”变成了“阴影中的舞者”。

None

None

超级重要的小步骤:在提交混音框之前删除风格化和混乱参数(见上面的截图中突出显示的参数)。如果你不这样做,第一个图像的初始风格将在数字漩涡中丢失,这就失去了目的!聪明的你可能想调整我之前发布的ChatGPT提示,去掉最后三个提示中的参数。天才!

所以,删除那些讨厌的参数并点击提交按钮。MidJourney会奖励你四张新图像,所有这些图像都应该继承我们第一张放大图像的相同风格。你的看起来怎么样?我的如下。

None

MidJourney截图,混音结果 | 图片来源:作者

没有什么比左上角的图像更能表达“阴影中的舞者”了——那是我会从中选择放大并使用的图像。

现在,剩下的就是重复这个过程,为最后两个图像提示。回到那第一张原始的放大图像,再次点击“Vary (Strong)”按钮,并将下一条提示输入混音框。当然,你会记得删除我们刚才提到的两个参数,对吧?

每次,你都会得到一组四张图像,它们都应该遵循你选择的第一张图像的风格。你最困难的任务是从每组中挑选你最喜欢的!

最终目标

这一切的结果是什么?一个增强你文字的视觉叙事。你的读者不仅会被你的故事所吸引;你的美学造诣将视觉上震撼他们*。

(*不保证。)

以下是我的最终四张图片。为了唤起你的记忆,以下是ChatGPT从我的原始文章中为每张图片选择的代表(从左到右,从上到下):

  1. 内心的恶魔:这可以被可视化为一种二元表现,也许是一个具有分裂外观的图形,展示了天使和恶魔的两面。
  2. 与邪恶共舞:这可以被描绘为一个阴影中的舞者,周围环绕着恶作剧或混乱的元素。
  3. 路西法效应:鉴于这个名字,描绘一个从天使变为堕落者的转变可以是一个恰当的表现。
  4. 善恶之间的界限:这可以被可视化为一条钢丝或平衡木,一边通向黑暗,另一边通向光明,也许有一个图形在考虑向哪边倾斜。

上海赋迪网络科技

电话:18116340052