奥本 AI 将所有的最新 AI 聚合到了一起,为您开启多模型 AI 绘画新时代!

扫码即刻关注公众号

我被聘为AI视觉设计师!!


6 个月前

我被聘为人工智能可视化师!

探索人工智能和品牌建设的前沿世界

客户工作简报 我作为自由职业AI视觉设计师获得第一份工作的时候,感觉就像是步入了创造力的未来。这不仅仅是另一个自由职业项目;这是一个将我对艺术的热情与人工智能的新兴世界结合的机会,特别是在品牌领域。然而,进入这个细分市场并不是一条直线的道路——这是一段持续学习、创造性实验和将技术与传统设计技能融合的旅程。 我是如何成为一名人工智能可视化师的,以及我从这次开创性的经历中学到了什么。 发现人工智能可视化器的作用

我的旅程始于对人工智能日益增长的迷恋。我一直对数字艺术很感兴趣,但当我首次遇到由AI生成的图像时,我被深深吸引。用几个精心制作的提示就能生成复杂、视觉上令人惊叹的艺术作品,这打开了新的可能性。我开始探索这些创作背后的工具——像Midjourney、Runway、Stable Diffusion等程序。我尝试得越多,就越意识到AI可以成为一个强大的创意伙伴。 当我深入研究时,我发现了人工智能视觉师这一新兴角色。这个职位不仅仅是使用人工智能来创造艺术;它还涉及到在技术和传统设计之间架起桥梁。我知道这是我可以结合我的创意技能和对人工智能技术的兴趣的空间。 然后,有一天,我被一家位于伦敦的品牌客户联系,他们正在寻找一位具有人工智能图像生成技能的自由职业艺术总监。他们特别有兴趣利用人工智能创造创新的视觉概念,以使他们的品牌脱颖而出。这个机会正是我一直在准备的,它验证了我追求人工智能视觉设计师道路的决定。很明显,品牌中对人工智能驱动的创造力的需求正在增长,我很高兴能站在这一新浪潮的前沿。 接下自由职业工作

凭借扎实的技能基础,我被一家品牌代理公司联系,我将其称为X代理,他们正在寻找一位擅长AI图像生成的自由职业艺术总监。这是一个令人兴奋的机会,因为AI视觉设计师的角色仍然相对较新,并不是每个客户都完全理解AI在创意项目中的潜力。然而,X代理在品牌创新方面处于AI的前沿,他们认识到将AI驱动的视觉整合到他们的活动中的价值。 当我最终获得了为裘德·贝灵汉姆(Jude Bellingham)的竞选活动创作视觉作品的项目时,我知道我必须留下深刻的印象。概念很明确:将贝灵汉姆描绘成伯明翰和马德里的象征,庆祝他从一个有前途的年轻球员成长为全球足球巨星的旅程。这个视觉作品将结合伯明翰公牛的力量和坚韧,以及马德里斗牛士传统的优雅和精确。

摘自简短的摘要 为了实现这一点,我使用了Midjourney来生成初始图像,这些图像结合了两个符号的元素——贝尔林厄姆身穿皇家马德里队服,手持斗牛士的披风,背景是伯明翰公牛。然而,尽管AI生成的图像令人印象深刻,但为了与活动的视觉保持一致,还需要进一步的细化。 早期迭代:

CR7是一个非常受欢迎的一代,因为Midjourney的模型是根据他的外貌进行训练的。

走错方向 构建必要的技能

要成为一名人工智能可视化师,我需要培养技术和创造力的结合。这个旅程中至关重要的一部分是掌握提示工程但什么是提示工程呢? 提示工程,用外行的话来说,就是制作正确的问题或指令来引导人工智能模型,特别是大型语言模型(LLMs),以产生期望的结果。可以将其视为编程,但更简单。在传统编程中,你需要知道一种特定的语言,如Java、JavaScript或Python来编写程序。在提示工程中,你需要的语言是英语(或模型支持的任何其他自然语言)。 你已经在日常生活中熟悉了这样的技术。像Siri、Google助手或Alexa这样的语音助手使用自然语言处理;你很可能已经使用英语或你的地区语言让它们播放歌曲或将物品添加到你的购物车中。实际上,特斯拉前AI主管Andrej Karpathy甚至将英语描述为最热门的新编程语言。 提示工程在过去几个月中已成为一项关键技能,因为它作为确保适当的人-人工智能交互的桥梁。由于最新的大型语言模型在理解上下文和细微差别方面显示出显著的改进,您的提示可以显著影响您从人工智能模型收到的响应质量。 在我的工作作为人工智能视觉化师中,掌握提示工程意味着学习如何以能够产生最准确和创造性满足结果的方式表达请求。例如,在进行项目工作时,视觉成果的成功往往取决于我能否很好地制定能够捕捉客户愿景的提示。 然而,我很快意识到,尽管人工智能工具非常先进,但通常需要“人类的触摸”才能达到预期的结果。例如,Midjourney 和 Face Swap 功能强大,但它们并不总是能够完全捕捉到我心中所想的愿景。有时,AI 生成的图像接近但并不完全准确——可能是构图有问题,或者面部表情缺乏预期的情感。 这在我最重要的项目之一中表现得尤为明显,我的任务是开发一个视觉概念来庆祝朱德·贝林厄姆可能获得的金球奖。这个活动需要象征性地将贝林厄姆在伯明翰的根源——由标志性的公牛代表——和他目前在马德里的成功联系起来,后者与斗牛士文化密切相关。 入门指南:项目体验

启动这个项目既令人兴奋又充满挑战。作为一名自由职业者,总有压力要迅速交付卓越的成果,尤其是在从事像AI生成艺术这样创新的项目时。我的首要任务是创造完美平衡伯明翰和马德里文化符号的视觉效果,客户对此有很高的期望。 早期的一个挑战是确保人工智能的输出与客户品牌身份和活动的情感共鸣保持一致。虽然Midjourney能够生成令人惊叹的视觉效果,但它并不总是能够捕捉到我们所需的确切叙事元素。我必须仔细调整提示,尝试不同的输入,并经常使用像Photoshop这样的工具手动细化图像——添加AI无法完全完善的细节,比如Bellingham脸上的正确表情或斗牛士披风的流动。

使用Alpha遮罩训练Midjourney生成特定姿势 这部分是当前Midjourney模型失败的地方。我们需要一个包含ControlNet的新版本,就像其他Stable Diffusion模型一样,这将有助于用户/客户设置镜头的艺术指导。

多次的站姿、姿势、斗篷(muleta)

多次尝试才得到朱迪的面部相似度。

我得到了我的姿势,但是面部相似度完全错了。

使用Photoshop进行编辑和微调 这个项目让我明白了灵活性和适应性的重要性。作为一名自由职业者,每个项目都是不同的,你必须迅速适应新工具、客户偏好和项目目标。 作为一名自由职业AI视觉设计师

作为一名自由职业的人工智能视觉设计师,我的每一天都不尽相同。每个项目都始于理解客户的视觉构想,并将之转化为一系列人工智能提示。这涉及到大量的实验,因为措辞的微小变化可能导致截然不同的结果。我的工作流程通常包括生成多个版本的图像,然后根据客户的反馈来优化最佳选项。

 

推荐阅读:

上海赋迪网络科技

电话:18116340052