奥本 AI 将所有的最新 AI 聚合到了一起,为您开启多模型 AI 绘画新时代!

扫码即刻关注公众号

FLUX.1:人工智能图像生成的未来,现已向所有人开放


6 个月前

FLUX.1:现在所有人都可以接触到的AI图像生成的未来

黑森林实验室推出了FLUX.1,这是一款先进的AI图像生成扩散模型,提供卓越的速度、质量和即时响应。FLUX.1有三个版本——Schnell、Dev和Pro——利用诸如Rectified Flow Transformers等创新技术,生成高度逼真的图像。FLUX.1能够生成文本并处理细节,如手指和脚趾——一个优秀的图像生成器所需的一切。此外,其开源特性促进了社区参与和创新。本文探讨了各种在线免费访问FLUX.1并在Google Colab上运行它的方法。FLUX.1的推出挑战了像MidJourney这样的老牌玩家,并在AI图像生成领域树立了新的标准,有望对创意和数字内容产业产生重大影响。

(<

https://blackforestlabs.ai/>)FLUX.1 的主要特点

1. 速度和效率

FLUX.1 旨在快速生成图像,超越了像 Midjourney、Colors 和 Aura 这样的竞争对手。该模型有三个版本: * FLUX.1[快速] : Flux快速生成图像的速度大约是专业模型的10倍,尽管质量较低。 * FLUX.1[开发]: Flux Dev 是为开发者量身定制的,支持像图像到图像生成这样的高级功能。 * FLUX.1[Pro]: Flux Pro,拥有120亿参数的最强大的变体,是闭源的,并且可以通过API获得。 2. 提示的遵循性和质量

Flux.1的一个显著特点是其出色的提示遵循性。无论是使用简单还是复杂的提示,该模型始终如一地提供高质量的图像,这些图像与输入描述非常接近。例如,一个简单的提示,如“一只猫看着相机,鱼眼镜头视角”,产生的结果与Midjourney V6相当。更复杂的提示可以以惊人的准确性指导场景中物体的位置和细节。

由FLUX.1 Shenell模型生成的一张图片,描述为“一只猫正对着鱼眼镜头看,视角为鱼眼镜头”。 性能和能力

在基准测试中,FLUX.1 在各种指标上都展现出了优于竞争对手的性能。它在视觉质量、响应速度和输出多样性方面表现出色,支持从0.1到2.0百万像素的多种宽高比和分辨率。这种灵活性使其适用于从艺术创作到商业项目的各种应用。

FLUX.1 的架构融合了先进的技术,如修正流变换器、并行注意力层和旋转位置嵌入,这些技术共同为其高效率和卓越的输出质量做出了贡献。这种模型架构使得 Flux 能够生成不仅照片般逼真,而且细节丰富、解剖学上准确的图像。 实际例子

为了展示FLUX.1的能力,请考虑以下示例: 1. 简单提示:

  • 输入:一个侧面写着“FLUX.1”的咖啡杯
  • 输出:一张高质量的咖啡杯图片,上面清晰可见“FLUX.1”的文字,展示了FLUX.1生成文本的能力。

2. 复杂提示:

  • 输入:"一个夜晚的未来城市景观,霓虹灯照亮的摩天大楼,飞行汽车,以及全息广告牌宣传星际旅行。在前景中,一群穿着未来服饰的人沿着透明的行人天桥行走。"
  • 输出:一个复杂且精确反映详细提示的图像。

通过在线平台访问Flux Point1

FLUX.1的一个显著特点是它的开源特性,特别是开发版和快速版,这些版本可以在像Hugging Face这样的平台上下载。这种开放性促进了社区的参与和创新,为人工智能图像生成领域的进一步发展提供了坚实的基础。 FLUX.1 图像生成器真的很棒。我强烈推荐这个产品:

https://flux-ai.io

提供文本到图像生成器和Flux AI图像提示。只需点击免费试用:

https://flux-ai.io

此外,许多平台已经集成了FLUX模型或提供FLUX.1图像生成服务。以下是其中的一些: 1. 复制

Replicate 是一个用户友好的平台,允许用户在云端运行机器学习模型。Flux Point1 可以在 Replicate 上免费访问和测试。 * 网站

https://replicate.com/black-forest-labs/flux-dev

  • 输入:带有可定制设置的文本提示,例如长宽比、图片数量、种子等。
  • 输出质量:可调至100以获得最佳结果。
  • 过程:输入文本提示,自定义设置,点击“运行”,然后等待生成的图像。

2. 坡

  • 访问Poe网站(<

https://poe.com/>)并选择FLUX模型:

3. Seaart.ai

Searart.ai 是一个由各种扩散模型驱动的 AI 平台,包括最近新增的 FLUX.1 模型。这个平台允许用户轻松且免费生成高质量的图像。Searart.ai 每天提供大约 150 个积分,每个图像生成任务大约消耗一个积分,具体取决于长宽比。图像到图像的任务可能需要稍微多一些积分。 * 网站: <

https://www.seaart.ai/>* 选择 Swift AI 选项,然后点击“Flux 文字转图像”。 * 输入您的文本提示,选择所需的长宽比,选择随机或自定义种子,并启动生成过程。

  • Seaart.ai 也支持使用 FLUX.1 进行图像到图像的生成。选择 AI 选项,然后点击“Flux 图像到图像”。 4. 拥抱脸

Hugging Face 提供了基于 FLUX.1 的 Schnell 模型的试用版本。该平台提供了一种方便的方式来测试模型,并可以调整设置。 * 网站

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

  • 输入:带有可选高级设置的文本提示,用于定制。
  • 流程:输入文本提示,如有需要可展开高级设置,点击“运行”以生成图像。 5. 法尔人工智能

Fal.ai 是另一个可以访问 FLUX.1 的平台。这个过程与其他平台类似,使得使用文本提示生成图像变得容易。 * 网站

https://fal.ai/models/fal-ai/flux/dev/playground

  • 输入:带有基本设置的文本提示。
  • 流程:输入文本提示,点击“运行”以创建图像。
  • 显著表现:FLUX.1 在处理复杂主题,如手部方面,表现出令人印象深刻的能力。 6. Toast AI

Toast AI 是一个免费且开源的平台,它托管了最新的人工智能论文和模型,包括 FLUX.1。FLUx.1 开发模型可以用来生成各种风格的图像,包括动漫风格。 * 网站: <

https://tost.ai/> 输入:带有模型选择的文本提示。 * 流程:选择FLUX.1开发模型,输入文本提示,然后生成图像。 * 性能*:在生成动漫风格的图像方面表现出色。 7. API 访问权限

对于更高级或商业用途,您可以直接通过Black Forest Labs提供的API访问FLUX.1 [pro]。 在 Google Colab 上运行 Flux 模型

如前所述,FLUX.1 是开源的,这使得用户可以自由地进行实验和进一步开发。让我们展示如何在 Google Colab 上访问模型并运行它: 1. **前往

Google Colab

2. 创建一个新的笔记本:点击“文件” --> “新建笔记本”。 3. 将运行时更改为A100 GPU:FLUX.1需要32GB的GPU RAM才能运行,因此请确保您选择了A100 GPU运行时。 4. 复制并粘贴代码**:复制所提供的代码,并将其粘贴到笔记本中的一个单元格内。 ```

install the packages

!pip install git+https://github.com/huggingface/diffusers.git !pip install transformers sentencepiece accelerate protobuf ```

``` import torch from diffusers import FluxPipeline import diffusers from PIL import Image import matplotlib.pyplot as plt

Modify the rope function to handle CUDA device

_flux_rope = diffusers.models.transformers.transformer_flux.rope def new_flux_rope(pos: torch.Tensor, dim: int, theta: int) -> torch.Tensor: assert dim % 2 == 0, "The dimension must be even." if pos.device.type == "cuda": # Move tensor to CPU for ROPE computation, then move it back to CUDA return _flux_rope(pos.to("cpu"), dim, theta).to(device=pos.device) else: # Perform ROPE computation directly if tensor is not on CUDA return _flux_rope(pos, dim, theta) diffusers.models.transformers.transformer_flux.rope = new_flux_rope

Load the Flux Schnell model

pipe = FluxPipeline.from_pretrained( "black-forest-labs/FLUX.1-schnell", revision='refs/pr/1', torch_dtype=torch.bfloat16 ).to("cuda")

Define the prompt

This is the textual description that the model will use to generate the image

prompt = "A modern, minimalist house with large windows and a flat roof."

Generate the image

out = pipe( prompt=prompt, guidance_scale=0., height=1024, width=1024, num_inference_steps=4, max_sequence_length=256, ).images[0]

Save the generated image

out.save("gen_image.png")

Display the generated image

image = Image.open("gen_image.png") plt.imshow(image) plt.axis('off') # Hide axes plt.show() ```

  • 运行单元格:点击播放按钮或按 Shift + Enter 来运行单元格。

对未来的影响和结论

Black Forest Labs推出的FLUX.1标志着AI驱动图像生成领域的一个重要里程碑,提供了一个强大且易于访问的模型,挑战了像MidJourney这样的老牌玩家。通过结合高性能、易用性和社区驱动的开发,FLUX.1将显著影响创作者和专业人士的AI工具格局。 随着多个平台提供免费访问,用户可以在没有高级硬件或复杂设置的情况下生成高质量的图像。随着越来越多的平台采用Flux Point1,它对AI艺术社区的影响将会增长。此外,Black Forest Labs计划开发文本到视频的模型,这可能会彻底改变创意和数字内容产业。 总之,FLUX.1在人工智能图像生成方面树立了新的标准,挑战了既有的竞争者。它的易用性和开源优势使其成为一个强大的工具。随着未来文本到视频模型的计划,Black Forest Labs准备改变创意和数字内容产业,使人工智能驱动的内容创作未来更加充满希望。

推荐阅读:

上海赋迪网络科技

电话:18116340052