目前AI生成图像最知名的工具就是Midjourney和Stable Diffusion,但它们的优缺点比较鲜明,Midjourney一个月30美元,比较贵;而Stable Diffusion比较吃配置,且操作较为复杂。
今天我们分享一个开源项目,它效果很好且大幅降低了AI成图的门槛,它就是:Fooocus
Fooocus是什么
Fooocus 是一款基于 Gradio 的图像生成软件,它重新思考了 Stable Diffusion 和 Midjourney 的设计,旨在提供高质量的文本到图像的转换,同时简化用户的操作流程。
Fooocus 学习了 Stable Diffusion 的离线、开源和免费的特点,以及 Midjourney 不需要用户进行参数调整的优势。
Fooocus 集成并自动化了许多内部优化和质量改进,让用户可以忘记所有复杂的技术参数,专注于提示和图像之间的交互,以探索新的思维方式并扩展人类物种的想象力。最重要的是免费且不吃配置,只需要4G显存即可使用,比SD要求要低很多!
下面是在一台具有16GB 系统 RAM和6GB VRAM的相对低端笔记本电脑(Nvidia 3060 笔记本电脑)上进行的测试。这台机器上的速度约为每次迭代 1.35 秒。相当令人印象深刻——如今配备 3060 的笔记本电脑通常价格非常可接受。
对比 Midjourney
Fooocus虽然简化了操作,但是也并没有减少功能,以下是和Midjourney功能对比的详细信息。
Midjourney |
Fooocus |
高质量的文本到图像,无需大量即时工程或参数调整。 |
高质量的文本到图像,无需大量即时工程或参数调整。(Fooocus 拥有基于 GPT-2 的离线提示处理引擎和大量采样改进,因此无论您的提示短如“花园中的房子”还是长至 1000 个单词,结果总是很漂亮) |
V1 V2 V3 V4 |
输入图像 -> 高档或变化 -> 变化(微妙)/变化(强) |
U1 U2 U3 U4 |
输入图像 -> 放大或变化 -> 放大 (1.5x) / 放大 (2x) |
修复/上/下/左/右(平移) |
输入图像 -> Inpaint 或 Outpaint -> Inpaint / 上 / 下 / 左 / 右(Fooocus 使用自己的修复算法和修复模型,因此结果比所有其他使用标准SDXL 修复方法/模型的软件更令人满意) |
图片提示 |
输入图像 -> 图像提示(Fooocus 使用自己的图像提示算法,因此结果质量和提示理解比使用标准 SDXL 方法(如标准 IP 适配器或修订版)的所有其他软件更令人满意) |
--style |
Advanced -> Style |
--stylize |
Advanced -> Advanced -> Guidance |
—niji |
https://github.com/lllyasviel/Fooocus/discussions/679Fooocus支持Civitai上的SDXL型号(不知道的可以google搜索“Civitai”) |
- 质量 |
高级->质量 |
- 重复 |
高级 -> 图像编号 |
多重提示 (::) |
只需使用多行提示即可 |
Prompt重量 |
你可以使用“我是(快乐:1.5)”。Fooocus使用A1111的重新加权算法,因此如果用户直接从Civitai复制提示,结果会比ComfyUI更好。(因为如果提示是用ComfyUI的重新加权编写的,用户不太可能复制提示文本,因为他们更喜欢拖动文件)要使用嵌入,可以使用“(embedding:file_name:1.1)” |
- no |
高级 -> 否定提示 |
--ar |
高级 -> 宽高比 |
洞察面 |
输入图像->图像提示->高级->FaceSwap |
描述 |
输入图像 -> 描述 |
安装 Fooocus
Windows
- 首先在GitHub的下载链接可以直接下载Fooocus:https://github.com/lllyasviel/Fooocus/releases/
- 下载文件后,请将其解压缩,然后运行“run.bat”。
- 首次运行,会自动下载模型文件,需要等待一段时间。(如果你已有模型文件,可以将它们复制到以下路径,启动就会更快捷些:.\Fooocus\models\checkpoints\)
Linux
- 克隆Fooocus的GitHub仓库,切换到Fooocus目录并创建一个新的conda环境:
gitclone <https://github.com/lllyasviel/Fooocus.git>
cdFooocus
condaenv create -f environment.yaml
- 激活新创建的conda环境并安装所需的Python包:
condaactivate fooocus
pipinstall -r requirements_versions.txt
- 运行以下命令以启动Fooocus:
pythonentry_with_update.py
以下是一个安装的最低资源需求,大家可以对照自己的平台来确认一下。
使用 Fooocus
下载完成后,就会自动打开绘图界面了。默认模式是简洁模式,只有一个输入框、生成图片区域和生成按钮。它的基础界面非常简单,勾选“Advanced”会弹出高级设置的窗口,可以调整画面宽高比、风格、图像数量、种子值、反向提示词、模型、lora权重比值、图像锐利程度等。
直接在文本框内输入提示词,然后点击“Generate”按钮就可以生成图像了。勾选“Advanced”可以进行更多高级设置。生成好的图像会自动保存在根目录的 outputs 文件夹内。
Fooocus 根目录的 models 文件夹内很多内容和 SD WebUI 都是相似的,用于放置 checkpoints、lora、Vae等各种模型。如果你有下载其他基于 SDXL1.0 训练的风格化大模型或者 lora 模型,同样可以放进对应的文件夹,然后在 Fooocus 中使用。
再来看下和DALL-E3、Midjourney的对比例子:
Prompt:beautiful landscape with a lake in the foreground, with a dock, and mountainsin the background, in the early morning with sunrise and mist on the lake.
Fooocus
DALL-E 3
Midjourney
项目特点
- 离线和开源:Fooocus 是完全离线运行的,用户无需联网即可使用,同时也保证了软件的开源性。
- 简化安装和使用:Fooocus 简化了安装过程,从下载到生成第一张图片,鼠标点击次数严格限制在3次以内。最小GPU内存需求为4GB(Nvidia)。
- 自动化优化:Fooocus 自动化了许多内部优化,包括采样改进等,确保结果始终美观,无论用户的提示是简短还是详细。
- 易于使用:Fooocus 设计了易于使用的界面和提示系统,用户无需进行繁琐的参数调整,只需关注提示和生成的图像。
总结
总体来说,Fooocus 是一个强大的图像生成工具,生成图片的质量很高,细节非常好,完全不输给Midjourney,并且它简化了操作,为用户提供了一个既易于使用又功能强大的平台。
无论是艺术家、设计师还是普通用户,都可以利用 Fooocus 来创造令人惊叹的视觉作品。