全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

今天分享的是一个非常有趣的AI工具：OmniGen

一、OmniGen是什么

OmniGen是一种“统一图像生成模型”，无需安装ControlNet、IP-Adapter、Reference-Net等插件，就能根据文本提示，自动识别输入图像中的特征（如：某个对象、姿势、映射）。

有什么用呢？

比如下面这两幅图，如果想把里面的人物放在同一个背景中，过去比较麻烦，而现在只需一行指令。

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

哒哒！

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

上面使用的提示词：
The little girl and the man were standing in the street. the girl is left in<img><|image_1|></img>the man is middle in <img><|image_2|></img>.

还有其它用法，比如想让下方左图的红衣女孩，穿上下方右图的白色连衣裙：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

提示词：
a girl wear a white dress. the girl is left in<img><|image_1|></img>the white dress is in<img><|image_1|></img>.

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

二、OmniGen的应用场景介绍

官方公示的场景有很多，这是一张女孩的图像，通过文本提示改变她的姿势（比心）：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

图中有两个人，选择右边的人，改变他的衣服、动作、场景：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

从两张图里分别提取两个人，让她们在房间里数钱：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

即使图中人物多于两个，也可以通过提示词来让AI识别，比如左边“中间的男人”、右边“年龄最大的女人”，他俩在马路上聊天：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

生成的新图像会保留人物的基本可识别特征：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

将一束花放在指定颜色的花瓶中并摆放在玻璃桌面：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

移除女孩的耳环，同时用可乐换掉背景中的杯子：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

提取图像中人物的动作框架（通常需要ControlNet插件才能完成）：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

也可以根据动作框架来直接生成新的图像：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

三、OmniGen本地部署

方法并不复杂。首先确保网络“畅通”并已安装Python、Git等基本工具。

进入命令窗口，依次执行以下命令（以N卡为例）：

conda create -n omnigen python=3.10

conda activate omnigen

conda install pytorch=2.3.1 torchvision=0.18.1 torchaudio=2.3.1 pytorch-cuda=11.8 -c pytorch -c nvidia

git clone https://github.com/staoxiao/OmniGen.git

cd OmniGen

pip install -e .

pip install gradio spaces

python app.py

为避免每次使用都要激活环境，可建立一个批处理文件，内容如下：

@echo off
call conda activate omnigen
python app.py
pause

首次运行，会自动下载所需的模型，需要超过15GB的硬盘空间：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

四、使用方法

提示词基本按照日常语法，唯一要注意的是指定的图像，需按照这个格式：<|image_1|>，其中的“i”是1到3的数字。

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

最后再测试一下名人的图像结合，让黑寡妇和马大师合影：

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

五、结论

1、OmniGen可识别图像中人物的性别、年龄、位置、服饰（颜色）等，使提示词得以更接近日常语言。

2、对于需要在同一图像中出现两个特定角色的应用场景，OmniGen能派上用场。

3、OmniGen目前生成效果仍不完美，但无需额外插件的多合一处理方式，符合未来AIGC的发展趋势。

4、OmniGen生成一幅图耗时较长（4090大约1分半，4060需要4到5分钟），效率有待优化。

文章涉及的网址：

OmniGen的代码页面：
https://github.com/VectorSpaceLab/OmniGen

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

全新图像一致性生成模型OmniGen测试及部署，保持人物或者物体一致性操作

一句话快速生成带中文的海报图，用即梦AI教你做AI中文海报

一键制作“AI数字人口播视频”，快速打造你的免费定制数字人分身

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

一句话快速生成带中文的海报图，用即梦AI教你做AI中文海报

一键制作“AI数字人口播视频”，快速打造你的免费定制数字人分身

统一图像生成模型OmniGen，支持文生图、图像编辑、还能姿态检测

ChatGPT中的代码解释器是什么？

ChatGPT 86个插件全解读：让你的学习、工作、生活效率翻倍

11款最佳AI文案工具推荐，满足多种创作需求的智能助手

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注