快手开源图像生成模型可图Kolors 支持在画面中生成文字

快手放了个大招，开源了自家的图像生成模型——"可图 Kolors"。这可不是一个普通的模型，它在数十亿的文本图像对上进行了训练，搭载了通用语言模型（GLM）作为文本编码器，支持中英文双语提示词，还能处理长达256个token的上下文。

可图 Kolors 特色一览:

中英双语支持:采用通用语言模型（GLM）作为文本编码器，让模型不仅精通英文，也能完美理解并运用中文提示词。
长文本处理能力:支持长达256个token的上下文长度，让创作者能够细致描绘心中所想，无论是复杂场景还是丰富故事。
海量数据训练:在数十亿个文本图像对上进行训练，模型拥有庞大的知识库，能够生成多样化且精准的图像。
中国文化元素优化:特别针对中国的文化元素进行了优化处理，使得生成的图像更贴近中国文化特色，满足本土化需求。
中文文字生成:"可图 Kolors"不仅能理解中文，还能在生成的图片中嵌入中文文字，为图像增添更多表达力。

测试一下，发现，目前可图在图片中插入中文表现会更好，基本都可以正确输出，但英文的话，容易少字或错字。

快手开源图像生成模型可图Kolors 支持在画面中生成文字

可以看到，上面生成的躺平小猫，中文完全没问题，但我换成“AIbase”就会有缺字漏字的情况。就输出中文而言，可图表现可圈可点，不过注意，文字不能太长，太长的话，容易出错。

这个模型不仅仅是一个简单的工具，它背后有快手强大的技术支撑。它在海量数据上训练，对中国文化元素有特别优化，生成的图像更有中国味。这不仅仅是技术上的突破，更是文化上的传承。

开源计划还包括了CN（ControlNet）支持、LoRa(低秩适应)、IPA(图像提示适应)和ComfyUI直接支持，这些都是为了让你的创作过程更加流畅和个性化。

技术细节:

"可图 Kolors"基于SDXL模型架构，并融合了ChatGLM256技术，以增强双语理解和文字生成能力。
值得注意的是，运行此模型需要较大的显存，大约19GB，这可能对硬件设备有一定要求。

快手这次开源"可图 Kolors"，不仅是对技术社区的贡献，更是对创作自由的一次大胆推动。这表明了快手在AI技术上的决心和实力，也让我们看到了AI在艺术创作上的无限可能。

可图官网:https://top.aibase.com/tool/kuaishouketudamoxingkolors

项目地址:https://www.1ai.net/12103.html

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

快手开源图像生成模型可图Kolors 支持在画面中生成文字

月之暗面推出 Kimi 浏览器插件支持点问笔、总结器等功能

Meta AI为移动设备开发紧凑型语言模型MobileLLM，仅3.5亿参数

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

月之暗面推出 Kimi 浏览器插件 支持点问笔、总结器等功能

Meta AI为移动设备开发紧凑型语言模型MobileLLM，仅3.5亿参数

快手文生图大模型“可图”宣布开源，现已上线微信小程序和网页版

快手上线自研文生图大模型“可图”，消息称参数规模达十亿级

快手可图大模型KOLORS的使用方法，实测快手AI产品可图KOLORS功能

全球最大甲骨文“数据集”开源

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

月之暗面推出 Kimi 浏览器插件支持点问笔、总结器等功能