与 Midjourney 开战,Stable Diffusion XL 0

35小吃技术网 推荐阅读 2023年10月05日13时05分54秒 151 0

与中国开战,XL 0.9发布,35亿+66亿双模,AI图像生成突飞猛进

2023/6/25 17:21:06 主编:孟泽

尽管此前这位CEO曾卷入各种争议,但依然不影响AI登上时代杂志。 近日,该公司发布XL 0.9版本,35亿+66亿双模,搭载最大,使得AI图像生成质量实现新的飞跃。

再次双倍升级!

近日,AI发布了XL 0.9最新版本(SDXL 0.9)。

与之前的机型相比,这波更新在图像和构图细节上都有了质的飞跃。

尤其是在网参数方面,这次SDXL0.9拥有35亿参数基础模型和66亿参数模型的集成管线。 相比之下,测试版仅使用单个 31 亿参数模型。

为了生成具有更大深度和更高分辨率的更真实图像 (),SDXL 0.9 使用两个 CLIP 模型,包括迄今为止最大的模型 (ViT-G/14)。

不仅如此,SDXL 0.9 还可以在消费类显卡上运行。 您所需要的只是 Win10/11 或 Linux 操作系统、16GB 内存以及显存超过 8GB 的​​ RTX 20 系列显卡。

SDXL 0.9 与 SDXL Beta 有什么不同?

我们看图说话吧。

实测效果

我们来看看新版本的SDXL 0.9,画面细节有什么不同~

: 外星人在拉斯维加斯漫游

SDXL 测试版

与 Midjourney 开战,Stable Diffusion XL 0-第1张图片

特大号0.9

:优胜美地国家公园的一只狼

:3D渲染,光泽,塑料,模糊,颗粒状,低分辨率,动漫,过饱和

SDXL 测试版

特大号0.9

: 手里拿着咖啡

:3D渲染,光泽,塑料,模糊,颗粒状,低分辨率,动漫

SDXL 测试版

特大号0.9

官方称SDXL系列还将提供基本文本之外的一系列功能。

其中包括图像到图像(输入图像以获得对该图像的更改)、修复(重建图像的缺失部分)和修复(构建现有图像的无缝扩展)。

SDXL 0.9 在两个 CLIP 模型上运行,包括迄今为止训练的最大模型之一 (ViT-G/14),它增强了 0.9 的处理能力以及创建具有更大深度和更高分辨率能力的逼真图像的能力。

SDXL 团队很快将发布研究博客,其中包含有关该模型的规范和测试的更多详细信息。

荣获《时代》最具影响力企业

就在不久前,AI被《时代》杂志评选为最具影响力的100家公司之一。

对于AI,时代杂志是这样介绍的——

如果你能用文字描述它,人工智能可以把它变成图片。

是该公司帮助培训的免费开源文本到图像生成器,当它于 8 月份推出时,它改变了世界对人工智能潜力的理解。

然而,人工智能很快就卷入了关于工具如何训练的争议以及从互联网获得的数网据的版权诉讼。

尽管如此,该公司表示,在推出 2.0 后的一个月内,App Store 排名前 10 的应用程序中有 4 个应用程序支持该模型。

据报道,该公司首席执行官埃马德经常夸大公司业绩。 他此前曾声称人工智能“真正开源”为“突破”铺平了道路。

SDXL 测试版

事实上,SDXL的Beta版本已经发布很久了。 看得出来,图版的迭代确实是日新月异。

当时声明XL并不是最终版本的名称,也不是v3,因为SD-XL的架构与SD-v2系列的模型架构非常相似。

以下是官方发布的SD-XL的一些样张,可以看出图像质量已经非常不错了。

与 Midjourney 开战,Stable Diffusion XL 0-第2张图片

SD-XL较之前版本的改进如下:

清晰的文字

在 v1 系列和 v2.1 型号中,不提供在图像中生成可读文本的功能。

虽然 SD-XL 生成的文本信息并不总是网准确的,但它确实获得了巨大的提升。

一位年轻女子举着一块写着“ ”的牌子,突出了头发,坐在餐厅外,棕色的眼睛,穿着裙子,侧光更好的解剖结构

生成人体解剖学一直存在许多问题,其中腿较多、手臂较少的问题非常常见。

例如,SD-v1.5 生成瑜伽图像,通常带有扭曲的人体。

SD-XL虽然生成的图像并不完美,但在人体姿势方面取得了显着的进步。

更美观(更多)

例如,对于相同的房屋主题,SD-XL 可以生成更加对称、视觉效果更好的照片。

SD-XL 在人像照片方面也有显着的改进。

一个女人的照片

参考: