【KJKX科技快讯】6月25日消息,稳定人工智能(Stability AI)近日正式发布了他们旗下的文字生成图片模型SDXL
0.9。这一版本在图像内容和构图细节方面经过了重大改进,并且可以在消费级GPU上高效运行。

据悉,SDXL
0.9在所有开源图像模型中具备最多的参数数量,其中包括一个基础模型和一个附加模型,分别拥有35亿参数和66亿参数。稳定人工智能团队采用了渐进式的工作过程,首先使用基础模型生成初步细节,然后通过附加模型对图像进行精细化处理。如果读者曾经使用过稳定扩散(Stable
Diffusion)技术,可能会对这种渐进式的工作过程感到熟悉。

稳定人工智能表示,SDXL
0.9采用了两个CLIP模型,其中包括了目前体积最大的OpenCLIP模型之一,名为vitg/14。借助这个模型,稳定扩散能够生成更深、分辨率更高的逼真图像。

据KJKX科技快讯了解,稳定人工智能团队计划在接下来发布一篇研究博客,详细介绍SDXL
0.9的模型规格和更多参数细节。预计该模型将于7月发布1.0正式版本,并在GitHub上开源。这将进一步推动人工智能技术的发展和应用。

稳定人工智能的SDXL
0.9文字生成图片模型的发布,标志着他们在图像生成领域取得了重要的进展。这一版本的改进将使用户能够更加轻松地创建逼真的图像,并为消费级GPU用户提供了更好的性能。随着SDXL
0.9的进一步发展和1.0版本的发布,我们可以期待更多创新和应用场景的出现,这将极大地推动图像生成技术的发展。

文章采集于互联网