最新消息,SD3的首批邀请测试资格已经发放,模型权重预计会在下个月发布。官方称会逐步扩大规模,很快将会发放更多测试资格。
此前,Stability AI发布SD3技术报告,披露了SD3更多细节。SD3在排版质量、美学质量和提示词理解方面超越目前所有开源和商业模型。
报告介绍了SD3的新多模态扩散Transformer架构MMDiT,改善了系统对文本的理解和拼写能力。
SD3采用矫正流RF公式,在训练中连接数据和噪声,实现更直接的推理路径和更高效的采样步骤。
另外,报告还介绍了扩展的矫正流Transformer模型,通过重新加权的RF公式和MMDiT主干网络训练不同规模的模型。