1. 常见的 Base Models(基础模型)

最常见

关于 AI 绘图的 Base Model,常见的几种确实有 Pony SD 1.5、SDXL 1.0 和 Illustrious。下面是它们的一些特性简介:

  1. Pony SD 1.5
    这是一个基于 Stable Diffusion 构建的模型,主要用于生成卡通风格的图像,特别是针对“Pony”类型的作品,像是马赛克风格或者拟人化的动物角色。它优化了颜色的鲜艳度和细节,使得生成的图像在卡通类作品中更加生动和富有表现力。

  2. SDXL 1.0
    这是 Stable Diffusion 的扩展版本,改进了图像的分辨率和细节捕捉能力,尤其在高分辨率图像生成中表现出色。SDXL 1.0 在设计时考虑到了多样化的生成目标,包括人物、风景以及复杂的物体等,因此它能够生成更为复杂和精细的图像。它适用于需要高质量、细节丰富的绘图工作,广泛用于商业插图和艺术创作。

  3. Illustrious
    这是一个风格化的模型,特别适用于插画和艺术风格的生成。Illustrious 的特色是它能够创造出类似于传统手绘插画的效果,同时保留现代 AI 生成的细腻感。它往往能够在保持艺术性和创意的同时,确保图像具备一定的精细度,适合用来制作人物插画、场景画等。

这些模型的选择通常取决于你的绘图需求,比如你需要的是卡通风格、逼真插画还是高分辨率的图像等。你有特别喜欢哪一款,或者打算用来做某个项目吗?

其他

Stable Diffusion v1 系列

  • Stable Diffusion 1.41.5
    • 特点:这是最广泛使用的基础模型,适用于大多数绘图任务,生成风格丰富、内容多样的图像。
    • 用途:适合生成一般风格的图片,包括人物、风景、艺术插画等。
    • 适用 LoRA:可以加载多种 LoRA,用于微调人物风格、服饰、背景等。

Stable Diffusion v2 系列

  • Stable Diffusion 2.02.12.1-768
    • 特点:相比 v1,v2 在 生成细节分辨率 上有显著提升,生成效果更加自然。
    • 用途:更适合高分辨率图像、较复杂的场景、细节丰富的画面。
    • 适用 LoRA:同样支持 LoRA 微调,但 LoRA 与 v2 系列的兼容性 可能需要额外调整(特别是对于某些风格化的 LoRA,可能需要基于 v2 训练)。

Anything Model

  • Anything V3Anything V4
    • 特点:这些模型通常专注于 二次元风格,特别是适用于生成 动漫风格的角色 和场景。
    • 用途:专门为 二次元插画动漫风格 的图像生成优化。
    • 适用 LoRA:非常适合与 LoRA 配合使用,特别是当你想为特定 动漫角色或风格 微调时。

Anime Models Such as Waifu Diffusion

  • Waifu Diffusion
    • 特点:这是专门为生成 二次元人物卡通风格 图像优化的模型,能够更好地捕捉到 动漫风格的特征
    • 用途:适合动漫角色创作,尤其是 人物肖像卡通风格插画
    • 适用 LoRA:对于 二次元角色定制 非常合适,可以用 LoRA 来微调角色特征、服装或动作。

Dreamlike Diffusion

  • Dreamlike Diffusion
    • 特点:该模型专注于 梦幻、幻想风格的图像,生成效果非常适合表现幻想场景、奇幻风景。
    • 用途:适合生成 梦境场景、幻想世界、抽象艺术
    • 适用 LoRA:可与 LoRA 配合使用,特别是当涉及到 风景、幻想生物、奇幻背景 时。

Other Specialized Models

  • Midnight, Cinematic 等:

    • 特点:针对特定风格或效果优化,如 电影效果戏剧性光影超现实风格
    • 用途:这些模型适用于 电影场景、光影特效戏剧性风格 的图像生成。
    • 适用 LoRA:可以使用 LoRA 微调人物、环境和特效,但需要根据特定风格进行调整。
  • Realistic Vision: 这个模型侧重于生成逼真的照片级图像,尤其是人物肖像和现实风景。它适合用于创作需要高度现实感和细节的作品,比如人像、建筑和自然景观。

  • ChilloutMix:这个模型优化了风景和日常生活场景的生成,具有柔和的色调和视觉效果,适合用来创作温馨、轻松的画面,比如自然景色和室内场景。


2. 不同 Base Model 的 LoRA 混用

LoRA 模型通常是 微调某个基础模型,因此不同 Base Model 的 LoRA 是否能混用,取决于以下几个因素:

兼容性

  • 同一系列的 Base Model:如 Stable Diffusion v1 和 v1.5,LoRA 模型是兼容的,即它们之间的 LoRA 可以互换使用。

    • 例如,Stable Diffusion 1.4 的 LoRA 可以直接在 1.5 上应用,效果通常不受影响。
  • 同一版本的 LoRA:不同版本的 Base Model(如 Stable Diffusion 2.x 和 1.x 系列)有时在 训练数据和架构上 会有不同,因此 LoRA 从 v1 到 v2 或 从 2.x 到 1.x 的模型可能会出现 兼容性问题,需要针对 目标 Base Model 进行调整

    • 例如,Stable Diffusion 2.1 系列的 LoRA 可能会因为 模型架构变化(如通道数、模型细节)而不完全兼容 v1 系列,反之亦然。

解决方案

  • 调整 LoRA 权重:如果你想在不同版本的模型中使用 LoRA,通常可以在训练时通过 调整 LoRA 的权重训练参数 来改善效果。
  • 使用预训练的 LoRA 适配器:一些社区和开发者会提供 针对不同 Base Model 预训练的 LoRA 适配器,帮助你直接将 LoRA 从一个模型应用到另一个模型。

最佳实践

  • 在切换 Base Model 时,最好使用 针对目标模型的 LoRA,以确保效果的稳定性。
  • 在进行 LoRA 混合应用时,最好先尝试 低 CFG Scale 设置,以观察不同 LoRA 在新模型下的表现。

关于 Pony SD 1.5SDXL 1.0Illustrious 这些模型的 LoRA(Low-Rank Adaptation)的通用性,实际上,它们的 LoRA 模型通常不是完全通用的,虽然它们都基于 Stable Diffusion 系列,但每个模型有自己独特的风格和优化目标,因此在使用 LoRA 时会有一些兼容性问题。具体来说,LoRA 是一种训练方法,能让模型在已有的预训练基础上进行微调,优化其在特定领域或特定风格下的表现。

LoRA 的公用条件

  1. 基础模型的兼容性
    LoRA 通常只能在同一版本的基础模型上使用。例如,如果某个 LoRA 是为 Stable Diffusion 1.5 训练的,它可能不能直接应用于 SDXL 1.0,因为后者在架构和细节方面有较大改动。

  2. LoRA 的目标风格
    LoRA 针对不同风格或特定任务(如生成特定艺术风格、人物、环境等)进行微调。例如,Pony SD 1.5 针对的是卡通风格或类似马赛克风格的作品,而 Illustrious 更多是偏向艺术插画风格。如果 LoRA 是为某种风格微调的,它可能只适用于相同风格的模型。

  3. 模型的训练数据集
    每个模型的训练数据集是不同的,因此 LoRA 在基于不同数据集训练的模型之间不能直接通用。比如 SDXL 使用的训练数据集和 Stable Diffusion 1.5 的数据集不同,LoRA 的微调效果会因为训练数据集的差异而有所不同。

  4. 模型结构差异
    如果两个模型的架构差异较大(例如,SDXL 相较于 1.5 有一些较为显著的结构改动),那么它们的 LoRA 可能不能直接互用。LoRA 模型通常会在特定网络层进行微调,而网络结构的变化会影响这些调整是否有效。

如何提高 LoRA 通用性

  • 使用相同版本的模型:尽量确保 LoRA 是为与目标模型相同版本的基础模型训练的。
  • LoRA 的设计:一些 LoRA 设计时考虑到了多模型兼容性,尤其是在优化某些通用风格或特定任务时,可以尝试用不同的 LoRA 进行验证,看其兼容性如何。
  • 调整和训练:如果需要,可以尝试对 LoRA 进行二次训练,使其适配新的模型。例如,你可以基于 SDXLPony SD 1.5Illustrious 的 LoRA 进行微调。

总结

Pony SD 1.5、SDXL 1.0 和 Illustrious 的 LoRA 不能完全通用,主要取决于它们的基础模型是否相同。如果你想要一个 LoRA 能跨模型使用,最好选择一些经过优化并能够适应多个模型的 LoRA,或者需要针对每个模型分别调整 LoRA。

你打算用 LoRA 来优化哪种风格或任务?