5-14 Seg语义分割

前言：

上一节我们主要介绍ControlNet中的图像细节修复和高清放大Tile能力

这一节主要介绍ControlNet中的Seg语义分割。我们之前有学习过有点同名的 4-13 抠图分块神器 Segment Anything 。

在实现的目的上面是类似的，就是针对场景进行各种算法基础下的语义分割和识别能力。主要是基于ControlNet的框架机制下，可以混合做更多的事情。

但工具永远只是工具，就看你具体要怎么使用了。

知识点：

通过语义分割控制稳定扩散。

模型文件：control_v11p_sd15_seg.pth

配置文件：control_v11p_sd15_seg.yaml

训练数据：COCO + ADE20K。

可接受的预处理器：Seg_OFADE20K (Oneformer ADE20K)、Seg_OFCOCO (Oneformer COCO)、Seg_UFADE20K (Uniformer ADE20K) 或手动创建的掩模。

现在该模型可以接收 ADE20K 或 COCO 注释两种类型。我们发现识别分段协议对于 ControlNet 编码器来说是微不足道的，并且训练多个分段协议的模型可以带来更好的性能。

实战

设计中的语义分割图，根据色块生成不同的物体，识别物体对应色块进行画面的区分，然后根据关键词的描述生成该物体在图片中的样子。

很粗狂的使用效果。一种色块一种颜色区域的最终效果展示。

总体上，从分割后的预览效果图上可以看到，seg将房屋作为一个整体分割了出来，也就是说后续新生成的图像仅会保持结构一致，但细节将会发生很大的改变。

RA/SD 衍生者AI训练营。发布者：稻草人，转载请注明出处：https://www.shxcj.com/archives/1443