本文共 292 字,大约阅读时间需要 1 分钟。
文本引导的变分图像生成用于工业异常检测与分割
Mingyu Lee, Jongwon Choi
论文创新点
本文提出了一种基于文本信息的变分图像生成方法,旨在通过学习目标对象的文本信息,从大规模文本库中生成高质量的无缺陷数据图像。为解决工业图像数据中缺陷数据缺乏多样性的问题,本文开发了一种关键词到提示生成器,该生成器能够根据输入图像与文本信息的对比,自动生成最优提示词。
此外,本文提出了一个基于方差感知的图像生成器,该生成器扩展了传统的VQGAN模型,能够更好地捕捉目标对象的多样性特征,从而生成具有较高质量的无缺陷数据图像。这些技术的结合为工业异常检测和分割提供了新的解决方案。
转载地址:http://mtrfk.baihongyu.com/