创意素描或涂鸦是一种表达活动。在这种活动中,人们想象和描述日常视觉物体。创意素描图像的生成是一个具有挑战性的视觉问题,其任务是生成视觉世界物体从未见过的多样而真实的创意素描。在这里,我们提出了一个新颖的框架,从粗到细--DoodleFormer,它将创意草图生成问题分解为创建粗略草图,然后将细节纳入草图。我们引入了图形感知的变换器编码器,有效地捕捉了不同身体部位之间的整体动态和局部静态结构关系。为了保证创意草图的多样性,我们引入了一个概率粗略的草图解码器,它清楚地建模了每个草图身体部分的变化。我们在两个创意草图数据集中进行了实验:创意鸟和创意生物。基于人的评价,我们的定性、定量和评价,DoodleFormer这两个数据集的表现都优于最先进的技术,产生了现实多样的创意草图。在CreativeCreatures上,DoodleFormer在Fr`echetinception distance(FID)比最先进的方法获得25的绝对收益。我们也证明了DoodleFormer有效性应用于文本到创意草图生成和草图完成。
《DoodleFormer: Creative Sketch Drawing with Transformers》
论文地址:http://arxiv.org/abs/2112.03258v1
相关内容: