如何简单高效地定制自己的文本作画模型?|每日关注
强烈建议先阅读:一文弄懂 Diffusion Model
(相关资料图)
标题:Multi-Concept Customization of Text-to-Image Diffusion
作者:Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu.
原文链接:https://arxiv.org/pdf/2212.04488.pdf
代码链接:https://www.cs.cmu.edu/~custom-diffusion/
2. 引言最近通过文本生成图像的深度学习相关技术取得了非常大的进展,2021已经成为了图像生成的一个新的milestone,诸如DALL-E和Stable diffusion这种模型都取得了长足的进步,甚至达到了“出圈”的效果。通过简单文本prompts,用户能够生成前所未有的质量的图像。这样的模型可以生成各种各样的对象、风格和场景,并把它们进行组合排序,这让现有的图像生成模型看上去是无所不能的。
但是,尽管这些模型具有多样性和一些泛化能力,用户经常希望从他们自己的生活中合成特定的概念。例如,亲人、朋友、宠物或个人物品和地点,这些都是非常有意义的concept,也和个人对于生成图像的信息有对齐。由于这些概念天生就是个人的,因此在大规模的模型训练过程中很难出现。事后通过详细的文字,来描述这种概念是非常不方便的,也无法保留足够多的视觉细节来生成新的personal的concepts。这就需要模型具有一定的“定制”能力。也就是说如果给定少量用户提供的图像,我们能否用新概念(例如宠物狗或者“月亮门”,如图所示)增强现有的文本到图像扩散模型?经过微调的模型应该能够将它们与现有概念进行概括并生成新的变化。这带来了几个比较严峻的挑战:
首先,模型倾向于遗忘现有概念的含义:例如,在添加“moon gate”这一concept的时候,“moon”的含义就会丢失。其次,由于stable diffusion这样的网络往往参数会超级多,所以在小数据上训练模型,容易造成对训练样本进行过拟合,而且采样中变化也有限。此外,论文还关注了一个更具挑战性的问题,即组group fine-tuning,即能够超越单个个体concept的微调,并将多个概念组合在一起。学习多个新的concepts同时也是存在一定的挑战的,比如 concept mixing以及concept omission。在这项工作中,论文提出了一种fine-tuning技术,即文本到图像扩散模型的“定制扩散”。我们的方法在计算和内存方面都很有效。为了克服上述挑战,新方法固定一小部分模型权重,即文本到潜在特征的key值映射在cross-attention layer中。fine-tuning这些足以更新模型的新concepts。为了防止模型丧失原来强大的表征能力,新方法仅仅使用一小组的图像与目标图像类似的真实图像进行训练。我们还在微调期间引入data的augamation,这可以让模型更快的收敛,并获得更好的结果。论文提出的方法实验是构建在Stable Diffusion之上,并对各种数据集进行了实验,其中最少有四幅训练图像。对于添加单个concept,新提出的方法显示出比相似任务的作品和基线更好的文本对齐和视觉相似性。更重要的是,我们的方法可以有效地组成多个新concepts,而直接对不同的concepts进行组合的方法则遇到困难,经常会省略一个。最后,我们的方法只需要存储一小部分参数(模型权重的3%),消耗的GPU memory非常有限,同时也减少了fine-tuning的时间。
3. 方法总结来讲,论文提出的方法,就是仅更新权重的一小部分,即模型的交叉注意力层。此外,由于目标概念的训练样本很少,所以使用一个真实图像的正则化集,以防止过拟合。
对于Single-Concept Fine-tuning,给定一个预训练的text-to-image diffusion model,我们的目标是在模型中加入一个新的concept,只要给定四张图像和相应的文本描述进行训练。fine-tuning后的模型应保留其先验知识,允许根据文本提示使用新概念生成新的图像类型。这可能具有挑战性,因为更新的文本到图像的映射可能很容易过拟合少数可用图像。所以保证泛化性就非常有必要,也比较有挑战。所以就仅仅fine-tuning新的K和V,而对于query,则保持不变,这样就可以增加新概念的同时,保证模型的表征能力不受到太多的影响。优化目标还是diffusion的形式:
概括起来实际上非常简单,就是训练一个k和v的矩阵,来扩充维度,增加模型的表征能力,使其能生成更为丰富的图像内容。
而对于Multiple-Concept Compositional Fine-tuning,为了对多个概念进行微调,我们将每个概念的训练数据集合并,并使用我们的方法将它们联合训练。为了表示目标概念,我们使用不同的修饰符的
由于我们的方法仅更新与文本特征相对应的key和value投影矩阵,因此我们可以将它们合并,以允许使用多个微调概念生成。让集合
-
2023-01-01 07:51:12
如何简单高效地定制自己的文本作画模型?|每日关注<
强烈建议先阅读:一文弄懂DiffusionModel1 论文信息标题:Multi-ConceptCustomizationofText-to-Ima
-
2022-12-31 16:05:44
环球资讯:魏牌承诺新能源国补到期后不涨价,补贴差额由车企承担<
根据此前的新能源补贴政策,插电混合动力车型可以享受4800元 台的国家补贴。魏牌汽车后续上市的新车型或改款车型,官方指导价格将另行发布。在
-
2022-12-30 21:15:55
紫荆国际金融(08340.HK)委任长青(香港)为新核数师<
格隆汇12月30日丨紫荆国际金融(08340 HK)宣布,国富浩华已辞任公司核数师,自2022年12月30日起生效,原因为(i)国富浩华未能与公司就审核集团截至
-
2022-12-30 18:31:53
可看特殊频道!多线路!超爽无限制、无授权!|每日关注<
软件-网站-资源-技巧 "本公众号主要为大家分享全网黑科技软件、玩机技巧、网站福利、安卓+iOS+PC+盒子,通通具备,点击☝上方蓝字即可关注公众
-
2022-12-30 15:26:04
世界看热讯:助力餐饮业复苏 簋街11家餐企发放红包代金券<
北京商报讯(记者郭缤璐)12月30日,北京商报记者了解到,即日起至2023年1月31日24时,北京餐饮街簋街上的11家知名餐饮品牌将联合向消费者发出横
-
2023-01-01 07:51:12
如何简单高效地定制自己的文本作画模型?|每日关注
强烈建议先阅读:一文弄懂DiffusionModel1 论文信息标题:Multi-ConceptCustomizationofText-to-Ima
-
2022-12-31 16:05:44
环球资讯:魏牌承诺新能源国补到期后不涨价,补贴差额由车企承担
根据此前的新能源补贴政策,插电混合动力车型可以享受4800元 台的国家补贴。魏牌汽车后续上市的新车型或改款车型,官方指导价格将另行发布。在
-
2022-12-30 21:15:55
紫荆国际金融(08340.HK)委任长青(香港)为新核数师
格隆汇12月30日丨紫荆国际金融(08340 HK)宣布,国富浩华已辞任公司核数师,自2022年12月30日起生效,原因为(i)国富浩华未能与公司就审核集团截至
-
2022-12-30 18:31:53
可看特殊频道!多线路!超爽无限制、无授权!|每日关注
软件-网站-资源-技巧 "本公众号主要为大家分享全网黑科技软件、玩机技巧、网站福利、安卓+iOS+PC+盒子,通通具备,点击☝上方蓝字即可关注公众
-
2022-12-30 15:26:04
世界看热讯:助力餐饮业复苏 簋街11家餐企发放红包代金券
北京商报讯(记者郭缤璐)12月30日,北京商报记者了解到,即日起至2023年1月31日24时,北京餐饮街簋街上的11家知名餐饮品牌将联合向消费者发出横
-
2022-12-30 10:07:13
天罡股份拟在上交所科创板上市募资3.56亿元,投资者可保持关注
12月29日威海市天罡仪表股份有限公司(简称:天罡股份)提交申请,拟在上交所科创板上市,募资总金额为3 56亿元,保荐机构为民生证券股份有限
-
2022-12-30 04:08:38
贵溪规范小微权力运行便民利民
本报贵溪讯(通讯员李国芳、汪影)今年7月,贵溪市小微权力“监督一点通”平台上线。作为全省首批试点建设小微权力“监督一点通”平台的县...
-
2022-12-29 19:43:43
中国集邮文化香港校园展举办—— “以小小邮票作为认识国家的起点” 环球微资讯
图为学生们在观看展览。由中国邮政香港有限公司、香港东西汇基金有限公司联合主办的“2022年中国集邮文化香港校园展”近日在香港小西湾中华...
-
2022-12-29 17:55:30
天天头条:一路走好!演员毕可成因病抢救无效去世,年仅39岁,曾登春晚舞台
12月28日,威海曲协对外发布了一则讣告,宣布青年曲艺家、威海市曲艺家协会副秘书长毕可成先生,因病医治无效于2022年12月28日逝世,终年39岁
-
2022-12-29 15:41:16
环球速递!打新|业绩两年翻四倍!
拒绝盲目打新让你的打新之路更稳健主编 青木(本文数据来源于:同花顺) "截至2022年12月18日,2022年A股累计上市391支股票,首日破发数为10
-
2022-12-29 13:32:01
俄联合航空制造集团交付一批苏-57战机 承诺未来增产
据报道,俄联合航空制造集团公司总经理斯柳萨里指出,阿穆尔河畔共青城飞机制造厂已经完成了今年的计划,不仅为俄空天军生产苏-57战斗机,还生
-
2022-12-29 11:32:35
12月28日基金净值:广发安宏回报混合A最新净值1.124,跌0.79%
12月28日,广发安宏回报混合A最新单位净值为1 124元,累计净值为1 4417元,较前一交易日下跌0 79%。历史数据显示该基金近1个月上涨2 9%,近3个
-
2022-12-29 09:40:14
创盛智能(836378):对外投资
证券代码:836378证券简称:创盛智能主办券商:光大证券常州创盛智能装备股份有限公司对外投资的公告本公司及董事会全体成员保证
-
2022-12-28 17:27:26
全球微资讯!干地瓜叶子怎么做好吃 干地瓜叶子如何做好吃
1、主要材料:五花肉,洗净切块。2、葱段2-3截,姜2-3厚片。3、肉先在开水里紧一两分钟,捞出来尽量控干水分。4、炒锅里多放一些油,放两勺糖
-
2022-12-28 14:47:39
第一上海:维持康方生物-B(09926.HK)“买入”评级 目标价50.05港元
第一上海发布研究报告称,维持康方生物-B“买入”评级,考虑处于关键性 三期临床或已获批上市的5个产品AK112、AK104(已获批)、AK105(已获批)、
-
2022-12-28 10:47:44
国王主帅迈克-布朗因触发健康安全协议将缺席今日比赛 环球热议
据NBA知名记者Spears的报道,国王主帅迈克-布朗触发健康安全协议,将缺席今日与掘金的比赛,由球队助理教练乔迪-费尔南德斯将代为执教。
-
2022-12-28 06:18:47
全球百事通!分众传媒 积极修炼内功 看好利润弹性释放
公司是国内生活圈媒体领军企业。公司成立于2003年,多年来始终深耕广告营销领域,为客户提供楼宇媒体、影院银幕媒体及终端卖场媒体等广告投放
-
2022-12-27 19:07:42
东北独角兽冲刺科创板IPO,发行市值约257亿
计划募资26 83亿元。来源:直通IPO,文 王非东北独角兽、“吉林一号”主体公司科创板IPO获受理!12月23日,长光卫星技术股份有限公司(以下简
-
2022-12-27 15:15:54
吉星高照网贷逾期19天还不起征信会怎么样
网贷逾期一般会上征信,有些借贷机构在用户逾期后一天后就会上报给征信机构,而有些借贷机构则是会在几天后上报给征信机构,因为有些借贷机构可
-
2022-12-27 10:21:10
广西三江侦破三元催化器系列盗窃案
法治日报全媒体记者马艳近日,广西壮族自治区柳州市三江侗族自治县公安局侦破三元催化器系列盗窃案,抓获3名犯罪嫌疑人。2022年10月,三江侗族
-
2022-12-27 00:23:49
《庆余年2》角色人选再出变故,肖战、李沁之后,宋轶又出现问题|前沿资讯
说起《庆余年》,那可以称得上是继《琅琊榜》之后,又一部集江湖与朝堂于一体的经典剧作了。不过,《庆余年2》的选角却频繁出现变故,还真是让
-
2022-12-26 16:31:31
28家百亿量化私募2022盘点:7家新晋,谁股权激励留人才?-今日快看
28家百亿量化私募2022盘点:7家新晋,谁股权激励留人才?
-
2022-12-26 11:09:03
联发股份:公司印尼项目已有部分工序进入调试运行阶段 当前快播
(原标题:联发股份:公司印尼项目已有部分工序进入调试运行阶段)同花顺(300033)金融研究中心12月26日讯,有投资者向联发股份(002394)提
-
2022-12-26 00:50:18
招联好期贷网贷15万逾期还不起有起诉的风险吗
可能会。如果用户使用网贷消费之后出现了逾期,并且经过网贷机构和第三方的催收人员催缴欠款无果之后,网贷公司可能就会向法院提起诉讼。网贷
-
2022-12-25 09:49:10
观速讯丨北京进行时丨蹲点急诊科
“从每天三百四五到二百四五从排队三四个小时到半个小时”记者从北京宣武医院了解到本周发热门诊日接诊量已经开始下降
-
2022-12-24 11:30:39
王杨:隔夜黄金1803获利收割,黄金下周1805继续空!
黄金昨日继续看空,美盘冲高王杨果断1803继续干空,黄金半夜如期下跌收割,完美收官,愉快过周末和圣诞假期。黄金高位杀跌,昨日属于反弹,收
-
2022-12-23 19:48:42
AMD RX 7900 XT破发:10天便宜快400块 每日快看
欧洲电商MindFactory的页面显示,AMDRX7900XT显卡已经破发。从上市之初的1049欧元下调为999欧元,也就是10天降了50欧元(约合人民
-
2022-12-23 15:05:17
每日速看!杭州园林(300649)12月23日主力资金净卖出183.42万元
截至2022年12月23日收盘,杭州园林(300649)报收于17 42元,上涨2 89%,换手率2 22%,成交量2 29万手,成交额3962 96万元。12
-
2022-12-23 09:06:18
黄山胶囊:公司目前原材料供应充足
黄山胶囊(002817)12月23日在投资者关系平台上答复了投资者关心的问题。
-
2022-12-22 20:32:52
龙珠学校初中部召开期中考试表彰会,营造奋勇争先的学习氛围
读创 深圳商报首席记者包力通讯员郑可邓洁婷苏圣南为引导学生对本学期自身的学习情况进行一次全面评估,总结经验、找出差距、激励进步、鼓舞斗