Midjourney劲敌来了！谷歌StyleDrop王牌「定制大师」引爆AI艺术圈_中国智能在线

Midjourney强敌来了！谷歌定制大师StyleDrop，将一张图片作为参考，不论多复杂的艺术风格都能复刻。

编者按：本文来自微信公众号新智元（ID： AI_era），作者：新智元编辑部，创业邦经授权发布。

(资料图)

谷歌StyleDrop一出，瞬间在网上刷屏了。

给定梵高的星空，AI化身梵高大师，对这种抽象风格顶级理解后，做出无数幅类似的画作。

再来一张卡通风，想要绘制的物体呆萌了许多。

甚至，它还能精准把控细节，设计出原风格的logo。

StyleDrop的魅力在于，只需要一张图作为参考，无论多么复杂的艺术风格，都能解构再复刻。

网友纷纷表示，又是淘汰设计师的那种AI工具。

StyleDrop爆火研究便是来自谷歌研究团队最新出品。

论文地址：https://arxiv.org/pdf/2306.00983.pdf

现在，有了StyleDrop这样的工具，不但可以更可控地绘画，还可以完成之前难以想象的精细工作，比如绘制logo。

就连英伟达科学家将其称为「现象级」成果。

「定制」大师

论文作者介绍道，StyleDrop的灵感来源Eyedropper（吸色/取色工具）。

同样，StyleDrop同样希望大家可以快速、毫不费力地从单个/少数参考图像中「挑选」样式，以生成该样式的图像。

一只树懒能够有18种风格：

一只熊猫有24种风格：

小朋友画的水彩画，StyleDrop完美把控，甚至连纸张的褶皱都还原出来了。

不得不说，太强了。

还有StyleDrop参考不同风格对英文字母的设计：

同样是梵高风的字母。

还有线条画。线条画是对图像的高度抽象，对画面生成构成合理性要求非常高，过去的方法一直很难成功。

原图中奶酪阴影的笔触还原到每种图片的物体上。

参考安卓LOGO创作。

此外，研究人员还拓展了StyleDrop的能力，不仅能定制风格，结合DreamBooth，还能定制内容。

比如，还是梵高风，给小柯基生成类似风格的画作：

再来一个，下面这只柯基有种埃及金字塔上的「狮身人面像」的感觉。

如何工作？

StyleDrop基于Muse构建，由两个关键部分组成：

一个是生成视觉Transformer的参数有效微调，另一个是带反馈的迭代训练。

之后，研究人员再从两个微调模型中合成图像。

Muse是一种基于掩码生成图像Transformer最新的文本到图像的合成模型。它包含两个用于基础图像生成(256 × 256)和超分辨率(512 × 512或1024 × 1024)的合成模块。

每个模块都由一个文本编码器T，一个transformer G，一个采样器S，一个图像编码器E和解码器D组成。

T将文本提示t∈T映射到连续嵌入空间E。G处理文本嵌入e∈E以生成视觉token序列的对数l∈L。S通过迭代解码从对数中提取视觉token序列v∈V，该迭代解码运行几步的transformer推理，条件是文本嵌入e和从前面步骤解码的视觉token。

最后，D将离散token序列映射到像素空间I。总的来说，给定一个文本提示t，图像I的合成如下：

图2是一个简化了的Muse transformer层的架构，它进行了部分修改，为的是支持参数高效微调（PEFT）与适配器。

使用L层的transformer处理在文本嵌入e的条件下以绿色显示的视觉token序列。学习参数θ被用于构建适配器调优的权重。

为了训练θ，在许多情况下，研究人员可能只给出图片作为风格参考。

研究人员需要手动附加文本提示。他们提出了一个简单的、模板化的方法来构建文本提示，包括对内容的描述，后面跟着描述风格的短语。

例如，研究人员在表1中用「猫」描述一个对象，并附加「水彩画」作为风格描述。

在文本提示中包含内容和风格的描述至关重要，因为它有助于从风格中分离出内容，这是研究人员的主要目标。

图3则是带反馈的迭代训练。

当在单一风格参考图像（橙色框）上进行训练时，StyleDrop生成的一些图像可能会展示出从风格参考图像中提取出的内容（红色框，图像背景中含有与风格图像类似的房子）。

其他图像（蓝色框）则能更好地从内容中拆分出风格。对StyleDrop进行好样本（蓝色框）的迭代训练，结果在风格和文本保真度之间取得了更好的平衡（绿色框）。

这里研究人员还用到了两个方法：

-CLIP得分

该方法用于测量图像和文本的对齐程度。因此，它可以通过测量CLIP得分（即视觉和文本CLIP嵌入的余弦相似度）来评估生成图像的质量。

研究人员可以选择得分最高的CLIP图像。他们称这种方法为CLIP反馈的迭代训练（CF）。

在实验中，研究人员发现，使用CLIP得分来评估合成图像的质量是提高召回率（即文本保真度）的有效方式，而不会过多损失风格保真度。

然而从另一方面看，CLIP得分可能不能完全与人类的意图对齐，也无法捕捉到微妙的风格属性。

-HF

人工反馈（HF）是一种将用户意图直接注入到合成图像质量评估中的更直接的方式。

在强化学习的LLM微调中，HF已经证明了它的强大和有效。

HF可以用来补偿CLIP得分无法捕捉到微妙风格属性的问题。

目前，已有大量研究关注了文本到图像的扩散模型的个性化问题，以合成包含多种个人风格的图像。

研究人员展示了如何以简单的方式将DreamBooth和StyleDrop结合起来，从而使风格和内容都能实现个性化。

这是通过从两个修改后的生成分布中采样来完成的，分别由风格的θs和内容的θc指导，分别是在风格和内容参考图像上独立训练的适配器参数。

与现有的成品不同，该团队的方法不需要在多个概念上对可学习的参数进行联合训练，这就带来了更大的组合能力，因为预训练的适配器是分别在单个主题和风格上进行训练的。

研究人员的整体采样过程遵循等式(1)的迭代解码，每个解码步骤中采样对数的方式有所不同。

设t为文本提示，c为无风格描述符的文本提示，在步骤k计算对数如下：

其中：γ用于平衡StyleDrop和DreamBooth——如果γ为0，我们得到StyleDrop，如果为1，我们得到DreamBooth。

通过合理设置γ，我们就可以得到合适的图像。

实验设置

目前为止，还没有对文本-图像生成模型的风格调整进行广泛的研究。

因此，研究人员提出了一个全新实验方案：

-数据收集

研究者收集了几十张不同风格的图片，从水彩和油画，平面插图，3D渲到不同材质的雕塑。

-模型配置

研究人员使用适配器调优基于Muse的StyleDrop 。对于所有实验，使用Adam优化器更新1000步的适配器权重，学习速率为0.00003。除非另有说明，研究人员使用StyleDrop来表示第二轮模型，该模型在10多个带有人工反馈的合成图像上进行训练。

-评估

研究报告的定量评估基于CLIP，衡量风格一致性和文本对齐。此外，研究人员进行了用户偏好研究，以评估风格一致性和文本对齐。

如图，研究人员收集的18个不同风格的图片，StyleDrop处理的结果。

可以看到，StyleDrop能够捕捉各种样式的纹理、阴影和结构的细微差别，能够比以前更好地控制风格。

为了进行比较，研究人员还介绍了DreamBooth在Imagen上的结果，DreamBooth在Stable Diffusion上的LoRA实现和文本反演的结果。

具体结果如表所示，图像-文本对齐（Text）和视觉风格对齐（Style）的人类评分（上）和CLIP评分（下）的评价指标。

(a) DreamBooth，(b) StyleDrop，和 (c) DreamBooth + StyleDrop的定性比较：

这里，研究人员应用了上面提到的CLIP分数的两个指标——文本和风格得分。

对于文本得分，研究人员测量图像和文本嵌入之间的余弦相似度。对于风格得分，研究人员测量风格参考和合成图像嵌入之间的余弦相似度。

研究人员为190个文本提示生成总共1520个图像。虽然研究人员希望最终得分能高一些，但其实这些指标并不完美。

而迭代训练（IT）提高了文本得分，这符合研究人员的目标。

然而，作为权衡，它们在第一轮模型上的风格得分有所降低，因为它们是在合成图像上训练的，风格可能因选择偏见而偏移。

Imagen上的DreamBooth在风格得分上不及StyleDrop（HF的0.644对比0.694）。

研究人员注意到，Imagen上的DreamBooth的风格得分增加并不明显（0.569 → 0.644），而Muse上的StyleDrop的增加更加明显（0.556 →0.694）。

研究人员分析，Muse上的风格微调比Imagen上的更有效。

另外，在细粒度控制上， StyleDrop捕捉微妙的风格差异，如颜色偏移，层次，或锐角的把控。

网友热评

要是设计师有了StyleDrop，10倍速工作效率，已经起飞。

AI一天，人间10年，AIGC正在以光速发展，那种晃瞎人眼的光速！

工具只是顺应了潮流，该被淘汰的已经早被淘汰了。

对于制作Logo来说这个工具比Midjourney好用得多。

参考资料：

https://styledrop.github.io/

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

推荐内容

Midjourney劲敌来了！谷歌StyleDrop王牌「定制大师」引爆AI艺术圈

2023-06-05
焦点要闻：华为即将发布国内首个软硬协同全栈自主的数据库

2023-06-05
刘慈欣自曝用ChatGPT写发言稿

2023-06-05
“整数智能”于近期完成了数千万Pre A轮融资

2023-06-05
Counterpoint：Q1智能手机AP市场联发科位居第一高通份额恢复到约30%

2023-06-05
NBC环球高管Joe Benarroch将加入推特

2023-06-05
开启“带店加盟”模式，瑞幸被库迪“逼急”了？

2023-06-05
世界观速讯丨抖音盯上小红书？防御即是增长

2023-06-05
528家科创板公司IPO募资逾8200亿元，“长三角力量”撑起“半壁江山”

2023-06-05
英菲尼迪任命何塞·罗曼为全球总裁

2023-06-05
【天天播资讯】向AI提问，这个新职业火了

2023-06-05
【环球聚看点】科大讯飞：星火大模型技术的应用，进一步提升讯飞学习机的市场份额和品牌知名度

2023-06-04
【世界新要闻】中国空间站第四批空间科学实验样品顺利返回并交付实验科学家

2023-06-04
职权扩大，TikTok CEO周受资接管Lemon8；爱奇艺计划赴港二次上市丨Going Global

2023-06-04
360智脑大模型应用发布会将于6月13日举行

2023-06-04
日媒：日本2022年出生率与出生数均跌至最低_世界百事通

2023-06-04
苹果直播不带货，百万人看了个寂寞-观察

2023-06-04
疯狂演唱会：抢不到的票，无序的市场，与人人喊打的黄牛

2023-06-04
折叠屏手机狂欢外屏尺寸，方向错了环球看点

2023-06-04
消息称微软总裁将会见英国财政大臣，或考虑关闭动视暴雪在英业务

2023-06-04
东风日产首款插混新能源产品开启预售今日播报

2023-06-04
飞盘衰落，“小众网红运动”为何难长红？

2023-06-04
对比日本，中国的老龄化会有哪些不同？|世界聚看点

2023-06-04
消息！海马7X-E新能源车样车出口缅甸

2023-06-04
皮克斯工作室十年来首次大规模裁员，《光年正传》导演与全球宣传副总裁离职

2023-06-04
曾年薪1500万，网红经济学家开了家淘宝店|当前短讯

2023-06-04
观焦点：罗永浩“三嫁”，京东直播任重道远

2023-06-04
天天热议:南北双雄对决，谁是工业第五强省？

2023-06-04
消息称高通骁龙8 Gen 2芯片售价高达160美元|全球关注

2023-06-04
全球讯息：索尼CEO称云游戏仍面临巨大障碍

2023-06-04
苹果WWDC看点包括XR头显、iOS 17等世界新要闻

2023-06-04
每日观点：神舟十五号载人飞行任务圆满成功

2023-06-04
通用汽车CEO力挺自动驾驶部门Cruise 焦点关注

2023-06-04
崔东树：1-4月中国占世界新能源车份额60%

2023-06-04
新款凯迪拉克CT5谍照首曝_当前观点

2023-06-03
今日热文：GPT-3计划开源！Sam Altman自曝急缺GPU，GPT-4多模态能力2024年开放

2023-06-03
关注：Lululemon五年涨220%，除了瑜伽裤还靠什么？

2023-06-03
消息称苹果正改造 watchOS 10，让应用适配Apple Watch Ultra 环球要闻

2023-06-03
迪士尼落子武汉？上海迪士尼度假区回复：这是假新闻！_当前看点

2023-06-03
每日热闻!苇渡科技获数亿元A轮融资

2023-06-03
今日要闻!骁阳完成数千万人民币A轮融资

2023-06-03
县城CBD究竟能塞下多少奶茶店？-全球快资讯

2023-06-03
周鸿祎，用AI再造一个新360

2023-06-03
长三角首个量子超算协同创新中心成立_世界热点评

2023-06-03
五月天带火我生意：出租荧光棒一次50，编头发两天赚1000

2023-06-03
AI席卷华尔街：对冲基金部署ChatGPT，银行展开“军备竞赛” 观察

2023-06-03
消息称推特品牌安全和广告质量主管将离职世界最资讯

2023-06-03
让所有事情事半功倍的方法焦点快播

2023-06-03
又一车企面临退市，市值蒸发98%，美国新造车也是一地鸡毛-热点在线

2023-06-03
AI狂飙突进，存力需作先锋热头条

2023-06-03

Midjourney劲敌来了！谷歌StyleDrop王牌「定制大师」引爆AI艺术圈

2023-06-05
当前时讯：2023全国英式7人制橄榄球锦标赛在杭州闭幕

2023-06-05
5G+XR：英国电信为行业培训提供沉浸式体验|环球滚动

2023-06-05
全球快讯:独家：中国电信提出套餐要全面5G化实现用户入网即5G

2023-06-05
每日速讯：中央网信办：切实保障企业和企业家权益，解决网上有害信息，着力优化营商网络环境

2023-06-05
全球观速讯丨Yann LeCun、吴恩达暴怒了，美军无人机抗命击杀操作员

2023-06-05
记者：梅西目前不太可能回归巴萨，迈阿密报价的金额少于沙特

2023-06-05
长春健康职业学院来承德护理职业学院参观交流

2023-06-05
环球热议:泸州月光泸州是哪_泸州月光歌词

2023-06-05
北京：个人购买绿色建筑公积金贷款额度可上浮_天天报道

2023-06-05
刘慈欣自曝用ChatGPT写发言稿

2023-06-05
焦点要闻：华为即将发布国内首个软硬协同全栈自主的数据库

2023-06-05
Counterpoint：Q1智能手机AP市场联发科位居第一高通份额恢复到约30%

2023-06-05
“整数智能”于近期完成了数千万Pre A轮融资

2023-06-05
环球快报:赞宇科技：公司的OEM/ODM业务依托表面活性剂的原料优势，为国内外洗护品牌提供“配方定制、包装设计和生产加工”的一站式供应链服务

2023-06-05
亚马逊将有近10万卖家更新后台验证信息

2023-06-05
世界百事通！安宁控股(00128)获溢价约24.7%提私有化 6月5日复牌

2023-06-05
金山快盘还能用吗_金山快盘登录官网

2023-06-05
NBC环球高管Joe Benarroch将加入推特

2023-06-05
开启“带店加盟”模式，瑞幸被库迪“逼急”了？

2023-06-05
头条焦点：让更多孩子逐梦绿茵场

2023-06-05
世界观速讯丨抖音盯上小红书？防御即是增长

2023-06-05
债务危机“象征性结束”，美国“新债海啸”将埋下这些雷！

2023-06-05
每日时讯!富国中证农业主题ETF净值上涨1.08% 请保持关注

2023-06-05
意甲-米兰3-1送维罗纳降级莱奥双响伊布含泪告别

2023-06-05
【天天播资讯】向AI提问，这个新职业火了

2023-06-05
528家科创板公司IPO募资逾8200亿元，“长三角力量”撑起“半壁江山”

2023-06-05
英菲尼迪任命何塞·罗曼为全球总裁

2023-06-05
沪深股通|黔源电力6月2日获外资卖出0.04%股份

2023-06-05
SMM评论：需求不足稀土价格涨势难续开始小幅回落热资讯

2023-06-05
$智在必得/估值及股息吸引中海油11元可买\张智威$
智在必得/估值及股息吸引中海油11元可买\张智威

2023-06-05
全球报道:现场视频丨乐山金口河发生高位山体垮塌致19人遇难原因正在调查中

2023-06-05
当前速看：十堰劳务派遣律师收费标准及律师费是多少

2023-06-05
天天快看：炒牛肉怎么炒会很嫩_如何炒牛肉炒出来更嫩

2023-06-05
微交易app官网下载_微交易怎么玩

2023-06-05
爷的oc小说/原创小说

2023-06-05
将简约款穿出高级感，学会5个穿搭小技巧，你也能做一个精致女人_当前头条

2023-06-05
招财猫什么属相可以摆_最佳风水摆件招财猫左右手作用大不同今日更新

2023-06-05
华强北的手表，汤主的测评来了！

2023-06-04
外媒：东帝汶总统批评一些国家以“井底之蛙”视角看待中国崛起

2023-06-04
青出于蓝是什么句式_青出于蓝是什么意思

2023-06-04
热资讯！大武汉一日丨毕业季，一定要拍组这样的合照

2023-06-04
天天百事通！徐钢集团王爱钦之子直播徐钢集团

2023-06-04
小米显示器保修多久（小米显示器）_世界快报

2023-06-04
【世界新要闻】中国空间站第四批空间科学实验样品顺利返回并交付实验科学家

2023-06-04
全国数学竞赛，一等奖×3！

2023-06-04
【环球聚看点】科大讯飞：星火大模型技术的应用，进一步提升讯飞学习机的市场份额和品牌知名度

2023-06-04
生殖医学理论与实践第二版_关于生殖医学理论与实践第二版介绍

2023-06-04
6月3日起，小仁线封闭施工，303路、305路、312路临时绕行|报道

2023-06-04
看看洪森家族的达官贵人，就明白为什么柬埔寨治安不好的原因了

2023-06-04
刚宣布增持又公告回购！地产公司放大招_每日信息

2023-06-04
最资讯丨晓歌：“如果是博士的话，也不是不行哦”【明日方舟/桃文】

2023-06-04
【全球播资讯】最新快讯!世界今热点：环球速看：每日视讯：国瓷材料：6月2日召开业绩说明会，投资者参与|全球快讯环球要闻环球动态环球新消息|当前通讯

2023-06-04
建议书格式怎么写_建议书范文格式关注

2023-06-04
LHN(01730)：密尔克卫拟收购LHN Logistics资本中所有已发行及缴足的普通股-每日速讯

2023-06-04
职权扩大，TikTok CEO周受资接管Lemon8；爱奇艺计划赴港二次上市丨Going Global

2023-06-04
ST世茂将于6月27日召开股东大会

2023-06-04
世界热议:专家支招高考考生科学饮食

2023-06-04
Azure平台合作伙伴关系和NetApp宣布面向中端客户的全新全闪存存储系统-世界即时

2023-06-04
360智脑大模型应用发布会将于6月13日举行

2023-06-04
日媒：日本2022年出生率与出生数均跌至最低_世界百事通

2023-06-04
每日速看!广安市前锋区小井乡小学举办“六一”文艺汇演暨课后服务展评活动

2023-06-04
如何辞退总爱闹事的员工，如何进行赔偿

2023-06-04
凯尔达(688255.SH)2022年度权益分派：每股转0.401股派0.26元 6月8日股权登记世界观速讯

2023-06-04
《一脉》诗书篇 | 人大副教授辛晓娟对话诗词少女徐书元飞花行令共鸣诗词情怀

2023-06-04
全球观察：健康科普| 套系淋巴瘤是什么？

2023-06-04
女孩放弃入职后收到HR千字回复传递内心的善意_环球新要闻

2023-06-04
福彩3D晒票23145期来了，好坏都忍住，也算是进步

2023-06-04
赢得认可，主教练埃姆雷：吴少聪首发出战今天表现很好

2023-06-04
苹果直播不带货，百万人看了个寂寞-观察

2023-06-04
折叠屏手机狂欢外屏尺寸，方向错了环球看点

2023-06-04
疯狂演唱会：抢不到的票，无序的市场，与人人喊打的黄牛

2023-06-04
佳能80d配什么镜头好论坛佳能80d配什么镜头好

2023-06-04
请您做好如下准备再预存办卡，否则…….

2023-06-04
飞盘衰落，“小众网红运动”为何难长红？

2023-06-04
消息称微软总裁将会见英国财政大臣，或考虑关闭动视暴雪在英业务

2023-06-04
鑫祥17保险买20年交划不划算？优缺点是什么？

2023-06-04
对比日本，中国的老龄化会有哪些不同？|世界聚看点

2023-06-04
东风日产首款插混新能源产品开启预售今日播报

2023-06-04
迪玛希我是歌手歌单_迪玛希女朋友

2023-06-04
【当前热闻】流水线拆除，高效、安全、环保

2023-06-04
全球新消息丨美国财政部即将推出一波新债海啸，华尔街警告市场还没有准备好

2023-06-04
当前速看：煦组词_煦

2023-06-04
【环球快播报】3种颜色！Redmi神机更多渲染图曝光

2023-06-04
爱因斯坦为什么说1加1等于3_1加1等于3 滚动

2023-06-04
世界消息！以太币

2023-06-04
中国女篮夸张惨败！单节2分险创最差纪录，该给郑薇泼一盆冷水了

2023-06-04
观焦点：罗永浩“三嫁”，京东直播任重道远

2023-06-04
天天热议:南北双雄对决，谁是工业第五强省？

2023-06-04
环球看热讯：【原】基拉里脸色铁青！美国女排差点掉队，韩国主帅拿黄牌，实力如业余

2023-06-04
皮克斯工作室十年来首次大规模裁员，《光年正传》导演与全球宣传副总裁离职

2023-06-04
曾年薪1500万，网红经济学家开了家淘宝店|当前短讯

2023-06-04
消息！海马7X-E新能源车样车出口缅甸

2023-06-04
金华：夏令水果大量上市_焦点快报

2023-06-04
全球新资讯：崔龙龙

2023-06-04
【世界聚看点】画面分割器（画面分割器）

2023-06-04
消息称高通骁龙8 Gen 2芯片售价高达160美元|全球关注

2023-06-04
每日观点：神舟十五号载人飞行任务圆满成功

2023-06-04
苹果WWDC看点包括XR头显、iOS 17等世界新要闻

2023-06-04
土耳其总统埃尔多安宣布新一届内阁成员名单|天天要闻

2023-06-04