GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型_环球短讯_中国科商网

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型_环球短讯

发布日期： 2023-06-13 07:42:34 来源：程序员客栈

(相关资料图)

点蓝色字关注“机器学习算法工程师”

设为星标，干货直达！

自从 DALL·E 2 之后，在图像生成方面扩散模型替代GAN成了主流方向，比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日， Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿（1B）的GAN模型：GigaGAN，其在文生图效果上接近扩散模型效果，而且推理速度更快，生成512x512大小图像只需要0.13s，生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能，比如latent插值，风格混合，以及向量运算等。

GigaGAN

改进了StyleGAN架构，采用两阶段训练策略：一个是64x64的图像生成器和一个512x512的图像超分2器，其图像生成器架构如下所示（这里也是采用CLIP text encoder来引入text condition）：

GigaGAN

在 LAION2B-en和 COYO-700M数据集上训练，其在COCO数据集上的FID达到9.09，超过stable diffusion 1.5，推理速度比stable diffusion快20倍多（2.9s vs 0.13s）：

GigaGAN

除了文生图能力，还可以实现可控的合成，比如风格混合，如下图所示：

更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词：

相关内容

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型_环球短讯

苹果股价再创历史新高：市值逼近3万亿美元

天天快看点丨特变电工：6月12日融券卖出51.77万股，融资融券余额54.83亿元

5*10电缆多少钱一米（电缆多少钱一米）

世界热消息：友邦、腾讯领衔，港股公司掀新一轮回购潮

AI语言模型“提速”药物发现_环球快看点

四行业公司持续大手笔分红天天播资讯

2023年医保目录调整启动|微动态

标普纳指创逾一年最高，苹果市值逼近3万亿美元，特斯拉十二连涨暴打空头，小鹏、蔚来大涨

露营也有鄙视链？做自己就好|要闻速递

最资讯丨任天野老婆个人是谁_任天野个人资料

世界简讯:九价HPV疫苗扩龄后需求猛增

【快播报】lol传送门什么时候出的_lol传送门

电脑运行内存怎么扩大_电脑运行内存最新消息

海力风电（301155）：6月12日北向资金减持79.42万股

环球热资讯！迪阿股份（301177）：6月12日北向资金增持15.22万股

焦点快播：雷克萨斯RX L 450h英国价格和规格七座雷克萨斯RX的溢价约£2.4k

全球热头条丨爱玛科技（603529）：6月12日北向资金增持14.44万股

上市公司信披考核迎修订 A类可获更多支持

全球滚动:西藏那曲市尼玛县发生3.7级地震，震源深度10千米

本月热门新闻

24小时热点

24小时热点

国内有哪些好用洗发水品牌？盘点十大公认最好用的洗发水

国内有哪些好用洗发水品牌？盘点十大公认最好用的洗发水

去屑洗发水哪个牌子最好？十大洗发水去屑止痒品牌排名

去屑洗发水哪个牌子最好？十大洗发水去屑止痒品牌排名

女士泳衣哪个牌子好？十大泳衣品牌推荐

女士泳衣哪个牌子好？十大泳衣品牌推荐

有哪些较为出名的童装品牌？十大知名童装品牌推荐

有哪些较为出名的童装品牌？十大知名童装品牌推荐

有哪些好穿的童鞋品牌推荐？童鞋十大名牌排行榜

有哪些好穿的童鞋品牌推荐？童鞋十大名牌排行榜

宝宝餐桌怎么选择？宝宝餐桌椅品牌排行榜

宝宝餐桌怎么选择？宝宝餐桌椅品牌排行榜