课程: 生成式 AI vs. 传统 AI
免费学习该课程!
今天就开通帐号,24,000 门业界名师课程任您挑!
生成对抗网络(GAN)
在生成式人工智能领域, 你也许听说过一个术语: 生成对抗网络,简称 GAN。 初次听到时, 你也许认为所有的生成式 AI 都是基于 GAN 的,但事实并非如此。 生成对抗网络出现在 2014 年左右, 用来创建逼真的虚拟人图像。 从某种意义上说, 这是从“谷歌大脑”项目发现的猫 和其他物品的图像进化而来。 这些生成式 AI 系统有以下特别之处: 首先,这个系统没有创建一个大型模型, 而是分为两个相互对抗的子模型。 它们相互竞争,提升输出质量。 其次,这两个子模型各司其职。 一个叫生成器, 使用无监督学习生成图像。 另一个叫判别器, 也使用无监督学习 和少量监督来评价生成的内容。 这些对抗网络是计算机科学家 从生物学中获得的灵感。 可以这样想, 如果你生活在北美洲, 在日落前,你可能会看到蝙蝠出来捕食昆虫。 它们最喜欢捕食的昆虫之一是飞蛾。 蝙蝠使用一种回声定位的方式 来抓住空中的飞蛾。 于是有些飞蛾开始发出一种咔哒声, 使蝙蝠难以定位它们。 之后,蝙蝠就进化出更大的耳朵, 来捕捉这些发出咔哒声音的飞蛾。 然后,飞蛾开始逐渐发展出新的听觉, 能听到蝙蝠回声定位的频率。 为了适应, 蝙蝠就开始改变它们使用的回声定位频率。 飞蛾和蝙蝠之间是一种对抗进化关系。 蝙蝠想吃飞蛾,飞蛾不想被蝙蝠吃掉, 所以它们都改变自己的生理结构和行为 来赢得这场零和博弈。 生成对抗网络也是这样的工作原理。 生成器生成图像, 可以是假的也可以是真的, 之后判别器就来猜图像的真假。 如果生成器骗过了判别器, 判别器就会改变自己的模型以防再次被骗。 正如蝙蝠与飞蛾彼此欺骗、彼此提防。 如果判别器猜对了, 生成器就会更新自己的模型, 以便生成更逼真的假图。 这场战斗将持续进行, 直到生成器输出的图片 已经让判别器无法分辨真假。 这就是如何得到一个逼真虚拟人图像的过程。 判别器都分辨不出来,估计人也很难分辨。 虽然 GAN 在图像生成方面如此优秀, 但绝大多数 AI 的图像生成功能 并没有使用 GAN。 这是因为多数人并不需要一张 逼真的虚拟人脸图像。 相反,人们可能更想要一张 “老鼠戴着牛仔帽”之类的图像。 正如我们前面看到的, 最善于生成这类图片的, 是扩散模型。