立即体验登录

课程: 生成式 AI vs. 传统 AI

免费学习该课程！

今天就开通帐号，24,000 门业界名师课程任您挑！

生成对抗网络（GAN）

生成对抗网络（GAN）

课程: 生成式 AI vs. 传统 AI

开始一个月试用购买团队方案

生成对抗网络（GAN）

“

在生成式人工智能领域，你也许听说过一个术语：生成对抗网络，简称 GAN。初次听到时，你也许认为所有的生成式 AI 都是基于 GAN 的，但事实并非如此。生成对抗网络出现在 2014 年左右，用来创建逼真的虚拟人图像。从某种意义上说，这是从“谷歌大脑”项目发现的猫和其他物品的图像进化而来。这些生成式 AI 系统有以下特别之处：首先，这个系统没有创建一个大型模型，而是分为两个相互对抗的子模型。它们相互竞争，提升输出质量。其次，这两个子模型各司其职。一个叫生成器，使用无监督学习生成图像。另一个叫判别器，也使用无监督学习和少量监督来评价生成的内容。这些对抗网络是计算机科学家从生物学中获得的灵感。可以这样想，如果你生活在北美洲，在日落前，你可能会看到蝙蝠出来捕食昆虫。它们最喜欢捕食的昆虫之一是飞蛾。蝙蝠使用一种回声定位的方式来抓住空中的飞蛾。于是有些飞蛾开始发出一种咔哒声，使蝙蝠难以定位它们。之后，蝙蝠就进化出更大的耳朵，来捕捉这些发出咔哒声音的飞蛾。然后，飞蛾开始逐渐发展出新的听觉，能听到蝙蝠回声定位的频率。为了适应，蝙蝠就开始改变它们使用的回声定位频率。飞蛾和蝙蝠之间是一种对抗进化关系。蝙蝠想吃飞蛾，飞蛾不想被蝙蝠吃掉，所以它们都改变自己的生理结构和行为来赢得这场零和博弈。生成对抗网络也是这样的工作原理。生成器生成图像，可以是假的也可以是真的，之后判别器就来猜图像的真假。如果生成器骗过了判别器，判别器就会改变自己的模型以防再次被骗。正如蝙蝠与飞蛾彼此欺骗、彼此提防。如果判别器猜对了，生成器就会更新自己的模型，以便生成更逼真的假图。这场战斗将持续进行，直到生成器输出的图片已经让判别器无法分辨真假。这就是如何得到一个逼真虚拟人图像的过程。判别器都分辨不出来，估计人也很难分辨。虽然 GAN 在图像生成方面如此优秀，但绝大多数 AI 的图像生成功能并没有使用 GAN。这是因为多数人并不需要一张逼真的虚拟人脸图像。相反，人们可能更想要一张 “老鼠戴着牛仔帽”之类的图像。正如我们前面看到的，最善于生成这类图片的，是扩散模型。

内容