立即体验登录

课程: 生成式 AI vs. 传统 AI

免费学习该课程！

今天就开通帐号，24,000 门业界名师课程任您挑！

变分自编码器（VAE）

变分自编码器（VAE）

课程: 生成式 AI vs. 传统 AI

开始一个月试用购买团队方案

变分自编码器（VAE）

“

生成式人工智能是用来生成新内容的。也就是说，你可以拿一张猫的图片，然后使用它来生成一张其他猫的类似图像。那么，系统是如何实现这一点的呢？我们看到一张猫的图像时，会马上认出它，即使这只猫是我们从没见过的品种或颜色，即使是那种没有毛的、看起来像是尤达大师的猫，我们也能认出这是一只猫。人的大脑是如何做到这一点的呢？这是因为在某种程度上，人了解猫之所以是猫的本质。这意味着对于生成式 AI 系统来说，它也必须能像这样了解猫的本质。生成式 AI 系统实现这一点的最佳方式之一是自编码。这是一种无监督学习技术，使用编码器和解码器对数据进行分解。这样就可以把猫的图像编码成一种 “猫代码”。在某种意义上，这就是猫的本质。可以把它想象成一幅用一条线画出的猫素描一样，这个过程就是特征提取。这些本质或素描画就是代码。之后，解码器会查看这些代码，并推断出猫原来的样子。理想情况下，它应该看起来与原图非常相似。当前，自编码最大的挑战之一是提取特征，并将它放入一个所谓的“潜在空间”。也就是说，关键是要从图片中提取猫的本质，并把它放入一个可以解码或修改的空间中。因为当我们说猫的图像时，一般都是指只有一只猫在白色背景上、没有其他物体的图像。所以自编码器要能够去除异常物体，可能是一个红色的球，草地或者猫主人的大腿。这些都去除之后，才能够提取特征，并给猫的本质编码。这个把猫和其他东西分离的过程叫做异常检测。细想一下，这么做非常有道理。如果你想生成一张带有猫的新图像，那你肯定不希望在背景中有随机的噪声，比如几片草叶或一个红球。要生成一张猫坐在椅子上的图像，那你只需要自编码器能提取出来猫本身就行。最受欢迎的生成式 AI 自编码器之一叫做变分自编码器，简称 VAE。这个自编码器使用概率试着确定猫在潜在空间中的位置。注意，这并不是指猫在图像中的具体位置，而更像是在根据概率来捕捉猫的核心本质。所以，你可以删除不需要的信息，比如毛色或者猫的大小，只提取猫最重要的特征来编码。

内容