课程: 生成式 AI vs. 传统 AI
免费学习该课程!
今天就开通帐号,24,000 门业界名师课程任您挑!
变分自编码器(VAE)
生成式人工智能是用来生成新内容的。 也就是说,你可以拿一张猫的图片, 然后使用它来生成一张其他猫的类似图像。 那么,系统是如何实现这一点的呢? 我们看到一张猫的图像时, 会马上认出它, 即使这只猫是我们从没见过的品种或颜色, 即使是那种没有毛的、 看起来像是尤达大师的猫, 我们也能认出这是一只猫。 人的大脑是如何做到这一点的呢? 这是因为在某种程度上, 人了解猫之所以是猫的本质。 这意味着对于生成式 AI 系统来说, 它也必须能像这样了解猫的本质。 生成式 AI 系统 实现这一点的最佳方式之一是自编码。 这是一种无监督学习技术, 使用编码器和解码器对数据进行分解。 这样就可以把猫的图像 编码成一种 “猫代码”。 在某种意义上,这就是猫的本质。 可以把它想象成一幅 用一条线画出的猫素描一样, 这个过程就是特征提取。 这些本质或素描画就是代码。 之后,解码器会查看这些代码, 并推断出猫原来的样子。 理想情况下, 它应该看起来与原图非常相似。 当前,自编码最大的挑战之一是 提取特征, 并将它放入一个所谓的“潜在空间”。 也就是说,关键是要从图片中提取猫的本质, 并把它放入一个可以解码或修改的空间中。 因为当我们说猫的图像时, 一般都是指只有一只猫在白色背景上、 没有其他物体的图像。 所以自编码器要能够去除异常物体, 可能是一个红色的球, 草地或者猫主人的大腿。 这些都去除之后,才能够提取特征, 并给猫的本质编码。 这个把猫和其他东西分离的过程 叫做异常检测。 细想一下,这么做非常有道理。 如果你想生成一张带有猫的新图像, 那你肯定不希望在背景中有随机的噪声, 比如几片草叶或一个红球。 要生成一张猫坐在椅子上的图像, 那你只需要自编码器能提取出来猫本身就行。 最受欢迎的生成式 AI 自编码器之一 叫做变分自编码器,简称 VAE。 这个自编码器使用概率 试着确定猫在潜在空间中的位置。 注意,这并不是指猫在图像中的具体位置, 而更像是在根据概率来捕捉猫的核心本质。 所以,你可以删除不需要的信息, 比如毛色或者猫的大小, 只提取猫最重要的特征来编码。