立即体验登录

课程: 生成式 AI vs. 传统 AI

免费学习该课程！

今天就开通帐号，23,400 门业界名师课程任您挑！

自监督学习

自监督学习

课程: 生成式 AI vs. 传统 AI

开始一个月试用购买团队方案

自监督学习

“

我们前面已经了解到，可以使用机器学习来进行监督学习和无监督学习。还记得吗？我们使用了机器学习来分类邮票，或根据相似的特点将它们聚类。我们还了解了生成对抗网络，简称 GAN，我们可以把这两项技术结合起来。还记得吗？我们需要使用少量监督学习来训练判别器，让它做出更合理的猜测。现在，新的生成式 AI 系统可以将这一点更推进一步。主要挑战在于世界上有大量未标记的数据。所以，即使网络上有数百万张猫的图像，但只有一小部分被标记为 “猫”，而有监督的机器学习系统需要使用标记数据进行训练。如果能用无监督学习来标记所有这些未标记的数据就好了，这就是自监督学习技术。如果想用无监督学习来给像维基百科页面这样的数据添加标签，那就可以使用无监督学习来提取页面上的信息，比如公司信息等，并创建标签，也就是说系统可以为公司创始人、 CEO、营业收入和成立年份等创建相应的标签。之后在其他数百万个页面上重复这个过程。这时，在向生成式 AI 系统提问时，它就会从这些数据中寻找答案。所以，如果你问 ChatGPT 关于微软的问题，它可能会先说：这家公司由比尔·盖茨和保罗·艾伦于1975年创办。重要的是要记住，没有人类为这些数据创建标签。它使用无监督学习来创建标签，供之后的监督学习系统使用。现在自监督系统不仅用于文本，图像生成器也可以用这种方法推断并创建新的生成式 AI 艺术品。生成式 AI 系统可以扩展著名的《蒙娜丽莎》油画，看看如果画布更大的话，达芬奇会画些什么。自监督系统需要理解河水如何流动或厨房架子上会摆哪些罐子。这些标签帮助系统理解物品在真实世界中的存在方式。这就是为什么生成式 AI 系统能让黄色的狗戴紫色的帽子。系统需要借助标签理解紫色的帽子和黄色的狗是什么样子的。没有一个人类能够看过这个世界上的所有东西然后标记所有数据，所以，自监督学习可以用来让这所有的联系成为可能。

内容