课程: 生成式 AI vs. 传统 AI

免费学习该课程!

今天就开通帐号,23,400 门业界名师课程任您挑!

自监督学习

自监督学习

我们前面已经了解到, 可以使用机器学习 来进行监督学习和无监督学习。 还记得吗?我们使用了机器学习来分类邮票, 或根据相似的特点将它们聚类。 我们还了解了生成对抗网络, 简称 GAN, 我们可以把这两项技术结合起来。 还记得吗? 我们需要使用少量监督学习来训练判别器, 让它做出更合理的猜测。 现在,新的生成式 AI 系统 可以将这一点更推进一步。 主要挑战在于世界上有大量未标记的数据。 所以,即使网络上有数百万张猫的图像, 但只有一小部分被标记为 “猫”, 而有监督的机器学习系统 需要使用标记数据进行训练。 如果能用无监督学习 来标记所有这些未标记的数据就好了, 这就是自监督学习技术。 如果想用无监督学习 来给像维基百科页面这样的数据添加标签, 那就可以使用无监督学习 来提取页面上的信息, 比如公司信息等,并创建标签, 也就是说系统可以为公司创始人、 CEO、营业收入和成立年份等 创建相应的标签。 之后在其他数百万个页面上重复这个过程。 这时,在向生成式 AI 系统提问时, 它就会从这些数据中寻找答案。 所以,如果你问 ChatGPT 关于微软的问题, 它可能会先说: 这家公司由比尔·盖茨 和保罗·艾伦于1975年创办。 重要的是要记住, 没有人类为这些数据创建标签。 它使用无监督学习来创建标签, 供之后的监督学习系统使用。 现在自监督系统不仅用于文本, 图像生成器也可以用这种方法 推断并创建新的生成式 AI 艺术品。 生成式 AI 系统 可以扩展著名的《蒙娜丽莎》油画, 看看如果画布更大的话, 达芬奇会画些什么。 自监督系统需要理解 河水如何流动或厨房架子上 会摆哪些罐子。 这些标签帮助系统理解 物品在真实世界中的存在方式。 这就是为什么生成式 AI 系统 能让黄色的狗戴紫色的帽子。 系统需要借助标签 理解紫色的帽子和黄色的狗是什么样子的。 没有一个人类 能够看过这个世界上的所有东西 然后标记所有数据, 所以,自监督学习 可以用来让这所有的联系成为可能。

内容