课程: 生成式 AI vs. 传统 AI
免费学习该课程!
今天就开通帐号,24,000 门业界名师课程任您挑!
监督学习和无监督学习
如果集邮是你爷爷的终身爱好。 他请你帮他整理邮票, 以捐赠给博物馆。 于是他交给你几十个箱子, 装了大概有几十万张邮票。 这些邮票上印着不同的语言,有不同的颜色。 其中一些已经使用过了, 另外一些仍有塑料密封包装。 博物馆表示,邮票必须要提前整理好, 他们才接受,以方便存档, 所以,他们给你寄了一台小型邮票机器人, 来帮你整理邮票。 这个机器人装在一个箱子里, 上面贴着一张便条, 写着 “给我编程”, 于是你仔细思考了一下, 意识到有两种为它编程的方法。 你可以明确告诉它如何给邮票分类。 这意味着,你需要自己先设定好分类标准。 你可以按照语言、颜色或者日期来分类。 另一种选择是把邮票随意扔在地上, 然后告诉机器人将它们聚类成任何合理的组。 然后,你可以去看电视, 几小时之后,来看看机器人的分类结果。 它可能根据颜色或大小 已经把邮票分成几堆了。 第一种给机器人编程的方式叫做 监督学习, AI 系统会根据训练好的类别 对数据进行分类。 第二种编程方法叫做无监督学习。 是 AI 系统根据 自己理解的数据特征进行的聚类。 可以想象,每种方法都有自己的优势。 如果你已经想好如何分类了, 监督学习是不二之选。 因此,如果你想按照年份给邮票分类, 只需要训练系统如何识别日期。 另一方面,如果你对数据缺乏了解, 无监督学习是个不错的选择。 机器可以根据自己的理解将数据聚类, 而且它不需要训练, 可以让系统在没有监督的情况下运行, 处理大量数据。 当使用预测式 AI 时, 知道哪种方法最合适很重要。 不同方法进行组织数据的方式也不同, 这将极大地影响数据在预测中的价值。