课程: 生成式 AI vs. 传统 AI
免费学习该课程!
今天就开通帐号,24,000 门业界名师课程任您挑!
数据模型
在使用预测式人工智能时, 你可能经常听到一个术语 叫做 “机器学习模型”。 模型是一个抽象概念, 是机器学习系统把已知数据的模式 映射到新数据的方式。 这看起来像是个复杂的概念, 但如果仔细想想, 我们一直都在使用模型。 旅行时,我有时会租车。 多数情况下,即使之前从未开过租来的车, 驾驶它对我来说也并不困难。 这是因为经过多年的经验, 我创造了一个帮助我驾驶的模型。 我从自己的车中抽象出知识, 并应用到陌生的车上。 但这也并不意味着我会一帆风顺, 我可能打不开车灯或者雨刷器, 但我之前对驾驶的了解是有用的。 这也是统计学家为什么常说, “所有模型都是错误的,但有些是有用的。 ”这意味着, 每当从具体的知识中抽象出概念时, 都会丢失一些信息, 但这些小损失换来的 是一个关于驾驶的通用模型。 我驾驶陌生的车型也许会遇到问题, 但总比我从未开过车要好。 当处理大数据集时, 机器学习人工智能系统使用类似的方式, 系统将创建一个模型来处理类似的数据。 可以这样想, 假设你在一家信用卡公司上班, 正在使用机器学习给欺诈性交易分类。 如果使用二元分类, 也就是每笔交易有两种可能: 安全的和诈骗的。 现在,和驾驶类似, 你希望系统能像我会开陌生的车一样 来辨别未知交易。 使用之前数百万笔交易数据 来训练这个系统之后, 你可以创建一个机器学习模型。 之后,系统将会创造一个欺诈交易的模型。 记住,所有模型都是错的。 也就是说,无论系统运行得多么流畅, 都有可能出错。 但是随着时间的推移, 模型的准确度会不断提升。 同理,我租过的车越多, 开新车时就越熟练。 大多数机器学习模型的最大挑战之一是 它们不够灵活。 我不能使用我的驾驶模型 来搞懂如何开飞机。 机器学习模型也是这样。 多数模型不能用于全新的任务。 也就是说我不能用信用卡欺诈模型 来帮助银行决定谁能获得贷款。 但是这个限制 对于预测式人工智能来说不算大问题。 公司可以建立不同的神经网络 来解决不同的问题。 但正如我们将在稍后讲到的那样, 这对那些需要创造 或生成新数据的人工智能系统来说, 是一个巨大的挑战。