这些术语经常互换使用,但它们之间有什么区别,使它们成为独特的技术呢?
技术每时每刻都越来越融入我们的日常生活,为了跟上消费者期望的步伐,公司更加依赖学习算法来让事情变得更容易。您可以在社交媒体(通过照片中的对象识别)或直接与设备(例如 Alexa 或 Siri)对话中看到它的应用。
这些技术通常与人工智能、机器学习、深度学习和神经网络相关,虽然它们确实都发挥着作用,但这些术语往往在对话中互换使用,导致人们对它们之间的细微差别产生一些混淆。希望我们可以使用这篇博文来澄清这里的一些歧义。
人工智能、机器学习、神经网络和深度学习有何关系?
也许思考人工智能、机器学习、神经网络和深度学习的最简单方法就是把它们想象成俄罗斯套娃。每个本质上都是前一个术语的组成部分。
也就是说,机器学习是人工智能的一个子领域。深度学习是机器学习的一个子领域,神经网络构成了深度学习算法的支柱。事实上,正是神经网络的节点层数或深度将单个神经网络与深度学习算法区分开来,深度学习算法必须超过三层。
什么是神经网络?
神经网络——更具体地说,人工神经网络 (ANN)——通过一组算法模仿人脑。在基本层面上,神经网络由四个主要组件组成:输入、权重、偏差或阈值以及输出。与线性回归类似,代数公式如下所示:
从这里开始,让我们将其应用到一个更具体的例子中,例如您是否应该在晚餐时点披萨。这将是我们的预测结果,或者说 y-hat。假设有三个主要因素会影响您的决定:
- 您是否可以通过订购来节省时间(是:1;否:0)
- 您是否会通过点披萨来减肥(是:1;否:0)
- 您是否会省钱(是:1;否:0)
然后,我们假设以下情况,并给出以下输入:
- X1 = 1,因为你不做饭
- X2 = 0,因为我们得到了所有的配料
- X3 = 1,因为我们只得到 2 片
为简单起见,我们的输入将具有 0 或 1 的二进制值。从技术上讲,这将其定义为感知器,因为神经网络主要利用 S 型神经元,它表示从负无穷大到正无穷大的值。这种区别很重要,因为大多数现实世界的问题都是非线性的,因此我们需要能够减少任何单个输入对结果的影响的值。然而,以这种方式进行总结将帮助您理解这里的基本数学原理。
继续,我们现在需要分配一些权重来确定重要性。与其他输入相比,较大的权重使得单个输入对输出的贡献更加显着。
- 瓦1 = 5,因为你重视时间
- 瓦2 = 3,因为您重视保持体形
- 瓦3 = 2,因为你在银行里有钱
最后,我们还将假设阈值为 5,这将转换为偏差值 –5。
由于我们为求和建立了所有相关值,因此现在可以将它们代入该公式中。
使用以下激活函数,我们现在可以计算输出(即我们订购披萨的决定):
总之:
Y-hat(我们的预测结果)= 决定是否订购披萨
Y 帽 = (1*5) + (0*3) + (1*2) - 5
Y 帽 = 5 + 0 + 2 – 5
Y-hat = 2,大于零。
由于 Y 帽为 2, 激活函数的输出 将 1、 意味着我们 将要 订购披萨 (我的意思是,谁不喜欢披萨)。
如果任何单个节点的输出高于指定的阈值,则该节点将被激活,将数据发送到网络的下一层。否则,不会有数据传递到网络的下一层。现在,想象一下上述过程对于单个决策重复多次,因为神经网络往往具有多个“隐藏”层作为深度学习算法的一部分。每个隐藏层都有自己的激活函数,可能将信息从前一层传递到下一层。一旦生成隐藏层的所有输出,它们就被用作输入来计算神经网络的最终输出。再次强调,上面的例子只是神经网络最基本的例子;大多数现实世界的例子都是非线性的,而且要复杂得多。
回归和神经网络之间的主要区别在于变化对单个权重的影响。在回归中,您可以更改权重而不影响函数中的其他输入。然而,神经网络的情况并非如此。由于一层的输出被传递到网络的下一层,因此单个更改可能会对网络中的其他神经元产生级联效应。
深度学习与神经网络有何不同?
虽然它隐含在神经网络的解释中,但值得注意的是。深度学习中的“深度”是指神经网络中层的深度。由三层以上组成的神经网络(包含输入和输出)可以被视为深度学习算法。这通常用下图来表示:
大多数深度神经网络都是前馈的,这意味着它们从输入到输出仅沿一个方向流动。但是,您也可以通过反向传播来训练模型;也就是说,从输出到输入以相反的方向移动。反向传播使我们能够计算和归因与每个神经元相关的误差,从而使我们能够适当地调整和拟合算法。
深度学习与机器学习有何不同?
正如我们在学习中心有关深度学习的文章中所解释的那样,深度学习只是机器学习的一个子集。它们的主要区别在于每种算法的学习方式以及每种算法使用的数据量。深度学习自动化了过程中的大部分特征提取部分,消除了一些所需的人工干预。它还支持使用大型数据集,在麻省理工学院的这次演讲中为自己赢得了“可扩展机器学习”的称号。当我们开始更多地探索非结构化数据的使用时,这种功能将特别有趣,特别是因为估计组织 80-90% 的数据都是非结构化的。
经典的或“非深度”的机器学习更依赖于人类干预来学习。人类专家确定特征的层次结构以了解数据输入之间的差异,通常需要更结构化的数据来学习。例如,假设我要向您展示一系列不同类型快餐的图像,“披萨”、“汉堡”或“炸玉米饼”。这些图像的人类专家将确定将每张图片区分为特定快餐类型的特征。例如,每种食物类型的面包可能是每张图片的显着特征。或者,您可以只使用“披萨”、“汉堡”或“炸玉米饼”等标签,通过监督学习来简化学习过程。
“深度”机器学习可以利用标记数据集(也称为监督学习)来通知其算法,但它不一定需要标记数据集。它可以摄取原始形式的非结构化数据(例如文本、图像),并且可以自动确定区分“披萨”、“汉堡”和“炸玉米饼”的一组特征。
要深入了解这些方法之间的差异,请查看“监督学习与无监督学习:有什么区别?”
通过观察数据中的模式,深度学习模型可以适当地对输入进行聚类。以之前的相同示例为例,我们可以根据图像中识别的相似点或差异将披萨、汉堡和炸玉米饼的图片分组到各自的类别中。话虽如此,深度学习模型需要更多的数据点来提高其准确性,而机器学习模型在给定基础数据结构的情况下依赖较少的数据。深度学习主要用于更复杂的用例,例如虚拟助手或欺诈检测。
有关机器学习的更多信息,请观看以下视频:
什么是人工智能(AI)?
最后,人工智能 (AI) 是用于对模仿人类智能的机器进行分类的最广泛术语。它用于预测、自动化和优化人类历史上完成的任务,例如语音和面部识别、决策和翻译。
人工智能主要分为三类:
- 窄人工智能 (ANI)
- 通用人工智能(AGI)
- 超级人工智能(ASI)
ANI 被认为是“弱”人工智能,而其他两种类型被归类为“强”人工智能。弱人工智能的定义是其完成特定任务的能力,例如赢得国际象棋比赛或识别一系列照片中的特定个人。随着我们进入更强大的人工智能形式,如 AGI 和 ASI,更多人类行为的结合变得更加突出,例如解释语气和情感的能力。聊天机器人和虚拟助手(例如 Siri)正在触及这一问题的表面,但它们仍然是 ANI 的例子。
强人工智能的定义是其与人类相比的能力。通用人工智能(AGI)的表现将与人类相当,而超级人工智能(ASI)——也称为超级智能——将超越人类的智力和能力。这两种形式的强人工智能尚不存在,但该领域的研究仍在继续。由于人工智能这一领域仍在快速发展,我能提供的最好的例子就是 HBO 节目中的角色 Dolores 西部世界。
管理您的 AI 数据
虽然人工智能的所有这些领域都可以帮助您简化业务领域并改善客户体验,但实现人工智能目标可能具有挑战性,因为您首先需要确保拥有正确的系统来管理数据以构建学习算法。数据管理可以说比构建您将用于业务的实际模型更困难。在开始构建任何东西之前,您需要一个存储数据的地方以及清理数据和控制偏差的机制。查看 IBM 的一些产品,帮助您和您的企业走上正确的道路,大规模准备和管理数据。