Azure 机器学习中的深度学习与机器学习

本文解释了深度学习与机器学习以及它们如何适应更广泛的人工智能类别。了解可以在 Azure 机器学习上构建的深度学习解决方案,例如欺诈检测、语音和面部识别、情绪分析和时间序列预测。

有关为解决方案选择算法的指南,请参阅机器学习算法备忘单。

Azure 机器学习中的基础模型是预先训练的深度学习模型,可以针对特定用例进行微调。详细了解 Azure 机器学习中的基础模型(预览版)以及如何使用 Azure 机器学习中的基础模型(预览版)。

深度学习、机器学习和人工智能

Relationship diagram: AI vs. machine learning vs. deep learning

请考虑以下定义来理解深度学习、机器学习和人工智能:

  • 深度学习 是基于人工神经网络的机器学习的一个子集。这 学习过程深的 因为人工神经网络的结构由多个输入层、输出层和隐藏层组成。每层都包含将输入数据转换为下一层可用于特定预测任务的信息的单元。由于这种结构,机器可以通过自己的数据处理来学习。

  • 机器学习 是人工智能的一个子集,它使用使机器能够利用经验来改进任务的技术(例如深度学习)。这 学习过程 基于以下步骤:

    1. 将数据输入算法。 (在此步骤中,您可以向模型提供附加信息,例如,通过执行特征提取。)
    2. 使用这些数据来训练模型。
    3. 测试并部署模型。
    4. 使用部署的模型来执行自动化预测任务。 (换句话说,调用并使用已部署的模型来接收模型返回的预测。)
  • 人工智能(AI) 是一种使计算机能够模仿人类智能的技术。它包括机器学习。

  • 生成式人工智能 是人工智能的一个子集,它使用技术(例如深度学习)来生成新内容。例如,您可以使用生成式 AI 创建图像、文本或音频。这些模型利用大量预先训练的知识来生成这些内容。

通过使用机器学习和深度学习技术,您可以构建计算机系统和应用程序来执行通常与人类智能相关的任务。这些任务包括图像识别、语音识别和语言翻译。

深度学习技术与机器学习技术

现在您已经了解了机器学习与深度学习的概述,让我们来比较这两种技术。在机器学习中,需要告诉算法如何通过消耗更多信息(例如,通过执行特征提取)来做出准确的预测。在深度学习中,借助人工神经网络结构,算法可以通过自身的数据处理来学习如何做出准确的预测。

下表更详细地比较了这两种技术:

所有机器学习 只有深度学习
数据点数量 可以使用少量数据进行预测。 需要使用大量的训练数据来进行预测。
硬件依赖性 可以在低端机器上工作。它不需要大量的计算能力。 取决于高端机器。它本质上会进行大量的矩阵乘法运算。 GPU 可以有效地优化这些操作。
特征化过程 要求用户准确识别和创建特征。 从数据中学习高级特征并自行创建新特征。
学习方法 将学习过程分为更小的步骤。然后,它将每个步骤的结果组合成一个输出。 通过端到端解决问题来完成学习过程。
执行时间处理时间 训练时间相对较短,从几秒钟到几个小时不等。 由于深度学习算法涉及很多层,因此通常需要很长时间来训练。
输出 输出通常是数值,例如分数或分类。 输出可以有多种格式,例如文本、乐谱或声音。

什么是迁移学习?

训练深度学习模型通常需要大量的训练数据、高端计算资源(GPU、TPU)和较长的训练时间。在您没有任何这些可用的情况下,您可以使用称为的技术来缩短培训过程 迁移学习。

迁移学习是一种将解决一个问题所获得的知识应用于另一个不同但相关的问题的技术。

由于神经网络的结构,第一组层通常包含较低级别的特征,而最后一组层包含更接近所讨论领域的更高级别的特征。通过重新利用最终层以用于新领域或问题,您可以显着减少训练新模型所需的时间、数据和计算资源。例如,如果您已经有一个识别汽车的模型,您可以使用迁移学习重新调整该模型的用途,以识别卡车、摩托车和其他类型的车辆。

了解如何使用 Azure 机器学习中的开源框架将迁移学习应用于图像分类:使用迁移学习训练深度学习 PyTorch 模型。

深度学习用例

由于人工神经网络结构,深度学习擅长识别图像、声音、视频和文本等非结构化数据中的模式。因此,深度学习正在迅速改变许多行业,包括医疗保健、能源、金融和交通运输。这些行业现在正在重新思考传统的业务流程。

以下段落描述了深度学习的一些最常见的应用。在 Azure 机器学习中,可以使用从开源框架构建的模型,也可以使用提供的工具构建模型。

命名实体识别

命名实体识别是一种深度学习方法,它将一段文本作为输入并将其转换为预先指定的类。这些新信息可以是邮政编码、日期、产品 ID。然后可以将信息存储在结构化模式中以构建地址列表或用作身份验证引擎的基准。

物体检测

深度学习已应用于许多对象检测用例。目标检测包括两部分:图像分类和图像定位。图像 分类 识别图像的对象,例如汽车或人。图像 本土化 提供这些对象的具体位置。

物体检测已经应用于游戏、零售、旅游和自动驾驶汽车等行业。

图像标题生成

与图像识别一样,在图像字幕中,对于给定的图像,系统必须生成描述图像内容的字幕。当您可以检测并标记照片中的对象时,下一步是将这些标签转化为描述性句子。

通常,图像字幕应用程序使用卷积神经网络来识别图像中的对象,然后使用循环神经网络将标签转换为一致的句子。

机器翻译

机器翻译将一种语言的单词或句子自动翻译成另一种语言。机器翻译已经存在很长时间了,但深度学习在两个特定领域取得了令人印象深刻的成果:文本自动翻译(以及语音到文本的翻译)和图像自动翻译。

通过适当的数据转换,神经网络可以理解文本、音频和视觉信号。机器翻译可用于识别较大音频文件中的声音片段,并将口头单词或图像转录为文本。

文本分析

基于深度学习方法的文本分析涉及分析大量文本数据(例如医疗文件或费用收据)、识别模式并从中创建有组织且简洁的信息。

公司使用深度学习进行文本分析,以检测内幕交易和政府法规的遵守情况。另一个常见的例子是保险欺诈:文本分析通常用于分析大量文档,以识别保险索赔欺诈的可能性。

人工神经网络

人工神经网络由层层连接的节点组成。深度学习模型使用具有大量层的神经网络。

以下部分探讨了最流行的人工神经网络类型。

前馈神经网络

前馈神经网络是最简单的人工神经网络类型。在前馈网络中,信息仅沿一个方向从输入层移动到输出层。前馈神经网络通过一系列隐藏层来转换输入。每一层都由一组神经元组成,每一层都与前一层的所有神经元全连接。最后一个全连接层(输出层)表示生成的预测。

循环神经网络(RNN)

循环神经网络是一种广泛使用的人工神经网络。这些网络保存层的输出并将其反馈到输入层以帮助预测该层的结果。循环神经网络具有很强的学习能力。它们广泛用于复杂的任务,例如时间序列预测、学习手写和识别语言。

卷积神经网络(CNN)

卷积神经网络是一种特别有效的人工神经网络,它呈现出独特的架构。层按三个维度组织:宽度、高度和深度。一层中的神经元并不连接到下一层中的所有神经元,而仅连接到该层神经元的一小部分区域。最终输出被简化为沿深度维度组织的概率分数的单个向量。

卷积神经网络已应用于视频识别、图像识别和推荐系统等领域。

生成对抗网络(GAN)

生成对抗网络是经过训练可以创建图像等真实内容的生成模型。它由称为生成器和鉴别器的两个网络组成。两个网络同时训练。在训练过程中,生成器使用随机噪声来创建与真实数据非常相似的新合成数据。鉴别器将生成器的输出作为输入,并使用真实数据来确定生成的内容是真实的还是合成的。每个网络都在相互竞争。生成器试图生成与真实内容无法区分的合成内容,鉴别器试图将输入正确分类为真实内容或合成内容。然后,输出用于更新两个网络的权重,以帮助它们更好地实现各自的目标。

生成对抗网络用于解决图像到图像转换和年龄进展等问题。

变形金刚

Transformer 是一种模型架构,适合解决包含文本或时间序列数据等序列的问题。它们由编码器层和解码器层组成。编码器接受输入并将其映射到包含上下文等信息的数字表示。解码器使用来自编码器的信息来生成输出,例如翻译后的文本。 Transformer 与其他包含编码器和解码器的架构的不同之处在于注意力子层。注意力是根据输入的特定部分相对于序列中其他输入的上下文的重要性来关注输入的特定部分的想法。例如,在总结一篇新闻文章时,并非所有句子都与描述主要思想相关。通过关注整篇文章的关键词,可以用一句话(标题)来完成总结。

Transformer 已用于解决自然语言处理问题,例如翻译、文本生成、问答和文本摘要。

变压器的一些著名的实现是:

  • Transformer 的双向编码器表示 (BERT)
  • 生成式预训练 Transformer 2 (GPT-2)
  • 生成式预训练 Transformer 3 (GPT-3)

下一步

以下文章向您展示了在 Azure 机器学习中使用开源深度学习模型的更多选项: