人工智能涵盖的范围非常广泛。您甚至可以将 Dijkstra 的最短路径算法视为人工智能。然而,人工智能的两类经常被混淆:机器学习和深度学习。这两者都指的是数据的统计建模以提取有用的信息或做出预测。在本文中,我们将列出这两种统计建模技术不同的原因,并帮助您进一步理解这些数据建模范例。
概述
机器学习是一种统计学习方法,其中数据集中的每个实例都由一组特征或属性来描述。相比之下,术语“深度学习”是一种从原始数据中提取特征或属性的统计学习方法。深度学习通过利用具有许多隐藏层、大数据和强大计算资源的神经网络来实现这一点。这些术语似乎在某种程度上可以互换,但是,通过深度学习方法,算法会自动构建数据的表示。相比之下,数据表示被硬编码为机器学习算法中的一组特征,需要进一步的处理,例如特征选择和提取(例如 PCA)。
这两个术语与另一类称为基于规则的系统的经典人工智能算法形成鲜明对比,其中每个决策都是以类似于统计模型的方式手动编程的。
在机器学习和深度学习中,有许多不同的模型分为两个不同的类别:监督模型和无监督模型。在无监督学习中,k-Means、层次聚类和高斯混合模型等算法尝试学习数据中有意义的结构。监督学习涉及与数据集中每个实例关联的输出标签。该输出可以是离散/分类或实值。回归模型估计实值输出,而分类模型估计离散值输出。简单的二元分类模型只有两个输出标签:1(正)和 0(负)。一些流行的监督学习算法被认为 机器学习: 包括线性回归、逻辑回归、决策树、支持向量机和神经网络,以及非参数模型,例如 k 最近邻。
数据大小
机器学习和深度学习都能够处理海量数据集,但是,机器学习方法对于小数据集更有意义。例如,如果您只有 100 个数据点,那么决策树、k 最近邻和其他机器学习模型对您来说比在数据上拟合深度神经网络更有价值。这是由于下一个差异主题,可解释性。
对深度学习方法和机器学习算法(例如支持向量机或(也许,因为您至少可以可视化构成输出的组成概率)朴素贝叶斯)的许多批评是由于它们难以解释。例如,当卷积神经网络在狗与猫的问题中输出“猫”时,似乎没有人知道它为什么这样做。相比之下,当您使用机器学习技术对电子健康记录或银行贷款数据集等数据进行建模时,更容易理解模型预测的推理。
可解释性的最佳示例之一是决策树,您可以在树的节点上遵循逻辑测试,直到做出决定。另一种具有高可解释性的机器学习算法是 k-Nearest Neighbors。这不是参数学习算法,但仍然属于机器学习算法的范畴。它非常具有可解释性,因为您可以轻松地为自己推理出类似的实例。
结论,上图是深度学习和机器学习区别的最好总结。一个具体的轶事是考虑原始数据形式,例如图像中的像素或音频中的正弦波。机器学习方法很难从这些数据中构建语义特征。因此,深度学习方法在这些模型中占主导地位。与经典机器学习方法相比,深度学习还存在更多细微差别和无法解释的现象。请告诉我这篇文章是否有助于您理解机器学习与深度学习的比较,感谢您的阅读!