3 机器学习简介

根据 Arthur Samuel(1959)的说法,ML 是一个研究领域,它赋予计算机无需明确编程的学习能力。因此,我们可以将 ML 定义为计算机科学领域,其中可以设计可以自行编程的机器 [20]。

学习的过程只是从以前的工作中的经验或观察(例如示例或指令)中学习,以寻找数据中的模式并在示例的帮助下,前提是系统可以做出更好的决策。机器学习的基本目标是使计算机在无需人工干预的情况下自动学习,并相应地调整执行操作[20,21]。

图 20.1 显示了 ML 的流程。过去的数据用来训练模型,然后这个训练好的模型用来测试新的数据,然后进行预测。使用过去可用数据的某些部分(训练期间不存在)来评估经过训练的 ML 模型的性能。这通常称为验证过程。在此过程中,将评估 ML 模型的性能指标,例如准确性。准确度以正确预测的特征数量与要预测的可用特征总数的比率来描述机器学习模型对未见过的数据的性能。

图 20.1。机器学习过程。

3.1 一些机器学习方法

ML算法可以分为监督学习和无监督学习:

(1)

有监督的 ML 算法是一种 ML 技术,可以根据之前学到的知识,使用标记数据获取新数据并预测未来事件或标签。在这种类型的学习中,监督者(标签)的存在是为了指导或纠正。对于第一次分析,使用学习算法预测已知的训练集,然后预测输出值。学习系统定义的输出可以与实际输出进行比较;如果发现错误,可以纠正它们并相应地修改模型[20]。

(2)

无监督机器学习算法:在这种类型中,没有监督者来指导或纠正。当存在未标记或未分类的信息来训练系统时,使用这种类型的学习算法。该系统没有定义正确的输出,但它以一种可以从数据集中得出推论(规则)的方式探索数据,并可以从未标记的数据中描述隐藏的结构[20-22]。

(3)

半监督机器学习算法是介于监督学习和无监督学习类别之间的算法。因此,此类学习算法同时使用未标记和标记数据进行训练,通常使用少量标记数据和大量未标记数据。此类方法用于提高学习的准确性[20-22]。

(4)

强化机器学习算法是一种根据系统执行的工作给予奖励或惩罚的学习方法。如果我们训练系统执行某项任务,但它没有做到这一点,系统可能会受到惩罚;如果表现完美,就会得到奖励。它通常作用于0和1,其中0表示惩罚,1表示奖励。

它的工作原理是,如果我们训练一只鸟或一只狗去做某项任务,而它完全按照我们的要求去做,我们就给它零食或它喜欢的食物,或者我们可能会表扬它。这是一种奖励。如果它没有很好地完成任务,它可能会受到我们的责骂作为惩罚。 [20-22]。