工业 4.0 术语

什么是模型训练?

机器学习训练模型是一个为机器学习 (ML) 算法提供足够的训练数据以供学习的过程。

机器学习模型可以通过多种方式进行训练,从而使制造流程受益。机器学习模型处理大量数据的能力可以帮助制造商识别异常并测试相关性,同时在数据源中搜索模式。它可以为制造商提供预测性维护能力,并最大限度地减少计划内和计划外停机时间。

什么是机器学习中的模型训练?

训练模型是用于训练 ML 算法的数据集。它由样本输出数据和对输出有影响的相应输入数据集组成。训练模型用于通过算法运行输入数据,以将处理后的输出与样本输出相关联。该相关性的结果用于修改模型。

这个迭代过程称为“模型拟合”。训练数据集或验证数据集的准确性对于模型的精度至关重要。

机器语言模型训练是向机器学习算法提供数据的过程,以帮助识别和学习所有涉及属性的良好值。机器学习模型有多种类型,其中最常见的是监督学习和无监督学习。

当训练数据包含输入值和输出值时,监督学习是可能的。每组具有输入和预期输出的数据称为监控信号。当输入输入模型时,训练是根据处理结果与记录结果的偏差来完成的。

无监督学习涉及确定数据中的模式。然后使用附加数据来拟合模式或聚类。这也是一个迭代过程,可根据与预期模式或聚类的相关性来提高准确性。此方法中没有参考输出数据集。

创建机器学习模型

创建机器学习模型涉及 7 个主要步骤。以下是每个步骤的简要概述:

定义问题

定义问题陈述是确定 ML 模型应实现的目标的第一步。此步骤还能够识别适当的输入及其各自的输出;诸如“主要目标是什么?”、“输入数据是什么?”之类的问题。以及“模型试图预测什么?”必须在这个阶段回答。

数据采集

定义问题陈述后,有必要调查和收集可用于为机器提供数据的数据。这是创建机器学习模型过程中的一个重要阶段,因为所使用数据的数量和质量将决定模型的有效性。数据可以从预先存在的数据库中收集,也可以从头开始构建

准备数据

数据准备阶段是根据需要对数据进行分析、格式化和结构化,为训练模型做好准备。这是选择适当的数据特征和属性的阶段。这个阶段很可能对执行时间和结果产生直接影响。这也是数据被分为两组的阶段——一组用于训练 ML 模型,另一组用于评估模型。在此阶段还对数据进行标准化、消除重复和纠错等预处理。

分配适当的模型/协议

必须根据机器学习模型要实现的目标来选择和分配模型或协议。有多种模型可供选择,例如线性回归、k 均值和贝叶斯模型。模型的选择很大程度上取决于所使用的数据类型。例如,图像处理卷积神经网络将是理想的选择,而 k 均值最适合分割。

训练机器模型或“模型训练”

这是通过输入数据集来训练机器学习算法的阶段。这是学习发生的阶段。一致的训练可以显着提高ML模型的预测率。模型的权重必须随机初始化。这样算法将学会相应地调整权重。

评估和定义成功的衡量标准

机器模型必须根据“验证数据集”进行测试。这有助于评估模型的准确性。根据模型的预期目标来确定成功的衡量标准对于证明相关性至关重要。

参数调整

选择将被修改以影响机器学习模型的正确参数是获得准确相关性的关键。根据对模型架构的影响选择的参数集称为超参数。通过调整模型来识别超参数的过程称为参数调整。相关参数应以验证收益递减点尽可能接近 100% 准确度的方式明确定义。

训练机器学习模型需要多长时间?

训练 ML 模型没有明确的周期或前缀的迭代集。影响训练持续时间的因素可能是训练数据的质量、成功衡量标准的正确定义以及模型选择的复杂性。训练方法、权重分配和模型复杂性等因素也发挥着重要作用。与数据或模型无关的其他因素(例如计算能力和技能资源)也会对训练持续时间产生影响。由于影响模型持续时间的参数数量太多,因此优化训练模型始终存在一定的空间。

制造商如何使用机器学习?

在工厂中使用 Oden Industrial Analytics 就像拥有整个数据科学、IT、商业智能团队全天候 24/7 工作一样,以提高 OEE。我们为制造商构建的交钥匙机器学习模型和数据基础设施使他们能够在几天而不是几年内获得机器学习和工业分析的好处。