机器学习提示和技巧备忘单

想要更多这样的内容吗？在此订阅以获取新版本通知！

CS 229 - 机器学习



机器学习提示和技巧备忘单

作者：阿夫辛·阿米迪和谢尔文·阿米迪

分类指标

在二元分类的背景下，为了评估模型的性能，需要跟踪以下主要指标。

混淆矩阵混淆矩阵用于在评估模型的性能时获得更完整的了解。它的定义如下：

预料到的班级
+	-
实际的班级	+	TP 真正的积极因素	纤维网假阴性 II 类错误
实际的班级	-	FP 误报 I 类错误	总氮真阴性

/div>

br/>

p>主要指标以下指标通常用于评估分类模型的性能：

/p>

分区>

公制	公式	解释
准确性	$\displaystyle\frac{\textrm{TP}+\textrm{TN}}{\textrm{TP}+\textrm{TN}+\textrm{FP}+\textrm{FN}}$	模型整体性能
精确	$\displaystyle\frac{\textrm{TP}}{\textrm{TP}+\textrm{FP}}$	积极预测的准确度如何
记起灵敏度	$\displaystyle\frac{\textrm{TP}}{\textrm{TP}+\textrm{FN}}$	实际正样本覆盖率
特异性	$\displaystyle\frac{\textrm{TN}}{\textrm{TN}+\textrm{FP}}$	实际负样本覆盖率
F1成绩	$\displaystyle\frac{2\textrm{TP}}{2\textrm{TP}+\textrm{FP}+\textrm{FN}}$	混合指标对于不平衡类很有用

/div>

br/>

p>ROC 接收者操作曲线（也称为 ROC）是通过改变阈值绘制的 TPR 与 FPR 的关系图。这些指标总结如下表：

/p>

分区>

公制	公式	相等的
真阳性率热塑性弹性体	$\displaystyle\frac{\textrm{TP}}{\textrm{TP}+\textrm{FN}}$	召回率、灵敏度
误报率 FPR	$\displaystyle\frac{\textrm{FP}}{\textrm{TN}+\textrm{FP}}$	1-特异性

/div>

br/>

p>AUC 接收操作曲线下面积，也称为 AUC 或 AUROC，是 ROC 下方的面积，如下图所示：

/p>

br/>

分区>

/div>

br/>

H2>

回归指标

/h2>

p>基本指标给定一个回归模型$f$，以下指标通常用于评估模型的性能：

/p>

分区>

总平方和	平方和的解释	残差平方和
$\displaystyle\textrm{SS}_{\textrm{tot}}=\sum_{i=1}^m(y_i-\overline{y})^2$	$\displaystyle\textrm{SS}_{\textrm{reg}}=\sum_{i=1}^m(f(x_i)-\overline{y})^2$	$\displaystyle\textrm{SS}_{\textrm{res}}=\sum_{i=1}^m(y_i-f(x_i))^2$

/中心>

中心>

/表>

表>

/colgroup>

正文>

/tbody>

科尔组>

列宽度=“50%”/>

TR>

/tr>

TR>

/tr>

td 对齐=“中心”>

套索

/td>

td 对齐=“中心”>

岭

/td>

td 对齐=“中心”>

弹性网

/td>

tdalign="left">• 将系数缩小到 0

• 适合变量选择

/td>

tdalign="left">使系数更小

/td>

tdalign="left">变量选择和小系数之间的权衡

/td>

td 对齐=“中心”>

/td>

td 对齐=“中心”>

/td>

td 对齐=“中心”>

/td>

tdalign=“左”>$...+\lambda||\theta||_1$

$\lambda\in\mathbb{R}$

/td>

tdalign=“左”>$...+\lambda||\theta||_2^2$

$\lambda\in\mathbb{R}$

/td>

tdalign="left">$...+\lambda\Big[(1-\alpha)||\theta||_1+\alpha||\theta||_2^2\Big]$

$\lambda\in\mathbb{R},\alpha\in[0,1]$

/td>

b>欠拟合

/b>

b>刚刚好

/b>

b>过拟合

/b>

b>症状

/b>

br/>• 训练误差接近测试误差

br/>• 高偏差

br/>• 训练误差远低于测试误差

br/>• 高方差

b>回归图解

/b>

b>分类图解

/b>

b>深度学习插画

/b>

b>可能的补救措施

/b>

br/>• 添加更多功能

br/>• 训练时间更长

br/>• 获取更多数据

锦葵的cp	航空工业协会	商业银行	调整后$R^2$
$\displaystyle\frac{\textrm{SS}_{\textrm{res}}+2(n+1)\widehat{\sigma}^2}{m}$	$\displaystyle2\Big[(n+2)-\log(L)\Big]$	$\displaystyle\log(m)(n+2)-2\log(L)$	$\displaystyle1-\frac{(1-R^2)(m-1)}{m-n-1}$
训练集	验证集	测试装置
• 模型经过训练 • 通常为数据集的 80%	• 评估模型 • 通常为数据集的 20% • 也称为保留或开发集	• 模型给出预测 • 看不见的数据
k 倍	留出	• 对 $k-1$ 折叠进行训练并对剩余折叠进行评估 • 通常$k=5$ 或$10$	• 对$n-p$ 观察结果进行培训并对剩余的$p$ 观察结果进行评估 • 情况 $p=1$ 称为留一法

误差分析误差分析是分析当前模型与完美模型性能差异的根本原因。

烧蚀分析烧蚀分析正在分析当前模型与基线模型之间性能差异的根本原因。

机器学习提示和技巧备忘单

分类指标

扩大您的在线影响力：2023 年推动成功的十大人工智能网站建设者

扩大您的在线影响力：2023 年推动成功的十大人工智能网站建设者

人工智能网站建设者

10 Top Open Source AI Platforms and Tools to Try Today

人工智能网站建设者

人工智能网站建设者

人工智能网站建设者

人工智能网站建设者

人工智能网站建设者

人工智能网站建设者

如何选择 Azure 机器学习算法

Windows 中终止对 Cortana 的支持

您的应用程序项目。 100% 透明度。

微软推出内置 ChatGPT 4.0 的新 Bing

什么是 ChatGPT

机器学习算法备忘单

如果您喜欢阅读本文，您可以通过点击下面的👏来贡献良好的氛围（并帮助更多的人发现这篇文章和我们的社区）——这意义重大！

简而言之，11 种最常见的机器学习算法

适合初学者的十大机器学习算法：监督等

机器学习算法快速列表

图片 AI 工具

游戏 AI 工具

视频 AI 工具

聊天 AI 工具

音频 AI 工具

AI 资讯

AI 教程

Prompt 词库