插图来源 rawpixels.com
机器学习面试主题备忘单
Aqeel Anwar
The Startup
·
出版于
·
5 分钟阅读2020 年 10 月 28 日

--

更新:

2021 年 12 月 25 日:添加自动编码器和变分编码器

2020 年 12 月 25 日:添加了集成方法

从 http://cheatsheets.aqeel-anwar.com/ 下载备忘单的更新版本

几年前,我开始申请机器学习和机器学习系统设计领域的实习机会。那时我已经在机器学习领域学习并积极研究了几年。我熟悉大多数基本主题。但当我开始面试时,我意识到虽然我对这些话题有了大致的了解,但我需要快速浏览一遍才能完美回答。

所以我决定刷新一下我的观念。我意识到在每次采访之前,我都需要再次回顾这些话题。所以,我创建了我的手写笔记。浏览它们比浏览幻灯片和书籍章节容易得多。它使我在短时间内快速提高了我的理解力。我决定将我的手写笔记转换成紧凑的备忘单,这可能会在机器学习面试和数据科学家的日常生活中派上用场。

本文的其余部分基于这些备忘单。对于每个主题,我提供

  • 以备忘单形式进行概述
  • 面试问题示例
  • 详细了解该主题的建议文章。

注1: 这些备忘单旨在刷新概念,并不旨在为初学者提供对主题的深入理解。

笔记2: 该文章不断更新以获取更多备忘单。

来源: 所有这些备忘单(以及更多)都可以以 pdf 格式下载: www.cheatsheets.aqeel-anwar.com

机器学习模型中的偏差和方差

一)概述:

偏差-方差权衡备忘单 — 图片由作者提供

b) 示例问题:

  1. 什么是机器学习模型中的偏差?
  2. 什么是机器学习模型中的方差?
  3. 偏差和方差之间的权衡是什么?
  4. 高偏差/高方差 ML 模型有哪些缺点?
  5. 如何根据训练数据大小选择模型(高偏差或高方差)?

c) 详细文章:

机器学习中的不平衡数据

一)概述:

分类中的数据不平衡 — 作者图片

b) 示例问题:

  1. 什么是分类数据不平衡?
  2. 准确性是一个很好的性能指标吗?它什么时候无法捕获机器学习系统的性能?
  3. 什么是精确率和召回率?举个例子
  4. 如何解决数据不平衡的问题?

c) 详细文章:

贝叶斯定理

一)概述:

贝叶斯定理和分类器 — 作者图片

b) 示例问题:

  1. 什么是贝叶斯定理?
  2. 实施贝叶斯定理的玩具示例
  3. MLE 和 MAP 有什么区别?
  4. MAP 和 MLE 什么时候相等?

c) 详细文章:

主成分分析和降维

一)概述:

PCA 和降维 — 作者图片

b) 示例问题:

  1. 什么是主成分分析?
  2. 我们如何使用PCA来降维?
  3. 特征值在 PCA 中意味着什么? (特征值的大小越大,如果我们将相应的特征向量保留为数据的特征向量,则保留的信息就越多)

c) 详细文章:

机器学习中的回归

一)概述:

回归分析 — 作者图片

b) 示例问题:

  1. 什么是机器学习中的回归?
  2. 我们如何在回归中引入正则化? (套索和岭)
  3. LASSO和岭回归对模型的权重有什么影响? (Ridge 尝试减小所学习权重的大小,而 LASSO 尝试强制它们为零,从而创建更稀疏的权重集)
  4. 贝叶斯线性回归的预测何时接近线性回归的预测? (当数据点数量足够多时)
  5. 逻辑回归是用词不当吗? (是的,因为不是回归,而是基于回归的分类)

c) 详细文章:

机器学习中的正则化

一)概述:

机器学习中的正则化 — 作者图片

b) 示例问题:

  1. 什么是机器学习中的正则化?
  2. 我们如何解决过度拟合问题?
  3. 什么是K折交叉验证?
  4. L1 和 L2 正则化有什么区别?
  5. 为什么我们要使用dropout?

c) 详细文章:

卷积神经网络基础知识

一)概述:

卷积神经网络 — 作者图片

b) 示例问题:

  1. 什么是美国有线电视新闻网?
  2. 解释一下卷积层和转置卷积层的区别。
  3. 用于分类的损失函数有哪些?

c) 详细文章:

机器学习领域著名的 DNN

一)概述:

著名的 CNN — 作者图片

b) 示例问题:

  1. ResNet网络如何解决梯度消失问题?
  2. Inception Network 的主要关键特征之一是什么?
  3. ResNet网络中的快捷连接是什么?

c) 详细文章:

机器学习中的集成方法

一)概述:

b) 示例问题:

  1. 什么是集成学习?
  2. ML 中的 bagging、boosting 和 stacking 是什么?
  3. bagging 和 boosting 有什么区别?
  4. 列举几种提升方法

c) 详细文章:

自动编码器和变分自动编码器

一)概述:

b) 示例问题:

  1. 什么是自动编码器?
  2. 自动编码器的潜在空间是否正则化?
  3. 变分自动编码器的损失函数是什么?
  4. 自动编码器和变分自动编码器有什么区别?

c) 详细文章:

概括

本文提供了一份备忘单列表,涵盖了机器学习面试的重要主题,并附有一些示例问题。主题列表和备忘单数量不断添加到文章中。

如果本文对您有帮助,欢迎点赞、分享、回复。如果你想了解更多关于机器学习和数据科学的知识,请关注我@阿基尔·安瓦尔 或与我联系 领英