机器学习面试主题备忘单
·
出版于
·
5 分钟阅读
2020 年 10 月 28 日--
更新:
2021 年 12 月 25 日:添加自动编码器和变分编码器
2020 年 12 月 25 日:添加了集成方法
从 http://cheatsheets.aqeel-anwar.com/ 下载备忘单的更新版本
几年前,我开始申请机器学习和机器学习系统设计领域的实习机会。那时我已经在机器学习领域学习并积极研究了几年。我熟悉大多数基本主题。但当我开始面试时,我意识到虽然我对这些话题有了大致的了解,但我需要快速浏览一遍才能完美回答。
所以我决定刷新一下我的观念。我意识到在每次采访之前,我都需要再次回顾这些话题。所以,我创建了我的手写笔记。浏览它们比浏览幻灯片和书籍章节容易得多。它使我在短时间内快速提高了我的理解力。我决定将我的手写笔记转换成紧凑的备忘单,这可能会在机器学习面试和数据科学家的日常生活中派上用场。
本文的其余部分基于这些备忘单。对于每个主题,我提供
- 以备忘单形式进行概述
- 面试问题示例
- 详细了解该主题的建议文章。
注1: 这些备忘单旨在刷新概念,并不旨在为初学者提供对主题的深入理解。
笔记2: 该文章不断更新以获取更多备忘单。
来源: 所有这些备忘单(以及更多)都可以以 pdf 格式下载: www.cheatsheets.aqeel-anwar.com。
机器学习模型中的偏差和方差
一)概述:
b) 示例问题:
- 什么是机器学习模型中的偏差?
- 什么是机器学习模型中的方差?
- 偏差和方差之间的权衡是什么?
- 高偏差/高方差 ML 模型有哪些缺点?
- 如何根据训练数据大小选择模型(高偏差或高方差)?
c) 详细文章:
机器学习中的不平衡数据
一)概述:
b) 示例问题:
- 什么是分类数据不平衡?
- 准确性是一个很好的性能指标吗?它什么时候无法捕获机器学习系统的性能?
- 什么是精确率和召回率?举个例子
- 如何解决数据不平衡的问题?
c) 详细文章:
贝叶斯定理
一)概述:
b) 示例问题:
- 什么是贝叶斯定理?
- 实施贝叶斯定理的玩具示例
- MLE 和 MAP 有什么区别?
- MAP 和 MLE 什么时候相等?
c) 详细文章:
主成分分析和降维
一)概述:
b) 示例问题:
- 什么是主成分分析?
- 我们如何使用PCA来降维?
- 特征值在 PCA 中意味着什么? (特征值的大小越大,如果我们将相应的特征向量保留为数据的特征向量,则保留的信息就越多)
c) 详细文章:
机器学习中的回归
一)概述:
b) 示例问题:
- 什么是机器学习中的回归?
- 我们如何在回归中引入正则化? (套索和岭)
- LASSO和岭回归对模型的权重有什么影响? (Ridge 尝试减小所学习权重的大小,而 LASSO 尝试强制它们为零,从而创建更稀疏的权重集)
- 贝叶斯线性回归的预测何时接近线性回归的预测? (当数据点数量足够多时)
- 逻辑回归是用词不当吗? (是的,因为不是回归,而是基于回归的分类)
c) 详细文章:
机器学习中的正则化
一)概述:
b) 示例问题:
- 什么是机器学习中的正则化?
- 我们如何解决过度拟合问题?
- 什么是K折交叉验证?
- L1 和 L2 正则化有什么区别?
- 为什么我们要使用dropout?
c) 详细文章:
卷积神经网络基础知识
一)概述:
b) 示例问题:
- 什么是美国有线电视新闻网?
- 解释一下卷积层和转置卷积层的区别。
- 用于分类的损失函数有哪些?
c) 详细文章:
机器学习领域著名的 DNN
一)概述:
b) 示例问题:
- ResNet网络如何解决梯度消失问题?
- Inception Network 的主要关键特征之一是什么?
- ResNet网络中的快捷连接是什么?
c) 详细文章:
机器学习中的集成方法
一)概述:
b) 示例问题:
- 什么是集成学习?
- ML 中的 bagging、boosting 和 stacking 是什么?
- bagging 和 boosting 有什么区别?
- 列举几种提升方法
c) 详细文章:
自动编码器和变分自动编码器
一)概述:
b) 示例问题:
- 什么是自动编码器?
- 自动编码器的潜在空间是否正则化?
- 变分自动编码器的损失函数是什么?
- 自动编码器和变分自动编码器有什么区别?
c) 详细文章:
概括本文提供了一份备忘单列表,涵盖了机器学习面试的重要主题,并附有一些示例问题。主题列表和备忘单数量不断添加到文章中。
如果本文对您有帮助,欢迎点赞、分享、回复。如果你想了解更多关于机器学习和数据科学的知识,请关注我@阿基尔·安瓦尔 或与我联系 领英。