介绍
过去几年对于人工智能从业者来说就像坐过山车。如果您正在考虑进入该领域,那么这个博客适合您。
我们每月提供一份路线图,并附加所有必要的免费资源。如果你遵循这个行动计划,你就会清楚地了解这个领域的意义。您将遇到您应该面对的所有挑战,并学会(靠您自己)克服它们。这条路径还将测试您对该领域的热情,并将回答您对机器学习 (ML) 是否适合您的所有疑问。
免责声明: 旅程并不容易。但如果你坚持下去,回报是巨大的! 😁
先决条件
在我们开始之前,是时候回顾一下一些事情了。如果先决条件看起来令人难以承受,您可以跳到路线图并同时学习它们。
结石
最低限度是要充分理解链式法则以及使用衍生品的一般原因。
资源
从基础开始进行总体演算
链式法则
为什么使用衍生品
线性代数
向量的矩阵乘法和转置的基础知识。
资源
矩阵乘法
矩阵转置
统计数据
对假设检验、中心极限定理和数据分布类型等一些概念的总体概述对于顺利开始至关重要。您可以使用下面提到的任一资源。
资源
Python
循环、函数调用、处理 NumPy、Pandas 和 MatPlotLib 等基本功能是必要的。不过,如果您对 Python 很陌生,您可以在我们浏览路线图时即时学习它。可以从 StackOverflow 谷歌搜索代码块(需要时),所以没有问题!
设定每月目标
总体的目标
对不同的 ML 算法有非常详细的了解
能够轻松实现所有这些
参加 ML 黑客马拉松
回馈 ML 社区
整个计划是让自己在第一遍中熟悉所有关键词,并在我们继续进行的过程中慢慢调整你的理解。在开始之前,我们将引用吴恩达的话。
“如果你现在什么都不明白,别担心。”
一月和二月
我们建议您从下面提到的资源开始学习机器学习。选择一个适合您的播放列表,并使用其他两个作为相同概念的参考。请务必做好笔记。您稍后会需要它们。相信我们!
不能一次性理解所有这些事情是很自然的。尽管继续。您可以轻松浏览一些概念,但一定要完成播放列表并继续做笔记!
资源
行进
是时候深入研究了!回去通过你的 笔记 并尝试去理解所有的 数学 详细。尝试理解每个算法的设计原因。交叉质疑每个概念并说服自己为什么它们有效。我们还建议您阅读博客、论文或查看其他视频以更深入地了解(这里是 Shanmukha Sainath 的补充资源列表)
免责声明: Medium 和 TowardsDataScience 上有许多博客,但他们不知道自己在谈论什么。远离此类在线内容。
四月
到目前为止,您应该对背景概念有很好的理论理解。
是时候动手了!
仅学习概念对你没有帮助。您需要学习如何实施它们。对模型进行编码最终将使您有足够的信心对新数据集提出自己的想法。
回到你的笔记,拿起你遇到的所有算法并实现它们。您可以下载两个数据集,一个用于分类,一个用于回归。保持这些数据集相同,您可以尝试不同的模型,看看它们在您所需的评估指标上的表现如何。这听起来可能令人难以承受,但如果您修复数据集,每个模型只需进行几行更改即可。 Scikit learn 和 python 让我们变得如此简单!我们鼓励您自行尝试在线提供的不同实施方案。谷歌搜索也是一门需要学习的重要艺术! 😁
资源
数据集
可能
是时候测试一下你所学的内容了。最好的方法是参加机器学习黑客马拉松。
但不是在现场黑客马拉松上!
你需要做什么
随机选择一场已结束的比赛
检查它是否有可供您使用的数据集
阅读问题陈述
尝试自己解决
提交一些解决方案并检查您在排行榜上的位置
查看获奖者笔记本,研究它们,看看获奖者如何编写代码。他们使用什么功能,使用什么模型!
与您的方法进行比较
在最初的几次尝试中,您可能不会获得很好的分数,但是您遵循的笔记本越多,您就会越了解 ML 从业者编写代码的方式存在一种模式。明白这一点,你就可以开始了。
资源
STD 药物有效性 ML 预测挑战(Hackerearth)
Jantahack:医疗保健分析 II (AnalyticsVidhya)
六月和七月
现在是时候参加现场黑客马拉松并赢得一些现金奖励了!你可以这样做!一切顺利。
作者的注释: 首先尝试参加简短的比赛。简短的内容可以提高您的快速思维能力和执行速度。你需要在短时间内探索更多的问题,因此给出了建议。
资源
奖金回合
我们承认,如此严格的学习确实会让你精疲力竭。毕竟,我们已经去过那里了。但是,让自己不断前进的一种方法是寻找灵感,看看 ML 可能带来的所有无穷无尽的应用。为此,请确保使用以下资源:
结论
本博客假设您每天花大约 8 小时来学习这些概念。您始终可以根据可用带宽自由调整例程,但这大致是初学者应该如何进入该领域。
请记住,第一阶段的旅程可能会有点困难,但随着事情开始深入,你就会开始享受!
一切顺利!快乐学习! ✌