机器学习工程师的分步路线图

以下是如何从零知识开始并学习成为机器学习工程师所需技能的分步过程。请注意,这将为您奠定坚实的基础,在这 6 个月的旅程之后,您需要参与许多项目并获得额外的知识,才有资格成为机器学习工程师。

第 1、2、3、4 周

计算机科学校长

程序或代码在计算机上运行并使用CPU、RAM、输入/输出设备。这门可汗学院课程涵盖了计算机科学的所有这些基本原理。数据以位(1 和 0)形式存储在 RAM 和磁盘中。该课程还将介绍二进制数的基础知识。 在本课程中,仅遵循前 4 部分 (1) 数字信息 (2) 互联网 (3) 编程 (4) 算法 完成剩余部分是可选的,如果您有时间和兴趣,就可以完成。

在此阶段,您已准备好编写第一个程序并探索编码教程。这个想法是为了获得对编程的基本了解,例如变量、数据类型、文件操作等。

1 级编码教程

对于 python,我为绝对初学者构建了一个教程播放列表。手表 前 14 此播放列表中的教程。剩下的大家可以稍后观看。

我也有类似的印地语播放列表(以防万一您更喜欢印地语)

我在这里有很多有趣的练习及其解决方案:https://github.com/codebasics/py/tree/master/Basics/Hindi(文件夹名称是印地语,但练习适用于印地语和英语教程)

数据结构与算法

没有一次编程面试不询问数据结构和算法(又名 DSA)。 DSA 是任何程序的基本构建块(与哪种编程语言无关)。按照此播放列表可以清晰地了解您的数据结构和算法概念。

第 5、6 周

SQL 基础知识

无论您选择哪条职业道路,您都需要对关系数据库和 SQL(结构化查询语言)有很好的了解。以下是一些 SQL 课程链接。

对于上面的 kudavenkat 播放列表,如果您有兴趣更深入地了解 SQL,那么您可以观看 #12 之后的教程。

第 7、8 周

2 级编码教程

在此阶段,您已经了解了一些基本的编码、数据结构、SQL 等。您现在可以学习中级编码教程。这里有一些相同的在线资源,

第 9、10、11、12 周:Numpy、Pandas、数据可视化库

  • NumPy 和 Pandas

  • 可视化库

  • Kaggle探索性数据分析

第 13、14 周:机器学习的数学、统计学

  • 数据科学的数学和统计学
    • 统计书籍:《数据科学家实用统计:使用 R 和 Python 的 50 多个基本概念》作者:Peter Bruce、Andrew Bruce

第 15、16、17、18 周:机器学习

  • 机器学习
    • 数据科学回归项目:与上面相同的播放列表。教程 18 至 25

第 19、20、21、22 周:深度学习

  • 深度学习(人工神经网络、卷积神经网络、循环神经网络)

第 23、24 周:机器学习操作

您需要学习至少一种机器学习生命周期工具。 MLFlow 就是这样一种开源工具。请在 mlflow 官方网站上练习教程,以了解这些工具如何自动化机器学习生命周期。 https://www.mlflow.org/docs/latest/tutorials-and-examples/index.html#

会有帮助的额外技能

  • Pyspark、Hadoop、分布式计算
  • 码头工人
  • CI(持续集成)和 CD(持续交付)基础知识,Jenkins
  • 使用 Git 进行版本控制
  • FastApi、Tensorflow 服务:围绕经过训练的模型构建 http 服务器
  • NoSQL 数据库,例如 MongoDB

有用的提示

了解有效学习的原则

请观看此视频,了解如何有效学习,以便投入最少的时间获得最大的产出。

小组学习

小组学习总是比单独学习好。如果您知道有人也想学习编码,那么可以组建一个小组并开始一起学习。还要互相问责并互相讨论学习里程碑。您可以加入codebasics Discord服务器来寻找合作伙伴进行小组学习。

Discord 链接:https://discord.gg/r42Kbuk <-- 在此您将找到一个合作伙伴查找频道,您可以在其中找到志同道合的人,您可以与他们进行小组研究

遵守纪律,不放弃

学习编码,尤其是当你是新手时,有时会令人沮丧。每个优秀的程序员都经历过这种痛苦,所以如果你遇到问题,不要开始认为你不聪明,编码不是你的事。你需要有很大的耐心。当您来自非编码背景时,从编码角度思考是思维范式的重大转变,因此可能需要一些时间才能开始吸引您。