在这篇小博客中,我将介绍从初级到高级掌握机器学习的完整路线图。

据我们所知 机器学习, 数据科学, 人工智能 这是当今的热门话题,但很少有人告诉您以简单的方式涵盖或学习一件事的确切路径。

所以这就是为什么我涵盖了成为一名 机器学习 专家。让我们开始吧。

你应该学习的第一件事是你已经掌握了Python Python 编程

然后完成后 Python 学习 电子设计自动化

探索性数据分析

探索性数据 分析 是一种方法 分析数据集 总结它们的主要特征,经常使用 统计图表 和其他数据 可视化 方法。我们可以说这是一种技术 分析 或者 可视化 以更有效的方式获取数据,从而使 有意义的。

Exploratory Data Analysis (EDA) With Variation And Covariation – Towards AI  — The Best of Tech, Science, and Engineering

现在来到 特征工程

特征工程:

特征工程 是利用领域知识通过数据挖掘技术从原始数据中提取特征的过程。这些功能可用于提高机器学习算法的性能。

在特征工程中你应该学习的技术是:

  1. 处理缺失值
  2. 处理异常值
  3. 分类编码
  4. 规范化和标准化

现在来到 特征选择

特征选择:

机器学习 统计数据, 特征选择,也称为变量选择、属性选择或变量子集选择,是选择相关子集的过程 特征 用于模型构建。简而言之,我们可以说为我们选择正确的功能 机器学习模型

您将涉及的主题 特征选择 是:

  1. 相关性
  2. 正向消除 或者 后向消除法
  3. 单变量选择
  4. 随机森林重要性
  5. 使用决策树进行特征选择

完成所有这些事情后来到 机器学习 部分

机器学习:

机器学习 是对通过经验和数据使用自动改进的计算机算法的研究。它被视为一部分 人工智能。

机器学习 我们必须解决两个问题 分类 或任一 回归问题 聚类。

您将涉及的算法 机器学习 是;

  1. 线性回归
  2. 岭回归和套索回归
  3. 逻辑回归
  4. 决策树
  5. 随机森林
  6. XGBoost
  7. 阿达助推器
  8. 梯度提升
  9. 猫助推器
  10. 光-Gbm

为了 聚类,你必须学习以下内容 算法:

  1. k-均值聚类
  2. 层次聚类
  3. 数据库扫描聚类
  4. 轮廓聚类

现在来到 超参数调优

超参数调优:

机器学习, 超参数优化 或者 调音 是选择一组最优的问题 超参数 为一个 学习 算法。 A 超参数 是一个参数,其值用于控制 学习 过程。相比之下,其他参数(通常是节点权重)的值是学习的。

学习的技术 超参数调整

  1. 网格搜索-cv
  2. 随机搜索-cv
  3. 超视
  4. 奥图纳
  5. 遗传算法

学习完所有这些技术后,现在是时候做一些真正的事情了 项目 然后将它们容器化 项目 在...的帮助下 码头工人库伯内斯。

码头工人:

码头工人 是一组平台即服务产品,它使用操作系统级虚拟化以称为容器的包形式交付软件。容器之间相互隔离,并捆绑自己的软件、库和配置文件;他们可以通过明确的渠道相互沟通。

库伯内特斯:

库伯内斯 是一个用于自动化计算机应用程序的开源容器编排系统 部署, 缩放, 和 管理。它最初的设计者是 谷歌 现在由 云原生计算 基础。

然后学习 部署 技术如何 部署 一个 毫升 项目 在云服务上,例如:

  1. AWS
  2. 蔚蓝
  3. GCP

这是完整的路径 掌握机器学习 从头到尾,希望这篇小文章可以帮助您实现您的目标。

祝你好运。