机器学习是当今数据分析领域最令人兴奋的职业的基础。您将学习模型和方法,并将其应用于现实世界的情况,从识别热门新闻主题到构建推荐引擎、对运动队进行排名以及绘制电影僵尸的路径。

涵盖的主要观点包括:

  • 概率建模与非概率建模
  • 监督学习与无监督学习

主题包括:分类和回归、聚类方法、顺序模型、矩阵分解、主题建模和模型选择。

方法包括:线性和逻辑回归、支持向量机、树分类器、Boosting、最大似然和 MAP 推理、EM 算法、隐马尔可夫模型、卡尔曼滤波器、k 均值、高斯混合模型等。

在课程的前半部分,我们将介绍回归和分类的监督学习技术。在这个框架中,我们拥有希望根据一组输入来预测的输出或响应。我们将讨论执行此任务的几种基本方法及其优化算法。我们的方法将更加注重实践,这意味着我们将充分发展对各个算法的数学理解,但我们只会简单地触及抽象学习理论。

在课程的后半部分,我们转向无监督学习技术。在这些问题中,最终目标不如根据相应输入预测输出那么明确。我们将讨论无监督学习的三个基本问题:数据聚类、矩阵分解和顺序相关数据的顺序模型。这些模型的一些应用包括对象推荐和主题建模。

乍看上去

  • 机构:ColumbiaX
  • 级别:高级
  • 先决条件:
    • 结石
    • 线性代数
    • 概率和统计概念
    • 编码和数据操作的舒适度
  • 英语语言
  • 视频文字:英文
  • 相关技能:隐马尔可夫模型、逻辑回归、机器学习、预测、K 均值聚类、支持向量机、监督学习、算法、Boosting、聚类分析、数学优化、数据分析、主题建模、矩阵分解、混合模型、无监督学习
  • 用于回归和分类的监督学习技术
  • 用于数据建模和分析的无监督学习技术
  • 概率观点与非概率观点
  • 模型学习的优化和推理算法

第一周: 最大似然估计、线性回归、最小二乘
第 2 周: 岭回归、偏差-方差、贝叶斯规则、最大后验推理
第 3 周: 贝叶斯线性回归、稀疏性、线性回归的子集选择
第 4 周: 最近邻分类、贝叶斯分类器、线性分类器、感知器
第 5 周: 逻辑回归、拉普拉斯近似、核方法、高斯过程
第 6 周: 最大边际、支持向量机、树木、随机森林、Boosting
第 7 周: 聚类、k 均值、EM 算法、缺失数据
第 8 周: 高斯混合、矩阵分解
第 9 周: 非负矩阵分解、潜在因子模型、PCA 和变体
第 10 周: 马尔可夫模型、隐马尔可夫模型
第 11 周: 连续状态空间模型、关联分析
第 12 周: 模型选择,后续步骤