雷锋网旗下 AI 研习社定期整理国内外 AI 开发相关的技术资讯、学习资料以及开发博客等内容。欢迎投稿,投稿邮箱:zhangxian@leiphone.com。

Jason Brownlee 的时间序列预测教程

这是澳大利亚机器学习专家 Jason Brownlee 撰写的教程,提供了一套用 Python 语言处理时间序列预测问题的模板。该教程一步步向读者展示了应该用什么工具、如何操作,以及为什么这样操作。它使用了波士顿持械抢劫案数量作为案例,旨在解决的问题是对波士顿未来每月抢劫案的数量做合理预测。 全文包含代码长达两万字,是迄今为止最权威、最详细的时间序列预测入门教程之一。具有相当学习价值。

译文地址:
http://www.leiphone.com/news/201702/QjrKc9cLWAiqRGhT.html

机器学习算法实践之 K 均值聚类的实用技巧

大家一定都知道吴恩达老师在 Coursera 讲授的机器学习课程。美国数据分析专家 Bilal Mahmood,把吴恩达老师课程中对 K 均值聚类算法的介绍做了整理总结,再加入他自己的经验写就本文,教大家如何使用聚类分析对数据自动分段。文章分为两部分:一是对 K 均值聚类算法做综合介绍,二是讲述该算法的主要实战技巧(讨论的重点问题是:应该用多少组簇?)。对于研究聚类问题的开发者具有很高价值。

译文地址:
http://www.leiphone.com/news/201702/SPMC0IPBy37vJgqU.html

OpenAI:如何解决对抗样本带来的安全风险

这是大牛 Ian Goodfellow 等在 OpenAI 博客发表的文章,专门讨论“对抗样本”这一话题。由于能使大多数机器学习算法瘫痪,本文讨论了对抗样本带来的 AI 潜在安全风险,如何解决,并盘点了对付对抗样本的几种主要途径。其中,本文在技术层面详细探讨了为什么 gradient masking 方法无法解决对抗样本问题。

自然语言处理入门:在数据预处理阶段如何发现 Lexical Units

这是 DataScience.com 自然语言处理入门系列文章的第一弹。本系列将介绍自然语言处理的核心概念、核心难题与挑战,以及主流解决方案。作为该系列的第一篇,文章开头介绍自然语言处理的技术和应用,随机进入技术环节讨论 Lexical Units;尤其是 tokenization 和 normalization 的实现方法。适合 NLP 领域开发者。

雷锋网将为大家奉上后续教程。

SVDS:如何选择深度学习框架?

Silicon Valley Database 的研究团队,归纳总结了七大主流深度学习平台框架各自的特性以及优缺点。这些框架包括:TensoFlow,Theano,Torch,Caffe,MXNet,Neon 和 CNTK。该文章旨在为新入门的深度学习开发者提供“应该选择哪个框架?”的指导。更多关于开源框架、工具如何选择的问题,请参考雷锋网系列文章:Tensorflow 全网最全学习资料汇总之框架平台的综合对比【3】,盘点四大民间机器学习开源框架:Theano、Caffe、Torch 和 SciKit-learn,谷歌、微软、OpenAI 等巨头的七大机器学习开源项目 看这篇就够了 。

原文链接:
http://svds.com/getting-started-deep-learning/