Hands-On Machine Learning (Volume 1)
Aurélien Géron · 2019
被种草许久、广受赞誉的机器学习蜥蜴书——来自业界大佬 Aurélien Géron 编著的 Hands-On Machine Learning 实用指南,读过了才知道是真的香。
利用寒假的闲余,读完了上册,内容主要是基于 Scikit-Learn 库来实现的统计学习算法。尽管暂时还没有开启讲神经网络/深度学习的下册,已然让我感到收获颇丰。
这套机器学习教材非常注重应用性,每个章节的推进非常短平快,针对算法原理的介绍一般给出大致的思路框架和重要结论,并不拘泥于数学推导的细节,作者都是尽可能地第一时间把读者带入具体的实例来操练。在介绍如何调用强大的 Scikit-Learn 来调用这些算法处理数据集时,作者对模型训练过程中常见的典型问题也给出了很具有实战价值的技巧和解决方案。
对我而言,去年在 Coursera 上跟完了由华盛顿大学夫妻档教授 Carlos Guestrin 和 Emily Fox(发帖前随手查到这对大牛夫妻现已跳槽去 Stanford 任教了)开设的系列机器学习课程,其中学到的关于诸如 linear regression、ridge/lasso regularisation、logistic regression、decision tree、tree ensembles、K-means、Gaussian mixture model 等等常见的机器学习算法,在蜥蜴书的上册中也是少不了的。这些模型在即将从我大脑皮层中淡化之际,通过阅读蜥蜴书又使我重新唤醒了记忆。公开课里更偏理论原理的课程设置,和蜥蜴书更偏重实战的手把手示例,又形成了很好的互补。跟着蜥蜴书走下来,有了一种自己也能站起来撸一撸什么数据集整点活的迷之自信了。
此外,Aurélien Géron 非常业界良心地在 GitHub 上放出了和蜥蜴书每个章节对应的全套 Jupyter Notebooks,即便只是下载这堆 Notebooks 一路无脑运行一遍,也能学到不少东西,配合大佬的书当然是服用效果更佳。
如果我的精力和智力还允许,力争今年剩下的10来个月能摸完下册,在滚滚人工智能技术快速发展的浪潮中,中老年人争取努力跟一跟时代的潮流。