帮助我晋升为数据科学家的三本机器学习书籍

2025-05-28

帮助我晋升为数据科学家的三本机器学习书籍

日语中有一个词叫“tsundoku”(积ん読),意思是购买并保存越来越多的书籍,即使你实际上并没有读完它们。

我认为我们开发人员和数据科学家特别容易陷入这个陷阱。就我个人而言,我甚至会囤积书签:我手机的 Chrome 浏览器打开了太多标签页,计数器都换成了“:D”的表情符号。

我们大多数人都经历过那种阅读学习的热情,最终常常会迷失方向,不知道下一本书该读哪本。所以今天我给你一个简短的清单:只有3本机器学习书籍,这样你就不会只是把它加到书签里然后就忘了。

这些书在我作为数据科学家职业生涯的不同阶段都给了我极大的帮助,特别是在我作为机器学习工程师的角色中。

书来了!

O'Reilly:使用 Python 从头开始​​的数据科学

《从零开始用 Python 进行数据科学》一书封面

我将首先评论这本书,因为它是此列表中最具介绍性或最广泛的一本书。

我对这本书有着很深的感情,因为它让我得到了这份工作。没错!在读这本书之前,我对数据科学几乎一无所知,甚至不知道数据科学是什么。

我的概率论和统计学背景确实很强,而且 Python 知识也足够支撑我。然而,我缺乏实践经验

这本书让我受益匪浅。它:

  • 向我展示了如何高效、优雅地使用 Python 处理数据(遵循 Python 的良好实践)。
  • 教我如何从头开始实现大多数简单的机器学习算法。
  • 向我展示了数据科学家的日常工作是什么样的。
  • 教我如何清楚地向他人传达我的成果。

如果你是数据科学界的新手,我诚挚地推荐这本书。它将为你提供成为一名高效的数据科学家所需的大多数主题的清晰概述。

它还将展示 Python 最常用的库并向您展示大量惯用代码,这始终是一个优点。

这是亚马逊上《从头开始的数据科学》的链接

Springer:统计学习导论

《统计学习导论》封面

这本书是我目前为止找到的最全面的机器学习书籍。我从中学到了很多东西,从像K-Means 聚类这样的无监督学习算法,到像 XGBoost 这样的监督学习算法。

如果你已经在这个领域工作过(至少我是这样),那么前几章可能会感觉有点太入门了。然而,它们也以如此有条理的方式总结了许多你以前可能没有学过的内容。

不过,我认为这本书的亮点在于后面的章节。它对随机森林、提升树和支持向量机的解释非常到位。

以下是您可以从《统计学习简介》中学习到的一些主题

  • 回归监督学习算法:从线性回归SVM基于树的方法。
  • 无监督学习技术:尤其是聚类,包括 K-Means 算法。
  • 采样方法和其他一般机器学习核心概念
  • 准确率、召回率、精确率指标含义、优缺点。

我认为这本书是我今年读过的最好的书,它让我成为了一名更全面的数据科学家。如果你经验丰富,但又想提升自己的能力,我推荐你读这本书。它也是一本非常不错的参考书,值得收藏。

它还展示了所有 R 语言的实现,虽然我觉得没什么用,但也没什么坏处。无论如何,你大概都会从 SciKit Learn 导入大部分代码。

和以前一样,这里是亚马逊上 Springer 的《统计学习简介》的链接

Goodfellow、Bengio 等人的深度学习

这本书每次打开都让我震撼不已。我得承认,我还没真正从头到尾读完过。目前为止,

它排在最后,唯一的原因是它涉及的范围非常具体:人工神经网络,或者说深度学习

然而,它的前几章概述了深度学习的前身及其不同之处,然后解释了深度学习的工作原理,非常精彩。

它甚至首先解释了学习深度学习之前需要知道的所有内容,其中整章都专门讨论线性代数概率信息理论以及数值计算方法。

接下来的章节,我只读了一部分,当你需要深入研究特定的神经网络架构时,它们可以作为很好的参考

它们包括对卷积神经网络和循环神经网络的深入解释,以及许多正则化或优化方法。

第三部分也是最后一部分围绕前沿技术展开,讲解了生成模型自编码器以及许多其他有趣的算法。将它们添加到你的工具包中,或许能给你带来巨大的提升!

这本书的作者们是当今机器学习领域的巨星。其中一位作者最近甚至获得了图灵奖,所以我想不出还有谁比他更适合教授这门学科了。

如果您对《深度学习》这本书感兴趣,这里有一个亚马逊链接

结论

我从一本广泛的、入门的书转向了一本高级的、具体的书。

每本机器学习书籍都对我的职业生涯产生了深远的影响,并且在某种程度上影响了我看待世界的方式。

我真的希望其中至少有一些会对你的生活产生同样积极的影响!

如果你已经读过,或者正在读其中任何一本书,请在评论区告诉我你的想法!我很乐意进一步讨论其中任何一本书,尤其是那本《深度学习》的书。

如果你感兴趣的话,我们也可以在TwitterMediumdev.to上讨论。

我想听听你的意见!

(小免责声明:所有这些链接都是亚马逊的附属链接,这意味着如果您购买这些书,我会得到少量佣金。但是,我只会评论我真正读过的书,并且真诚地向现实生活中的人推荐过。)

《帮助我晋升为数据科学家的三本机器学习书籍》一文最先出现在Strikingloo 的个人网站上。

别忘了查看我的数字花园,查看我的最新文章和笔记!

文章来源:https://dev.to/strikingloo/3-machine-learning-books-that-helped-me-level-up-as-a-data-scientist-15lm
PREV
Stripe 的常见设计模式
NEXT
远程工作的现实指南