如何以及为什么成为一名机器学习工程师

2025-06-04

如何以及为什么成为一名机器学习工程师

本文最初发表于Educative, Inc.,作者为 McKenzie Wright。


人们对机器学习行业如此感兴趣,我们认为是时候与该领域的专家交流了。因此,我们采访了 AdaptiLab 的创始人 James 和 Allen。Educative 最近与他们合作推出了一门内容丰富的课程,旨在培训没有任何相关经验的工程师掌握机器学习。

AdaptiLab(Techstars Seattle '19)是一家 B2B 初创公司,致力于解决机器学习和数据科学人才渠道中的最大问题。


人工智能 (AI) 和机器学习 (ML) 是目前科技领域最热门的两个领域。从医疗保健、农业到制造业、能源业和零售业,各行各业的许多公司都在利用这些技术来取得领先地位。事实上,《未来就业》调查发现,到 2022 年,73% 的公司可能会采用机器学习。

由于企业投入如此之多,机器学习工程师和数据科学家的需求已经远远超过了目前的供应。但也有一线希望:如果你已经是一名软件工程师、开发人员或程序员——无论是否自学——你都可以比想象中更快地成为一名机器学习工程师。

为了探讨这一概念,我们与 AdaptiLab 的创始人 James Wu 和 Allen Lu 坐下来讨论机器学习行业的现状以及工程师如何构建在市场竞争中所需的机器学习能力。

替代文本

为什么要进行机器学习?

这场新技术革命最令人兴奋的一点是,任何工程师都能提出新的模型或应用。深度学习是许多有意义的创新背后的驱动技术,例如自动驾驶汽车、语音助手和智能机器人。

随着世界不断涌现出这些激动人心的深度学习应用,对优秀深度学习工程师的需求将持续增长。任何拥有基础计算机科学背景的人都能发挥影响力。

AdaptiLab 是如何诞生的?

James 和 Allen 拥有机器学习背景,并在学术界、初创公司以及谷歌、微软等大型企业拥有丰富的经验。在跨行业、跨垂直行业体验过机器学习之后,他们注意到一个趋势:招聘机器学习人才极其困难。

公司不仅难以招聘到保持竞争力所需的机器学习和数据科学人才,而且招聘流程耗时耗力、缺乏一致性,且难以规模化。因此,大多数公司无法组建自己的数据团队,也未能为数据驱动时代的到来做好准备。

AdaptiLab 正在构建一套旨在帮助企业获取优质人才的服务。这些服务包括机器学习驱动的自动化技术筛选、背景不明的候选人寻源,以及以行业为中心的人才发展和技能提升。

是什么启发您创建机器学习课程?

现代机器学习工程教学解决方案和方法侧重理论而非实际应用。软件工程师缺乏轻松获得在数据驱动时代蓬勃发展所需的宝贵机器学习技能的机会。许多开发人员已经具备学习机器学习所需的基础,但高级学术课程并不注重行业中大多数机器学习项目所需的实践技能。

该教育课程旨在教工程师如何利用行业标准 Python 框架(NumPy、pandas、scikit-learn 和 Tensorflow)来操作和处理数据并训练模型。

想要开启机器学习职业生涯吗?快来了解 AdaptiLab 和 Educative 的软件工程师机器学习课程吧!

替代文本

您认为该行业的发展方向是什么?

James 和 Allen 相信,在未来 5 到 10 年内,普通的全栈工程师将能够像现在使用 Web 框架一样处理数据。机器学习是世界经济论坛所称的第四次工业革命的核心,它需要成为每个工程师词汇的一部分。

各种各样的项目和领域都需要各种各样的专业知识,但最终,机器学习工程师和数据科学家的供应仍然存在巨大缺口。正如进入该领域的新公司迅速发现的那样,人才供应存在两大问题:数量和质量。

1. 数量:寻找拥有机器学习经验或接受过正规培训的工程师和科学家如同大海捞针。想要保持竞争力的公司不得不快速面试,并在其他公司威胁抢先录用候选人的巨大竞争压力下迅速发出录用通知。除了面试环节之外,候选人的招聘本身就是一项极其艰巨的挑战,因为该领域及其应用尚处于萌芽阶段。

2. 质量:顶尖的机器学习工程师和研究人员通常会选择加入资金雄厚的大型机构,例如谷歌 Deep Mind 和微软研究院,或者加入拥有海量数据和基础设施的顶级科技公司,例如 Facebook 和亚马逊。其他人则选择创立或加入规模较小的科技公司,享受初创企业的自主权。如果他们选择后者,像前面提到的亚马逊、微软和谷歌这样的大公司就会收购这些初创企业,以获取他们的人才,从而造成巨大的市场缺口。

关于 ML 的常见误解是什么?

首先,我想说,各行各业和垂直领域都存在着一些亟待解决的难题。然而,大众普遍存在一个误解,认为机器学习和人工智能是一个极其困难且先进的领域,需要扎实的数学和统计学经验。然而,在我们的对话中,我们提出了两个主要的误解:

1. 你无需学习所有机器学习模型背后极其复杂的理论。在业界,90% 的项目并不需要你构建复杂的模型。这些项目实际上是数据工程、数据分析以及从模型中获取洞察,而不是实际构建模型的过程。

2. 公司只想聘请接受过机器学习学术培训的机器学习工程师。由于机器学习带来的巨大机遇,公司将寻求聘请拥有软件和数据工程经验的工程师。这意味着,只要你能将机器学习概念应用于项目,公司就不会要求你彻底理解机器学习理论。最终,能够将这些基础知识应用于新应用和新领域的开发者将获得成功。

替代文本

软件工程师开始工作需要了解什么?

如果你已经是一名工程师,那么你已经成功了一半以上。市面上有很多很棒的工具可以帮助你快速学习行业级的机器学习,而无需深入理论。

  1. 了解基础知识:作为一名工程师——无论是否自学——您都需要掌握计算机科学的基础知识。

  2. 牢牢掌握数据工程:同样,作为一名工程师,如果您有兴趣将您的技能扩展到机器学习领域,那么您的很大一部分工作将需要数据工程经验。

  3. 开始了解现有的框架:现在有很多优秀的开源框架和工具。不到五年前,可供学习的开源框架还没有现在这么多。Allen 不得不花费数小时摆弄代码,尝试不同的函数,采用猜测和检查的方法。而如今,由主要科技巨头(谷歌、Facebook 等)领导的开源社区驱动项目层出不穷。这些非常新的软件包为实用机器学习做出了贡献,但它们都还很新。

  4. 参加旨在帮助您实现学习目标的课程:作为一名工程师,您需要学习转型到数据导向型职业所需的技术和框架。从关键的编码技能和解决问题的直觉开始,一旦掌握了这些技能,您就可以轻松地将这些学习成果应用于解决实际的行业挑战,并构建可在企业环境中部署的生产级模型。

  5. 找到一个行业或专注点:James 和 Allen 分享的一条建议是,工程师应该选择自己喜欢的行业或垂直领域。你将花费大部分时间分析数据,如果你觉得数据枯燥乏味,那么你很可能会讨厌它。幸运的是,随着机器学习的持续发展,可能性几乎是无穷无尽的。找到你喜欢的东西,然后一头扎进去。

  6. 深入了解:如果您对研究感兴趣,那么学习理论将是下一步的重要步骤。


进一步阅读

课程:理解数据科学

文章:机器学习 101 和数据科学:来自行业专家的建议

文章:如何在下一次机器学习面试中脱颖而出

文章:软件工程师的机器学习实用方法

文章:行业深度学习与大学课程之间的脱节

文章来源:https://dev.to/educative/how-and-why-to-become-a-machine-learning-engineer-j2a
PREV
如何学习 C++:初学者完整指南 1. C++ 简史 2. C++ 工具和软件概述 3. C++ 语言和语法简介 C++ 术语和词汇 4. C++ 常见问题解答 5. C++ 初学者资源
NEXT
React 和 TypeScript 入门