数据科学面试学习指南
数据科学技术面试和其他技术面试一样,需要充分的准备。为了确保你做好充分的准备,你需要涵盖很多主题。
在我们开始之前,我们想指出一些建议。
我们注意到的一件事是数据科学面试有几种类型。
有些数据科学面试非常注重产品和指标。这些面试更侧重于产品方面的问题,例如你会使用哪些指标来展示产品哪些方面需要改进。这些问题通常与 SQL 和一些 Python 问题搭配出现。
另一种类型的数据科学面试往往是编程和机器学习的混合。
如果招聘人员没有提供任何建议,我们建议您咨询他们。有些公司非常擅长保持面试的一致性,但即便如此,团队有时也会根据他们寻找的人才而有所偏差。以下是我们观察到的一些公司数据科学面试的例子。
Airbnb --- 产品繁重,指标诊断,指标创建,A/B 测试,大量行为问题和带回家。
Netflix—— 产品感知问题、A/B 测试、实验设计、指标设计
微软—— 编程重心、二叉树遍历、SQL、机器学习
Expedia --- 产品、编程、SQL、产品感知、有关 SVM、回归和决策树的机器学习问题
为了跟踪您的进度,我们整理了一份 学习清单来帮助您!
首先,让我们确保您能够解释基本的数据科学算法。
机器学习算法
- 逻辑回归 --- 视频
- A/B 测试? --- 视频
- 决策树 ---帖子
- SVM---帖子
- 如何进行 SVM --- 视频
- 主成分分析:PCA---后期
- 主成分分析---视频
- Adaboost --- 帖子
- AdaBoost --- 视频
- 机器学习梯度提升算法的简单介绍——帖子
- 梯度提升第一部分:回归主要思想 --- 视频
- K-均值聚类 --- 智能的数学 --- 视频
- 贝叶斯网络 ---帖子
- 神经网络 ---帖子
- 降维算法 ---帖子
- kNN算法的工作原理 --- 视频
概率与统计
在 FAANG 公司和其他类似的科技公司,你可能会遇到一个常见的问题,那就是概率或统计学问题。这些问题并不一定需要复杂的数学知识。但是,如果你很久没思考过独立概率和相关概率了,最好还是回顾一下基本公式的建立。
概率视频
概率测验
概率面试题
这些问题大多数与我们被问到的问题类似,或者直接来自 glassdoor.com。
- 一个骰子掷两次。第一次掷出 3,第二次掷出奇数的概率是多少?
- 在任何15分钟的时间间隔内,有20%的概率你会看到至少一颗流星。那么在一小时内你看到至少一颗流星的概率是多少?
- 爱丽丝有两个孩子,其中一个是女孩。另一个孩子也是女孩的概率是多少?你可以假设世界上男性和女性的数量相等。
- 你即将登上飞往西雅图的飞机。你想知道
- 有多少种方法可以将 12 个人分成 3 组,每组 4 人?
统计学预测验
统计概念
统计学是一个很宽泛的概念,所以不要纠结于每个视频的细节。你只需要确保你能从表面解释清楚每个概念即可。
统计学后测验
面试准备课程
准备数据科学面试的另一个好方法是参加面试课程。这些课程的费用通常在 10 到 200 美元之间。这取决于你使用的网站,更重要的是……这还取决于 udemy 的算法。有时 udemy 会为同一门课程收取 10 美元,之后可能会收取 200 美元。
- 数据科学职业指南——面试准备 (10-200 美元,取决于算法计算的内容)
- 数据科学面试准备——职业指南 (10-200 美元,取决于算法计算的内容)
产品和实验设计
产品意识是数据科学家的一项重要技能。了解新产品的衡量标准以及衡量原因,有助于判断产品表现如何。有趣的是,有时指标如你所愿,结果可能并非总是理想。有时,人们在你的网站上花费更多时间的原因可能是网页加载时间更长或其他类似问题。这就是为什么指标如此棘手,而衡量标准也至关重要。
产品和实验设计概念
产品和指标问题
- 一个重要指标下降了,你会如何挖掘其原因?
- 您会使用什么指标来量化 YouTube 广告的成功(这也可以扩展到其他产品,如 Snapchat 滤镜、Twitter 直播、堡垒之夜新功能等)
- 如何衡量产品/产品功能的成功或失败
- 谷歌发布了新版搜索算法,并进行了 A/B 测试。在测试过程中,工程师发现新算法的执行存在问题,返回的结果相关性较低。测试期间发生了两件事:
- 治疗组的人比对照组的人进行了更多的查询。
- 治疗组的广告收入也更高。
实验组比对照组进行更多搜索的原因可能是什么?这里可能存在不同的答案。
问题 4 借用自 Zarantech;我们真的很喜欢它,并认为它是事情如何出错的一个很好的例子。
编程
虽然数据科学并不总是需要大量编程,但这并不意味着面试官不会问你遍历二叉树的问题。所以一定要问问面试官会问些什么。不要被这些问题吓到。挑选几个来做,这样你在面试中就不会感到意外了。
视频前问题
算法和数据结构
预习题:在学习数据结构和算法的视频内容之前,不妨尝试一下以下这些问题,看看你能不能答对。这能帮助你了解应该重点关注哪些方面。
算法和数据结构视频
数据结构
算法
- 面试中的 Python 算法
- 算法:图搜索、DFS 和 BFS
- BFS(广度优先搜索)和DFS(深度优先搜索)(视频)
- 算法:二分查找
- 二叉搜索树回顾(视频)
- 算法:递归
- 算法:冒泡排序
- 算法:归并排序
- 算法:快速排序
字符串操作
SQL
学习后的问题
现在你已经学习了一段时间,也看了一些视频。我们来尝试更多题目吧!
SQL --- 问题
一般来说,至少会有一场关于 SQL 的面试。此外,面试官可能会带你经历开发产品、指标以及查询的整个过程,以衡量该指标的有效性。
SQL --- 视频
SQL 后问题
课程
如果您已经完成了以上所有问题和视频,但仍觉得需要复习,可以考虑参加以下课程。它们将帮助您获得一些新的视角。事实上,这些课程涵盖的概念与我们之前提供的视频基本相同。然而,有时从多个来源获取相同的信息也会有所帮助。
技术面试可能很艰难,无论对于软件工程师、 数据工程师还是数据科学家来说都是如此 。我们希望这份学习指南能帮助你追踪自己的学习进度!
如果您认为缺少某个主题,请告知我们。谢谢!
如果您喜欢这篇关于数据科学的文章,那么也请考虑这些文章!
文章来源:https://dev.to/seattledataguy/data-science-study-guide-1g0n