数据科学面试学习指南

2025-05-26

数据科学面试学习指南

数据科学技术面试和其他技术面试一样,需要充分的准备。为了确保你做好充分的准备,你需要涵盖很多主题。

在我们开始之前,我们想指出一些建议。

我们注意到的一件事是数据科学面试有几种类型。

有些数据科学面试非常注重产品和指标。这些面试更侧重于产品方面的问题,例如你会使用哪些指标来展示产品哪些方面需要改进。这些问题通常与 SQL 和一些 Python 问题搭配出现。

另一种类型的数据科学面试往往是编程和机器学习的混合。

如果招聘人员没有提供任何建议,我们建议您咨询他们。有些公司非常擅长保持面试的一致性,但即便如此,团队有时也会根据他们寻找的人才而有所偏差。以下是我们观察到的一些公司数据科学面试的例子。

Airbnb --- 产品繁重,指标诊断,指标创建,A/B 测试,大量行为问题和带回家。

Netflix—— 产品感知问题、A/B 测试、实验设计、指标设计

微软—— 编程重心、二叉树遍历、SQL、机器学习

Expedia --- 产品、编程、SQL、产品感知、有关 SVM、回归和决策树的机器学习问题

为了跟踪您的进度,我们整理了一份 学习清单来帮助您

下载数据科学面试清单

首先,让我们确保您能够解释基本的数据科学算法。

机器学习算法

  1. 逻辑回归 --- 视频
  2. A/B 测试?  --- 视频
  3. 决策树 ---帖子
  4. SVM---帖子
  5. 如何进行 SVM --- 视频
  6. 主成分分析:PCA---后期
  7. 主成分分析---视频
  8. Adaboost  --- 帖子
  9. AdaBoost  --- 视频
  10. 机器学习梯度提升算法的简单介绍——帖子
  11. 梯度提升第一部分:回归主要思想 --- 视频
  12. K-均值聚类 --- 智能的数学 --- 视频
  13. 贝叶斯网络 ---帖子
  14. 神经网络 ---帖子
  15. 降维算法 ---帖子
  16. kNN算法的工作原理 --- 视频

概率与统计

在 FAANG 公司和其他类似的科技公司,你可能会遇到一个常见的问题,那就是概率或统计学问题。这些问题并不一定需要复杂的数学知识。但是,如果你很久没思考过独立概率和相关概率了,最好还是回顾一下基本公式的建立。

概率视频

  1. 依赖概率引入
  2. 独立概率与相关概率
  3. 独立问题
  4. 条件概率文章

概率测验

  1. 概率与统计 --- 第 6 组
  2. 概率与统计 --- 第 2 组
  3. 独立概率
  4. 依赖概率

概率面试题

这些问题大多数与我们被问到的问题类似,或者直接来自 glassdoor.com。

  1. 一个骰子掷两次。第一次掷出 3,第二次掷出奇数的概率是多少?
  2. 在任何15分钟的时间间隔内,有20%的概率你会看到至少一颗流星。那么在一小时内你看到至少一颗流星的概率是多少?
  3. 爱丽丝有两个孩子,其中一个是女孩。另一个孩子也是女孩的概率是多少?你可以假设世界上男性和女性的数量相等。
  4. 你即将登上飞往西雅图的飞机。你想知道
  5. 有多少种方法可以将 12 个人分成 3 组,每组 4 人?

统计学预测验

  1. 数据科学概率统计 14

统计概念

统计学是一个很宽泛的概念,所以不要纠结于每个视频的细节。你只需要确保你能从表面解释清楚每个概念即可。

  1. 偏差方差权衡
  2. 混淆矩阵
  3. ROC曲线
  4. 正态分布
  5. P 值
  6. 皮尔森· 斯皮尔曼

  7. 正态分布问题:z 分数(来自 ck12.org)

  8. 连续概率分布

  9. 标准化正态分布的随机变量(快速版)

  10. 统计学 101:简单线性回归,基础知识

  11. 统计学101:线性回归、异常值和有影响的观测值

  12. 统计学 101:方差分析,视觉介绍

  13. 统计学 101:多元回归,基础知识

  14. 统计学:总体方差 | 概率论与数理统计 | 可汗学院

  15. 预期值:E(X)

  16. 大数定律 | 概率与统计 | 可汗学院

  17. 中心极限定理 | 推论统计 | 概率与统计 | 可汗学院

  18. 误差幅度 1 | 推论统计 | 概率与统计 | 可汗学院

  19. 误差幅度 2 | 推论统计 | 概率与统计 | 可汗学院

  20. 假设检验和 p 值 | 推论统计 | 概率与统计 | 可汗学院

  21. 单尾和双尾检验 | 推论统计 | 概率论与统计学 | 可汗学院

  22. 第一类错误 | 推论统计 | 概率论与数理统计 | 可汗学院

  23. 大样本比例假设检验 | 概率与统计 | 可汗学院

  24. Boosting 和 Bagging

统计学后测验

  1. 数据科学概率统计 17

面试准备课程

准备数据科学面试的另一个好方法是参加面试课程。这些课程的费用通常在 10 到 200 美元之间。这取决于你使用的网站,更重要的是……这还取决于 udemy 的算法。有时 udemy 会为同一门课程收取 10 美元,之后可能会收取 200 美元。

  1. 数据科学职业指南——面试准备 (10-200 美元,取决于算法计算的内容)
  2. 数据科学面试准备——职业指南 (10-200 美元,取决于算法计算的内容)

产品和实验设计

产品意识是数据科学家的一项重要技能。了解新产品的衡量标准以及衡量原因,有助于判断产品表现如何。有趣的是,有时指标如你所愿,结果可能并非总是理想。有时,人们在你的网站上花费更多时间的原因可能是网页加载时间更长或其他类似问题。这就是为什么指标如此棘手,而衡量标准也至关重要。

产品和实验设计概念

  1. 用户参与度指标
  2. 数据科学家的工具箱:实验设计 - 视频
  3. A/B 测试指南
  4. 6 个指标主题

产品和指标问题

  1. 一个重要指标下降了,你会如何挖掘其原因?
  2. 您会使用什么指标来量化 YouTube 广告的成功(这也可以扩展到其他产品,如 Snapchat 滤镜、Twitter 直播、堡垒之夜新功能等)
  3. 如何衡量产品/产品功能的成功或失败
  4. 谷歌发布了新版搜索算法,并进行了 A/B 测试。在测试过程中,工程师发现新算法的执行存在问题,返回的结果相关性较低。测试期间发生了两件事:
  • 治疗组的人比对照组的人进行了更多的查询。
  • 治疗组的广告收入也更高。

实验组比对照组进行更多搜索的原因可能是什么?这里可能存在不同的答案。

问题 4 借用自 Zarantech;我们真的很喜欢它,并认为它是事情如何出错的一个很好的例子。

编程

虽然数据科学并不总是需要大量编程,但这并不意味着面试官不会问你遍历二叉树的问题。所以一定要问问面试官会问些什么。不要被这些问题吓到。挑选几个来做,这样你在面试中就不会感到意外了。

视频前问题

  1. 嘶嘶声
  2. 找出数组中第 K 个最小/最大的整数
  3. 第 N 个斐波那契数列

算法和数据结构

预习题:在学习数据结构和算法的视频内容之前,不妨尝试一下以下这些问题,看看你能不能答对。这能帮助你了解应该重点关注哪些方面。

  1. 985. 查询后偶数之和
  2. 657. 机器人回归原点
  3. 961. 2N 数组中的 N 个重复元素
  4. 110. 平衡二叉树

算法和数据结构视频

数据结构

  1. 数据结构和算法#1 ---什么是数据结构?
  2. 多维度(视频)
  3. 数据结构:链表
  4. 核心链表与数组(视频)
  5. 数据结构:树
  6. 数据结构:堆
  7. 数据结构:哈希表
  8. 数据结构:堆栈和队列

算法

  1. 面试中的 Python 算法
  2. 算法:图搜索、DFS 和 BFS
  3. BFS(广度优先搜索)和DFS(深度优先搜索)(视频)
  4. 算法:二分查找
  5. 二叉搜索树回顾(视频)
  6. 算法:递归
  7. 算法:冒泡排序
  8. 算法:归并排序
  9. 算法:快速排序

字符串操作

  1. 编码面试问答:最长连续字符
  2. Sedgewick --- 子串搜索(视频)

SQL

学习后的问题

现在你已经学习了一段时间,也看了一些视频。我们来尝试更多题目吧!

  1. 越大越好
  2. 6. 锯齿形转换
  3. 7. 反转整数
  4. 40. 组合和 II
  5. 43. 字符串相乘
  6. 拉里的阵列
  7. 短回文
  8. 65. 有效号码
  9. 越大越好
  10. 完全计数排序
  11. 莉莉的家​​庭作业

SQL --- 问题

一般来说,至少会有一场关于 SQL 的面试。此外,面试官可能会带你经历开发产品、指标以及查询的整个过程,以衡量该指标的有效性。

  1. 262. 旅行和用户
  2. 601. 体育场人流
  3. 185. 部门薪资排名前三的人员
  4. 626. 交换座位
  5. Hackerrank报告
  6. 177. 第 N 高薪
  7. 对称对
  8. 职业
  9. 展示位置
  10. 奥利凡德的库存

SQL --- 视频

  1. IQ15:6 个 SQL 查询面试题
  2. 了解 ROW_NUMBER 和分析函数
  3. 解析函数的高级实现
  4. 解析函数的高级实现(二)
  5. Wise Owl SQL 视频

SQL 后问题

  1. 二叉树节点
  2. 气象观测站 18
  3. 挑战
  4. 打印质数
  5. 595. 大国
  6. 626. 交换座位
  7. SQL 面试问题:3 个技术筛选练习(针对数据分析师)

课程

如果您已经完成了以上所有问题和视频,但仍觉得需要复习,可以考虑参加以下课程。它们将帮助您获得一些新的视角。事实上,这些课程涵盖的概念与我们之前提供的视频基本相同。然而,有时从多个来源获取相同的信息也会有所帮助。

  1. 数据科学职业指南——面试准备
  2. 编程面试训练营:算法+数据结构
  3. 数据仓库概念:从基础到高级的概念

技术面试可能很艰难,无论对于软件工程师、 数据工程师还是数据科学家来说都是如此  。我们希望这份学习指南能帮助你追踪自己的学习进度!

如果您认为缺少某个主题,请告知我们。谢谢!

如果您喜欢这篇关于数据科学的文章,那么也请考虑这些文章!

数据科学家必须具备的 4 项技能

算法如何变得不道德和有偏见

在数据科学中使用敏捷方法

142 个资源助您轻松掌握编程面试技巧

数据科学家如何解决平衡括号问题

文章来源:https://dev.to/seattledataguy/data-science-study-guide-1g0n
PREV
Docker、Kubernetes 和 Helm
NEXT
5 个值得写进简历的数据工程项目创意