Question 1

数据科学家简历应包含什么?

Accepted Answer

倒序时间工作历史(带已部署模型结果)、分组的技能部分(ML、数据工程、生产、可视化)、带学位和论文主题的教育,以及仅在重要时的出版物或Kaggle结果。

Question 2

我应该在数据科学家CV上列出每个Python库吗?

Accepted Answer

不。列出框架(PyTorch、sklearn、XGBoost、Hugging Face)、您会用来构建生产系统的工具(MLflow、Sagemaker、Ray)和生态系统(pandas、numpy)。跳过每个单独的可视化库和每个次要的实验跟踪工具。

Question 3

Kaggle竞赛属于数据科学家简历吗?

Accepted Answer

Grandmaster排名是的,放在底部的一行。一些完成的教程不。招聘者将Kaggle作为主要信号打折,因为数据太干净,指标太窄。

Question 4

如何在不夸大的情况下描述模型?

Accepted Answer

命名数据集大小、技术、基线和提升。「在1400万个标注交易上训练了XGBoost分类器;在相同的假阳性预算下将欺诈召回率从71%提升到84%」可以辩护。「构建了最先进的模型」不能。

Question 5

我应该在数据科学家简历上列出SQL吗?

Accepted Answer

是的,显著地。大多数数据科学JD将SQL筛选为硬性必备技能,30%的申请者因为假设它是隐含的而省略它。不要省略它。

数据科学家简历,拿下模型面试。

已部署每次都击败notebook。