展示模型、数据集、指标和业务成果。ATS干净、招聘者可扫描,并为筛选PyTorch、SQL和生产中部署的模型的招聘漏斗而构建。
招聘者无法在8秒的CV扫描中区分严肃的数据科学家和Kaggle爱好者。帮助他们:命名部署上下文(gRPC服务后的实时推理、Airflow中的批处理评分)、训练数据规模,以及模型移动的业务指标。
技能应分为4组:ML/DL栈(PyTorch、sklearn、XGBoost)、数据工程(SQL、Spark、dbt、Snowflake)、生产(FastAPI、MLflow、Sagemaker)和可视化(Tableau、Looker、matplotlib)。不要将所有内容倒入一个块中。
出版物和Kaggle排名在底部各值一行,绝不在导言。导言是已部署的工作。
有帮助:如果您是早期职业或从研究转型。一个有3个已部署模型的干净项目块,每个都有数据集、技术和结果,胜过稀疏的工作历史。
有害:如果您在行业中5年以上。项目部分则意味着您没有足够的工作经验来填满页面,这与您想要的相反。
如果您包括项目,将每个视为一份工作:公司等效行、日期、2-3个量化要点。
倒序时间工作历史(带已部署模型结果)、分组的技能部分(ML、数据工程、生产、可视化)、带学位和论文主题的教育,以及仅在重要时的出版物或Kaggle结果。
不。列出框架(PyTorch、sklearn、XGBoost、Hugging Face)、您会用来构建生产系统的工具(MLflow、Sagemaker、Ray)和生态系统(pandas、numpy)。跳过每个单独的可视化库和每个次要的实验跟踪工具。
Grandmaster排名是的,放在底部的一行。一些完成的教程不。招聘者将Kaggle作为主要信号打折,因为数据太干净,指标太窄。
命名数据集大小、技术、基线和提升。「在1400万个标注交易上训练了XGBoost分类器;在相同的假阳性预算下将欺诈召回率从71%提升到84%」可以辩护。「构建了最先进的模型」不能。
是的,显著地。大多数数据科学JD将SQL筛选为硬性必备技能,30%的申请者因为假设它是隐含的而省略它。不要省略它。