Skip to content

Latest commit

 

History

History
69 lines (35 loc) · 11.2 KB

hiring-exceptional-data-scientists-c454110742f.md

File metadata and controls

69 lines (35 loc) · 11.2 KB

招聘杰出的数据科学家

原文:towardsdatascience.com/hiring-exceptional-data-scientists-c454110742f?source=collection_archive---------8-----------------------#2023-02-28

异常值:超越单纯的技术技能

Jaco du ToitTowards Data Science Jaco du Toit

·

关注 发表在 Towards Data Science · 阅读时间 7 分钟 · 2023 年 2 月 28 日

--

布劳贝格斯特兰德(作者提供的图片)

随着对应用数据科学最初兴奋感的减退,回顾一些在热潮高峰期取得成功的举措的因素是很有必要的。值得考虑的是,在这段时期设定的那些大多不切实际的期望中,哪些因素对于超越这些期望至关重要。然而,当前的问题可能更适合用“谁?”而不是“什么?”来框定。在这篇文章中,我分享了我的观察和思考,谈论我认为使一名杰出的数据科学家脱颖而出的因素——那些通过全面的技能和无尽的热情不断带来惊艳表现和业务影响的人。

积极的自我学习者

一位出色的数据科学家会表现出强烈的好奇心和持续学习的动力。在我的经验中,大多数数据科学家面临需要新颖解决方案的问题,这些问题并非普通的监督学习或无监督学习方法可以解决。对于这些问题,解决方案需要在不总是直接相关的主题上进行积极的研究,探索在线资源,跟进开源社区的最新动态,阅读书籍,与同行交流,或参加数据科学聚会以外化思想。这类个人也可能通过开发工具或算法为该领域做出贡献(尽管不一定注册了研究生学位)。他们还会与学术界互动,以保持对研究的最新了解,并支持自己的学习,这在我看来是非常宝贵的资源。

自学的数据科学家能够批判性地评估新信息,并将其与他们正在进行的项目或同行的项目联系起来。此外,他们展现出开放的心态,保持对新思想和观点的接受态度,并愿意评估和挑战自己的假设,以便不断学习和扩展技能。这些人表现出高度的自我效能感,使他们对学习充满动力,并能坚持不懈。我曾与一些出色的数据科学家交谈过,他们还实践元认知。他们会反思自己的认知过程和学习方法,这对于调节和引导自己的思维和知识朝向特定目标非常有益。在我看来,这有助于提高他们的学习效率和解决问题的能力。

我如何识别这样的人呢?我会查看他们的公开代码库,看看他们是否实现了难度较大的理论概念或从科学论文中得出的算法。他们是如何处理手头的问题的?他们参考了哪些文献和资源?他们最终是如何开发出可行的解决方案的?这些见解可以提供有用的信息,帮助理解他们的思维过程和解决问题的方法。我还会关注那些采用“通过教学学习”方法的数据科学家,他们通过教导他人来巩固自己对相关主题的理解和知识。这种候选人对团队非常有益,因为他们愿意分享他们的学习成果!作为面试过程的一部分,我会问候选人他们希望学习(或更好地理解)的方法或算法,以及原因。他们的愿望清单上有什么?

高效的沟通者

杰出的数据科学家拥有能够清晰阐述商业和技术信息的词汇和沟通风格,同时考虑到听众的需求和视角*。* 他们可能会使用主动倾听技巧,例如复述或总结演讲者所说的内容,并提出后续问题。他们能够设身处地为听众着想,展现出同理心。这在数据科学家需要向非技术的业务利益相关者解释复杂概念时尤为必要。他们也对自己的能力充满信心,但能够自信地表达他们的不确定性。他们能够在演讲中保持听众的兴趣,使用讲故事的方式使信息令人难忘且具有影响力。他们是与产品负责人、业务利益相关者和同事的优秀合作者,并且意识到团队动态,这对于识别潜在障碍和成功机会至关重要。他们对他人充满信任,并善于建立稳固的工作关系,保持团队中的高度互依,并以积极和建设性的方式解决冲突。这也增强了团队的凝聚力,促进了成功的成果。

创造性问题解决者

杰出的数据科学家具备高度的流动智力,使他们能够解决新颖的问题、进行抽象思维并适应新情况。这有助于他们的创造力和对新概念的掌握,往往导致产生新的商业理念(如果你愿意,可以称之为创业思维),这些理念可以转化为新的实用产品或解决方案。一些人可能表现出发散性思维,能够在面对挑战或问题时产生多种想法,这涉及超越传统方法、建立新颖的联系和考虑多种视角。他们富有想象力、好奇心强,并且乐于接受新体验。

要识别这样的人,我会关注他们在提出不同问题解决方法时的认知灵活性。这里的重点并不一定是候选人提出正确的解决方案,而是评估他们通过连接看似无关的概念来生成有意义的联想的原创思维能力,以解决问题。

域专业人士

除了技术技能外,有些人可能在特定领域或行业中拥有相当的知识和专业技能,这对于您的招聘目标至关重要。杰出的数据科学家可能对业务(例如,商业战略、目标等)有较好的理解,这帮助他们识别并自主解决与业务相关的核心问题。其他领域(如工程、制造、金融等)也是如此。这些数据科学家在利用其领域知识理解他们所处理的数据的细微差别方面具有优势,并能够开发相关且可操作的模型或洞察。他们还会知道哪些模型假设最能代表领域的基本动态,这可以在面试中评估。招聘领域专业人士可以加速特定领域的数据科学计划。

技术熟练度

以下是一些杰出数据科学家非常重视的关键技术领域。

合理的模型假设: 能够数学地识别和解释基本逻辑、原则和假设,使用连贯的论据和证据来支持他们的观点。杰出的数据科学家能够解释他们的工具,并识别利用这些工具的理想场景。

系统导向推理: 他们会通过考虑解决方案嵌入的整个端到端系统来处理问题。他们仔细分析系统中各种数据和模型组件之间的相互关系,考虑这些组件如何被消费或互动。他们还会考虑系统中某部分的变化对整个系统的影响,并对导致系统行为的基本结构和反馈回路感兴趣。我还观察到,杰出的数据科学家会与系统的最终用户密切合作,以利用用户体验反馈。

指标驱动: 他们非常强调使用数据和定量措施(适当的统计数据)来推动决策和评估绩效。他们专注于跟踪和分析 KPI,并利用这些信息做出明智的决策,以改善模型或系统。例如,他们将准确知道在特定模型中使用哪些指标,如何解释它们,以及需要注意哪些认知偏差和统计偏差(如 Goodhart 定律、Simpson 悖论、Berkson 悖论等)。

数据导向: 他们非常注重数据的收集、分析和解释,以指导决策并获得对各种现象的洞察。个人在处理数据、数据分析和数据可视化方面非常熟练。他们在数据探索过程中注重细节,并会寻找异常发现的解释——绝不会将隐藏的知识掩盖在地毯下。

开源项目: 他们可能有自己的公开开源项目或代码库,在这些项目中,他们和其他贡献者经常进行贡献。这些个人积极地为一个共同目标贡献代码,他们的贡献被社区重视并接受。

面试可以通过不同的方式进行。就个人而言,我不喜欢给数据科学候选人分配时间限制的编码任务。这样做会削弱这篇文章中几乎所有的内容。相反,我会审查他们的公开代码库,以评估他们的编码风格、贡献和解决问题的方法。通过检查他们代码和分析中的评论,可以判断他们的思维过程和观察结果。在面试过程中与他们的公开代码相关的跟进问题可以帮助澄清差距。或者,让数据科学候选人谈谈他们做的一个有趣项目(保护机密信息),或提供给他们一个预定的案例研究以概念性地解决(而非代码)应该能为招聘团队提供充足的机会来识别这篇文章中提到的大部分特征。

附注:请确保你的职位要求是现实的,并能代表实际角色;否则,出色的候选人会对你的公司失去兴趣。了解你目前团队中哪些实践是成功的,你的公司/团队文化如何,你的团队需要什么额外技能,以及你将如何留住并培养那些出色的数据科学家!

以幽默的结尾——一个出色的数据科学家就像一个卡尔曼滤波器 ;)

  • 适应性: 他们应该能够随着新信息或数据的出现,调整他们的模型和分析方法。

  • 稳健: 他们应该能够应对噪声和不确定的数据(或人)。他们应该能够利用不确定性,过滤掉噪声和其他无关信息,专注于重要内容。

  • 预测: 他们应该能够基于过去的数据(以及当前的观察)做出准确的预测,识别数据中的趋势和模式,并利用这些信息做出明智的预测/推荐。

  • 平衡准确性和复杂性: 他们应该找到最适合给定数据集的最佳模型,并从中提取最有用的信息,同时通过使用简单(通常是线性的)假设来保持计算时间合理。