Skip to content

Latest commit

 

History

History
99 lines (50 loc) · 10.8 KB

the-art-of-making-quality-data-analyses-a91ea319b573.md

File metadata and controls

99 lines (50 loc) · 10.8 KB

优质数据分析的艺术

原文:towardsdatascience.com/the-art-of-making-quality-data-analyses-a91ea319b573?source=collection_archive---------4-----------------------#2023-12-05

用 3 个词总结:时效性、方法论和可消化性

Jordan GomesTowards Data Science 乔丹·戈梅斯

·

关注 发布于 Towards Data Science ·7 分钟阅读·2023 年 12 月 5 日

--

几周前,我写了关于构建系统以生成更多优质洞察的文章。我展示了如何通过改进流程、工具、文化等领域来提高团队的产出,但我从未定义“质量”意味着什么——所以这周,我们将深入探讨这一概念。

通常当有人谈论数据研究的质量时——我们会立即想到“确保数据分析的准确性和结果的可靠性”。我认为这只是定义的一部分。根据我 8 年以上的分析经验,数据分析要被认为是“优质工作”,它必须融合三个基本元素。

  • 它以及时的精确度解决了实际需求。

  • 这得到了一个稳健且经过验证的方法论的支持。

  • 组织能够消化这些内容。

让我们深入探讨

成功的数据分析包含的内容 — 作者插图

以及时的精确性满足实际需求

要使数据分析真正具有影响力,关键在于其针对一个真实且明确的需求。这意味着需要准确了解所解决的问题、识别受影响的对象、认识到其在当前时刻的相关性,并明确分析结果将如何被具体应用。这种理解的精确程度直接关系到你的分析对最终用户的价值。

确定实际需求 — 而不是感知需求 — 是至关重要的。这将确保分析不仅在理论上有用,而且在实践中可应用。这将确保在项目的最后一天,当你向利益相关者展示时,不会出现诸如“那么……接下来呢?”的问题。这将使你提供具有洞察力和可操作的数据,而不是提供虽然有趣但可能不立即有用的信息。

例如,一家零售公司可能会感受到需要广泛分析客户人口统计数据,但实际需求可能是理解某个特定年龄组的购买模式。后者直接影响营销策略和库存决策,从而对业务运营产生更深远的影响。

同样重要的是分析的及时性。这个方面包含两个关键要素:当前时刻需求的相关性,以及提供分析的速度。

  • 需求的相关性: 企业的需求通常是时间敏感的,并且可能会迅速变化——尤其是当你在一个快速变化的组织中时。解决当前紧迫问题的分析比那些来得过晚或做得过早的分析更有价值。例如,在主要节假日之前对消费者趋势的分析对企业在库存和营销方面至关重要,但如果在假期开始后才出现,这个机会就会丧失。

  • 分析的及时性: 分析交付的速度同样至关重要——因为这影响到需求的相关性。这是一个需要考虑的重要因素,因为有时你可能需要在研究的全面性与速度之间做出权衡(例如,如果社交媒体上出现了一个新趋势,而你的公司希望对一个热门话题进行分析——你不能花两个月的时间才给出结果)。

总结来说,当数据分析准确识别并解决一个真实的、当前的需求,并且以及时的方式交付,从而确保最大相关性和影响力时,其成功的概率将显著提高。

拥有一个结构化的方法论

我经常看到没有使用任何标准方法论的数据分析。虽然这不一定意味着研究会很差,但不遵循经过验证的方法论会大大降低你完成高质量工作的机会。

结构化/标准化的方法确保了全面性,同时提升了分析的可信度和可重复性。

我发现一个容易遵循的方法论是跨行业数据挖掘标准流程(CRISP-DM)框架。在这个领域工作了近十年,这仍然是我在从头开始分析时的首选框架。这个框架——被称为标准的“数据科学”/“数据分析”流程——有 6 个主要阶段:

  • 业务理解: 在这个阶段,数据分析师应全面了解“业务背景”:我们要解决的痛点是什么,我们过去做了什么,谁是“参与者”,风险、资源等是什么——以及非常重要的是,项目的成功标准是什么。

  • 数据理解: 这个阶段涉及熟悉数据——它是对数据进行描述性和探索性分析,并识别数据质量问题。它是你自己的“初步调查”,你开始掌握数据的细微差别和潜力。

  • 数据准备: 这个阶段是关于选择你想要处理的数据——包括包含/排除的理由——然后清理和转换数据,以适合分析的格式。这就像在做饭前准备原料一样——对良好的结果至关重要。

  • 建模: “建模”的概念可能让一些人感到畏惧——但建模可以像为一个真/假指标“创建一个特定的阈值”一样简单(例如,如果你的项目是理解/定义流失)。在这个阶段,将各种建模技术应用于准备好的数据,以便你可以将它们相互对比,并了解哪些是最成功的。

  • 评估: 现在对模型进行严格评估,以确保它们达到业务目标以及在第 1 阶段设定的成功标准。这通常会导致你获得可以用来回顾和修订业务理解的见解。

  • 部署: 最后一个阶段涉及将模型应用于实际数据和情况,将分析付诸实践,并开始使用这些见解来改进团队的运营。

这个框架通过迫使你经过这些不同的步骤,从而增加了你的分析更为稳健的机会——同时留有创造性的空间。

使你的工作易于理解

易读性不仅仅是简化复杂信息和使你的幻灯片更易于理解。这涉及两个重要方面:(1)从观众那里培养深层次的理解,以及(2)使他们能够以实际、有效的方式应用这些见解。这个过程类似于身体不仅消化食物,还利用营养物质来驱动各种功能。

从观众那里培养深层次的理解

实现这一点需要使数据对观众既可访问又引起共鸣。这时,主题专家(SMEs)扮演着关键角色。通过在分析过程中早期涉及 SMEs,他们的领域知识可以指导数据的框架和解释,确保分析与实际情况对接,并以对目标观众有意义的方式呈现。

另一个增强易读性的关键策略是实施‘阶段门’流程,这包括与利益相关者或接收团队进行定期检查和更新。这种方法避免了在研究结束时用一大堆复杂信息压倒他们。相反,利益相关者会被带到整个过程中,让他们逐渐吸收新见解。它还开辟了持续反馈的途径,确保分析始终与观众不断变化的需求和期望保持一致。

想象你在一个大型组织中实施新的数据驱动战略。如果数据团队仅在最终阶段呈现分析而没有事先的参与,利益相关者可能会发现难以掌握其细微之处或看出其与他们具体背景的相关性。然而,通过在定期的间隔中涉及这些利益相关者——通过周期性演示或研讨会——他们会对数据及其影响变得更加熟悉。他们可以提供宝贵的反馈,引导分析朝着对他们最相关的领域发展,从而确保最终成果不仅可理解,而且可以立即采取行动并满足他们的需求。

使观众能够应用这些见解

可操作性围绕着将这种深层理解转化为现实世界的应用或决策。这是关于确保观众能够有效利用这些见解来推动实际结果。真正的关键在于思考分析与现实影响之间的“最后一公里”,以及你如何帮助消除任何阻碍以采纳你的见解。

例如,如果你正在进行一个定义用户流失的项目——使你的研究更易于理解可能包括创建一个仪表板,让你的业务利益相关者清楚地了解你的结果具体是什么样的。

其他想法包括举办研讨会、开发互动可视化等——任何可以帮助团队迅速适应的方式。

总结一下——从一开始就让主题专家(SMEs)参与和与利益相关者保持持续沟通,显著提升了数据分析项目的可消化性。这种协作方法确保了研究不仅易于理解,而且直接相关且有价值,符合其预期受益者的需求。

总结

成功的数据分析是技术熟练、战略对齐和实际适用性的结合体。它不仅仅是遵循一套步骤,而是理解并根据每个项目独特的背景调整这些步骤。及时性、正确执行和解决实际的组织需求是支撑连接数据分析与组织成功的桥梁的支柱。最终目标是将数据转化为能驱动价值和指导战略决策的可行洞察。

希望您喜欢阅读这篇文章!您有什么想分享的小贴士吗?在评论区告诉大家吧!

PS:此文章已经发布到 Analytics Explained,这是一个新闻简报,我在其中总结了我在各种分析角色(从新加坡初创公司到旧金山的大科技公司)中学到的内容,并回答读者关于分析、增长和职业方面的问题。