摘要:Datadog推出内部开发者门户(IDP),旨在简化DevOps流程,整合可观测性工具,满足技术和非技术用户的需求。IDP通过平台工程,连接开发、运维和安全团队,实现数据驱动的决策,并提供集成的安全和监控解决方案。
Datadog推出内部开发者门户(IDP),旨在简化DevOps流程,整合可观测性工具,满足技术和非技术用户的需求。IDP通过平台工程,连接开发、运维和安全团队,实现数据驱动的决策,并提供集成的安全和监控解决方案。
译自:Is Datadog Becoming a Platform Engineering Company?
作者:B. Cameron Gain
纽约 – Datadog 在本月于此地举行的年度用户 DASH 大会上宣布的 内部开发者门户 (IDP) 可能会取代许多 平台工程 流程。但除了平台工程师支持之外,其理念是让开发者、运维人员和非技术用户更容易使用 DevOps 和 可观测性。Datadog 将成为平台工程提供商和可观测性提供商——如果它能说服 DevOps 团队采用可以被描述为以可观测性为中心的平台工程,那么它就能实现这个目标。
在发布超过 100 项公告之际,其 IDP 反映了其客户和用户以及所有可观测性提供商的需求:客户组织正在寻求消除工具使用中的重叠。这意味着他们的总体需求量可能保持不变甚至增加,但他们正在积极寻求减少总体上合作的可观测性工具供应商的数量。
各个组织需要更智能、更易于解释的遥测数据和分析。通过这种方式,不太懂技术的 CTO 或其他非 DevOps 利益相关者可以理解所有这些日志和指标,并且以一种只有内部可观测性和安全专家才能理解的方式来理解。随着可观测性成为保护数据和基础设施不可或缺的一部分,人们需要更多、更好的安全集成。已经证明,平台工程可以作为管理可观测性以及所有 IT 基础设施的最佳方式。AI 代理 当然将在上述当前和未来情况中的所有可观测性需求中发挥关键作用。
以上内容也说明了为什么平台工程结构是 Datadog 通过其 IDP 提供的产品中的一个主要组成部分——它是 100 多项 DASH 公告中最重要的公告之一——并且与其以及用户目前拥有的其他工具和平台集成。
Datadog 联合创始人兼首席执行官 Olivier Pomel 在 DASH 大会期间告诉一群分析师和记者:“总的来说,我们看到 SRE [站点可靠性工程] 和平台团队正在从今天这种非常受中断驱动的状态——处理数百万起火灾——朝着更中长期规划的方向发展:弹性工程、性能工程以及安全工程。” “我们认为这将使他们有更多时间将安全工程提升到首要地位。”
虽然始终需要平台工程师,但平台和 AI 代理的支持应在消除构建和维护平台工程结构的许多手动任务方面发挥重要作用。通过其 IDP,Datadog 旨在让平台工程团队成员能够花费更多时间来做设计或管理后端基础设施或其他通过平台工程使用 IDP 完成的任务的有趣工作,同时消除与创建和管理自建平台工程系统相关的许多手动任务和繁琐工作。
Pomel 说:“希望我们能够帮助平台工程团队更好地工作,因为他们不必构建这些东西——他们可以使用它。” “然后他们可以专注于在内部实施哪些最佳实践。”
TechTarget 旗下 Enterprise Strategy Group 的分析师 Torsten Volk 本周告诉我,可观测性已成为平台工程的关键组成部分,因为每个平台都需要为开发人员和企业提供有关当前开发流程的合规性、质量、风险和业务影响的实时见解。但是,在这种情况下,情况有些逆转。
Volk 说:“通常,我们看到开发者平台供应商集成可观测性工具,但在这种情况下,情况恰恰相反。从可观测性平台开始很有趣,因为它为真正的数据驱动的软件开发奠定了良好的基础,在这种开发中,开发过程与应用程序在生产中的行为密切相关。” “这鼓励开发人员观察他们的代码更改对生产应用程序的影响。另一方面,我们可以让 DevOps 工程师和平台工程师持续监控、改进和修订他们可以用来评估新代码发布影响的关键业务指标。”
Datadog 的 IDP 可以追溯到该公司卑微的起点,当时它是一家位于纽约市的新兴创业公司,十多年前只有几位工程师。
Pomel 说:“这个想法是回到 Datadog 的基本原则:让每个人都达成共识。我们甚至不是从监控开始的——我们是从‘嘿,让我们让开发和运维进入同一个平台’开始的。” “随着时间的推移,我们将其扩展到不同的角色,并说,‘让我们把安全工程师、产品经理、FinOps 人员——所有其他必须关心应用程序的团队都拉进来。让我们把他们都纳入其中。’”
正如 Datadog 所展示的那样,可观测性只是 IDP 提供的一种功能,旨在满足技术和非技术利益相关者的需求。Datadog 表示,它旨在满足开发人员、运营团队、CTO 和非技术利益相关者的需求。它不仅为开发人员提供不同的 DevOps 工具来进行可观测性,而且还旨在提供按需点击的可用工具,不仅用于可观测性,还用于各种 DevOps 甚至商业智能工具。对于开发人员来说,还有机会让他们使用平台内提供的他们最喜欢的工具。
Pomel 说:“我们发现我们的许多用户不得不构建一些自制解决方案,将他们的文档与他们的一些生产监控、他们的一些架构图和他们的一些内部流程联系起来。” “他们要么完全在内部构建,要么在开源之上构建,其中 Backstage 是他们使用的工具之一。”
未来的可观测性平台有望提供不仅关于问题的详细知识,而且还以一种简化的方式提供对网络中当前发生的情况的全面分析,以便安全团队、CTO、开发人员和其他非技术利益相关者能够理解和利用。就 Datadog 的 IDP 而言,平台工程组件提供了起飞点,最终可能会覆盖所有与基础设施相关的事物。
Datadog 在其文档中对其 IDP 的描述仍然有些崇高,将其描述为“集中知识、简化流程和提高运营效率”的一种方式。但是,它引用的具体用例涵盖了广泛的实用性,这些实用性共同超越了昨天典型的可观测性案例,尤其是与 Datadog 曾经是一家新兴的应用程序性能监控 (APM) 平台提供商时相比:
简化 API 管理管理和优化云成本管理开发团队中的应用程序和 API 保护态势加速开发人员入职管理和绘制依赖关系图评估生产准备情况改进事件响应CI 支持在 DASH 主题演讲中,Datadog 的工程经理 Muhan Guclu 描述了一个噩梦般的场景,即一个服务依赖项在半夜崩溃,以及“填补空白有多么困难”。他展示了今天,借助 IDP 的软件目录,用户如何将他们的服务用作“一个更大的整体的一部分”。
正如 Guclu 用 Datadog 的 IDP 所演示的那样,可以使用全新的开始,或者可以从 Backstage 导入现有拓扑来解决该问题。Guclu 展示了使用 Datadog 中已有的内容,一个全新的开始包括系统架构的所有单独部分。Guclu 说,使用 AI,这些部分被组合成“上下文丰富”的系统,带有标题和描述来解释它们之间的关系。
“在顶部,很容易找到代码所在的位置以及哪些文档可用。提供了有关已使用 Datadog 监控的服务的详细信息。从 Backstage 迁移过来时,Datadog 完善了画面,填补了空白并将实时遥测叠加到每个组件上,”Guclu 说。“了解系统与最佳实践的关系也会导致延迟。最佳实践通常只在偶尔的迁移电子邮件中提到。”
Guclu 在承认迁移通常只包括“更改几行 YAML”的同时表示,基础设施团队和平台团队之间的来回通常会减慢他的进度。Guclu 展示了如何使用自助服务操作“快速安全地”查找基础设施管理模板,用于数据存储等组件,或者使用 Terraform 启动新的模板来创建 S3 存储桶。使用 IDP 执行此操作需要提供有关存储桶、区域和理由的信息,然后创建一个拉取请求。
然后会自动创建一个新的拉取请求并分配给基础设施团队进行批准,并且“我可以在 GitHub 中查看它”,Guclu 说。创建存储桶后,Guclu 展示了它如何自动显示为系统概述页面中的依赖项。“它符合我们需要的一切,涵盖法规、内部流程和最佳实践以及任何权限,”他说。“作为一名平台工程师,我喜欢构建像这样的模板的想法,但我不想再学习另一个特定于产品的系统。”
在主题演讲结束时,Guclu 对 IDP 的覆盖范围提出了大胆的主张:“Datadog IDP 是唯一可以了解您的系统并自动保持更新的开发者门户,”Guclu 说。“您可以了解您的服务而无需额外开销,使用记分卡跟踪最佳实践,并使用 AI 管理您的基础设施。”
高级产品经理 Brooke Chen 讨论了她如何为了响应客户的需求和痛苦而努力推出 IDP。Chen 在接受采访时告诉我,在“大量痛苦的企业客户对话”之后,她是第一个相信该项目的人。
Chen 说,像 IDP 这样的趋势以及从传统 DevOps 向拥抱平台工程的转变实际上对工程领导者(包括 CEO、VP 等)更具吸引力。开发人员和个人贡献者 (IC) 最终是这场运动的主要受益者,“但从根本上讲,这是关于在扩展基础设施的同时扩展您的工程实践,”Chen 说。
“我认为许多工程领导者都面临着被拉向不同方向的挑战。借助微服务,团队有权采用自己的技术和堆栈。因此,问题就变成了:如何确保在广泛的层面上,团队不会以快速行动的名义引入新的风险?”Chen 说。“我们的许多数据客户都是大型组织,他们非常关心治理和标准化,同时试图平衡可扩展性和速度。这就是 IDP 的用武之地——它们是一个真正有效解决这些问题的产品类别。”
虽然我下载了基本查询并将其应用于监控指标、访问服务、创建拉取请求以及使用 IDP 仪表板执行其他基本任务,但到目前为止,我们尚未测试其全部功能。但是,如果 Datadog 的 IDP 能够按需工作,它将成为可观测性和 DevOps 的又一次飞跃。Volk 说:“在整个组织中扩展成功的 DevOps 实践是企业技术中尚未解决的关键挑战之一。复制 DevOps 成功的做法需要基于一些指标,这些指标可以提供对软件交付的速度和可扩展性的全面、可量化的见解。” “最终,这使组织能够预测问题并通过自动化和流程改进主动解决这些问题。”
Datadog 在可观测性方面的背景和专业知识已成为创建用于平台工程的 IDP 的重要基础。Volk 说:“IDP 的指标驱动方法是开发人员、运营商和企业之间实现最佳协作的基础,因为它们为持续保持一致的决策提供了共同的基础。” “从头到尾思考一下,这是在整个企业中始终如一地实施数据驱动决策的理想基础。”
在谈到可观测性领域发生的变化时,Pomel 说:“我们的大多数安全客户都是从可观测性开始的。这是自然之路——他们使用我们的产品进行可观测性,并且由于我们已经进行了检测,因此很容易添加安全性,”Pomel 在新闻发布会和分析师简报会上说。“但我们现在开始看到客户首先因为安全问题来找我们——尤其是在 SIEM [安全信息和事件管理] 领域——因为许多大公司已经采用了 SIEM,并且他们现在正在根据云和 AI 重新审视这些选择。这导致他们给我们打电话,即使他们没有使用我们的基础设施监控或 APM 产品。”
具体到 IDP,安全和可观测性数据不仅扩展到开发人员,还扩展到所有利益相关者。Pomel 说:“安全构建产品的唯一方法是使安全成为开发、运营和安全部门的共同责任。” “您不能只让安全团队拥有所有权,因为他们太小了。在任何公司中,对于每位安全工程师,基本上都有 10 位运营工程师,而对于每位运营工程师,都有 10 位软件工程师。因此,真正的杠杆作用在于工程团队。”
如今,一个具有深远影响的可观测性平台必须由安全、网络和监控三部分组成,并且在 Datadog 的案例中,还需要一个 IDP,以满足在之上运行的平台工程的需求。Datadog 的 IDP 旨在打破或已展示如何打破 DevOps 团队和利益相关者之间的所谓孤岛,如果它像预期那样工作,则可能会将 DevOps 转换为更平台工程的结构。
Volk 说:“将 DevOps、平台工程、开发人员和安全联系起来对于成功的应用程序开发至关重要。” “从性能指标开始并从那里构建平台可以确保采用真正的数据驱动的 DevOps 方法。这可以使普通企业更容易始终如一地实现 DevOps 的成功。”
与此同时,Pomel 说,Datadog 作为软件即服务 (SaaS) 提供商的方法与行业中的大多数方法不同。“该行业的其他部分非常分散——功能很薄弱,每个类别都有供应商生态系统,”Pomel 说。“作为客户,您最终必须购买 12、15 甚至 24 种不同的产品才能满足您的所有需求。这会造成内部可用性问题、工具之间的差距以及难以获得全部价值。”
Datadog 及其 IDP 的想法是从提供一个集成平台开始的——“就像我们对可观测性所做的那样,我们现在将其应用于安全性,”Pomel 说。“而且因为我们已经涵盖了可观测性,所以我们已经部署在各个地方。我们已经拥有了所需的信号。我们知道机器、网络、用户、工程师和代码中发生了什么。因此,我们已经拥有了使这项工作所需的许多数据,”Pomel 说。“当然,挑战在于有数百家竞争对手。在每个类别中,都有十几家公司专注于这一小部分。因此,我们正在努力构建一个完整的安全套件,该套件至少可以像这些单独的供应商一样涵盖这些领域——并通过消除差距来增加价值。”
来源:小黄科技频道