实例探究.
添加案例
我们的案例数据库覆盖了全球物联网生态系统中的 22,657 家解决方案供应商。
您可以通过筛选条件进行快速浏览。
Download Excel
筛选条件
-
(20)
- (10)
- (6)
- (4)
-
(19)
- (19)
-
(9)
- (8)
- (1)
- (1)
- 查看全部
-
(4)
- (3)
- (1)
-
(1)
- (1)
- 查看全部 5 技术
- (15)
- (4)
- (4)
- (4)
- (3)
- 查看全部 16 行业
- (23)
- (13)
- (10)
- (10)
- (8)
- 查看全部 7 功能区
- (18)
- (18)
- (7)
- (7)
- (7)
- 查看全部 15 用例
- (35)
- (21)
- (15)
- (4)
- (4)
- 查看全部 5 服务
- (40)
Selected Filters
![]() |
通过提高可视性来降低运营开销并创造价值
随着 Arc XP 的发展,运营开销也随之增加,Arc XP 团队越来越难以跟踪环境并满足 SLO。团队需要找到一种可以在复杂环境中工作的监控工具,让组织能够专注于为客户创造价值。该公司的云基础设施正在扩展到全球多个地区,足够的可见性对于确保为客户提供高质量的体验至关重要。此外,工程团队希望有一个更好的工具来帮助他们提供技术支持和 IT 运营。工程师没有通用的主动警报系统可以在问题出现时立即通知他们,也没有可以帮助他们快速诊断问题的解决方案。这些技术障碍虽然很严重,但最终给组织带来了更根本的业务挑战。Arc XP 团队花在运营和支持上的时间越多,他们利用自身优势实现组织创始使命的机会就越少。
|
|
|
![]() |
确保平台高度可用且高度可扩展
Braze 是一家开发客户关系管理软件的云公司,在扩展系统和解决客户支持问题方面面临挑战。该公司处理超过 80 亿个 API 请求,每天向超过 24 亿月活跃用户的网络发送超过 27 亿条消息。随着工程组织的不断发展,团队拥有不同的技术和工具来评估其应用程序的性能并扩展其系统。该组织需要一种统一的方法来确定所配置的基础设施是否适合流量、预测未来需求并调查与性能相关的问题。此外,许多技术客户支持问题直接上报给产品和 DevOps 工程团队,当问题涉及性能、正常运行时间或吞吐量时,实际上绕过了全球服务和支持团队。这导致工程部门分心,并使支持和成功部门无法快速解决客户问题。
|
|
|
![]() |
丰田通过使用 Datadog 监控 AWS 实现更快、更安全的大规模部署
丰田汽车北美公司 (TMNA) 于 2015 年开始使用 Amazon Web Services (AWS) 来简化和标准化云中的应用程序开发并缩短上市时间。但是,该团队缺乏一致的监控工具,这带来了可靠性问题。一些开发人员使用开源工具,另一些开发人员使用日志管理工具,而有些开发人员什么都没用。因此,团队成员经常花费数小时试图找出中断的根本原因,因为他们不知道要查找什么或在哪里查找。由于总共有 1,600 个应用程序(300 个在云中)和 100 多个团队,这是一项艰巨的任务。除了获得统一的可见性之外,云平台团队还寻求缩短平均检测时间 (MTTD),并确保他们可以满足 99.9% 正常运行时间的 SLA,同时降低成本并帮助工程师提高效率。
|
|
|
![]() |
易于使用、可扩展且维护成本低的监控
Vistar Media 是一家为数字户外广告行业提供程序化平台的公司,随着基础设施的发展,该公司面临着挑战。他们需要一种强大的方法来监控实时服务,但又不想花时间管理自己的监控解决方案。他们正在寻找一种可扩展、低开销的解决方案,可以与现有的服务和数据库(如 Python、StatsD、Amazon EC2 和 Amazon S3)集成。这将使他们的团队能够专注于为客户提供服务。在他们之前的设置中,他们严重依赖开源项目 Graphite,并且有超过 12 台服务器专门用于收集监控指标。随着公司的发展,他们不得不花费越来越多的时间来确保监控服务器以与公司相同的速度扩展。
|
|
|
![]() |
发展全球性公司
Fintonic 是一家个人理财规划和移动银行服务公司,该公司正在快速发展并向新市场扩张。他们采用了基于 Kubernetes 的微服务架构来促进其全球扩张。但是,使用现有的监控工具,需要花费一些时间来培训新工程师,因为他们需要学习专门的查询语言来手动关联多个工具之间的日志。由于监控工具无法根据标签定位警报,因此团队在警报覆盖范围和优先级方面遇到了困难。随着业务的快速发展,使用现有的监控工具培训新工程师变得困难。他们需要采用 Kubernetes、Terraform 和 Ansible 的无状态架构,以便能够在智利和墨西哥复制他们为西班牙构建的架构。
|
|
|
![]() |
Charm Industrial 使用 Datadog 实时访问关键数据,以减少气候变化的影响
Charm Industrial 的目标是减少全球变暖和气候变化的影响。要实现这一目标,Charm 每年需要使用一批快速移动的热解器从大气中封存数十亿吨二氧化碳 (CO₂)。Charm 最终将全天候运行数万台热解器。对于 Charm 的软件和电子部门主管/科学家 Edward Young 来说,这是一个巨大的挑战。“当你拥有数万个系统时,你不可能在每个站点都安排操作员,”他说。“为了扩大业务规模,我们需要一种方法来同时远程实时监控多个系统。”Charm 的热解器系统利用高温分解农业和森林生物质残留物,并将其转化为生物油,用于碳去除。这些系统执行各种工作,并具有严格的安全标准。每个系统都包括测量关键数据(如温度和压力)的传感器,以确保 Charm 不超过安全阈值。团队需要实时监控所有这些数据。
|
|
|
![]() |
Alpiq 通过 Datadog Marketplace 简化了 MuleSoft 监控
Alpiq 是一家瑞士能源服务提供商和电力生产商,该公司使用五种独立的监控工具,这降低了生产力、增加了成本,并阻碍了其实现端到端的可视性。作为全公司云迁移计划的一部分,该团队还需要从其 Tibco 本地集成平台迁移到基于云的 MuleSoft 平台,并在 Datadog 环境中启用 MuleSoft 监控。如果无法正确了解其集成平台的性能,Alpiq 的团队将难以及时集成应用程序并解决问题,这可能会影响交易和发电厂运营等基本功能。
|
|
|
![]() |
数据驱动的可观察性的主动方法
Compass 是一家房地产经纪公司,该公司的业务正在呈指数级增长,需要一种可持续的监控策略,该策略可以随着工程组织的发展而扩展。他们使用的是一套不同的监控产品,这意味着工程师通常必须使用多种工具来解决一个问题。这种不断的上下文切换造成了团队之间的摩擦,并导致工程师精疲力竭。此外,他们用于监控前端堆栈的单点解决方案由于对用户配置的支持不佳而引入了过多的管理开销,并且经常由于配置不当而产生误报。随着 Compass 迅速扩大其工程团队,这个过程成为了瓶颈,不再令人接受。
|
|
|
![]() |
云计算的演进
随着 Nordcloud 将其业务范围扩大到整个欧洲,他们面临着开发下一代云服务的挑战。他们意识到,有些需求在内部很难或无法有效解决。Nordcloud 寻求具有自然一致性的独立软件供应商 (ISV) 来填补其产品中的特定空白。他们需要合作伙伴来帮助扩展他们的云解决方案服务,特别是在监控领域。监控云解决方案是托管服务环境的最后阶段,是降低成本和 SLA 故障的关键。Nordcloud 需要解决客户拥有多租户环境或需要比开源工具或传统网络监控工具所能提供的更多可见性的情况。
|
|
|
![]() |
游戏服务器监控
EA DICE 正在为《战地 5》测试版发布后预计的流量规模做准备。他们希望在发布计划中确保稳定性和低延迟,并确信他们的客户可以不间断地享受新游戏。游戏服务器团队一直在寻找一个中央日志管理解决方案来补充他们使用 Datadog 进行基础设施监控,他们已经评估了许多日志解决方案。从一开始,他们只对能够提供日志洞察的解决方案感兴趣,而他们的团队无需运行和维护日志系统或产生任何其他开销。第二个要求是找到一种经济高效的日志解决方案来监控游戏服务器,因为日志量很大。最后,他们想要一个可以与他们技术堆栈中的一切集成的日志解决方案。
|
|
|
![]() |
合作在拉丁美洲带来共同成功
Econocom 是一家 B2B 经销商和技术咨询公司,需要一种监控解决方案来支持其客户的现代化和云迁移项目。他们需要一种能够快速轻松部署的解决方案,使他们能够专注于发展高附加值的咨询服务。Econocom 正在寻找一种可以覆盖任何客户堆栈并可以快速实施以加快交易周期的产品。他们还需要一个现代化的监控平台,旨在促进临时、基于云和基于 Kubernetes 的系统内的 DevOps 式通信。
|
|
|
![]() |
Eight Sleep 利用 Datadog 实现端到端可观察性
Eight Sleep 是一家位于纽约市的睡眠健身公司,需要一款强大的可观察性解决方案。该公司希望更好地了解用户对其应用的体验,并在问题发生之前加以预防。当时,Eight Sleep 使用的解决方案对一些公共端点执行正常运行时间测试,但该解决方案过于基础且缺乏可配置性。工程师经常在半夜接到呼叫,最终被证明是误报。由于开发团队规模较小,Eight Sleep 需要一款能够帮助其快速轻松完成任务的工具。该公司的竞争对手拥有三到四倍的工程师,因此他们需要一款能够以最少的工作量完成其声称可以完成的工作的工具。
|
|
|
![]() |
Glovo 利用 Datadog 云安全管理打造全企业安全文化
Glovo 是一家按需配送服务公司,它面临着在资源有限的情况下保护其云基础设施的挑战。随着公司功能集和 AWS 云环境的扩大,Glovo 平台安全主管 Eloi Barti 希望以同样的速度扩展安全性。为此,Barti 试图将安全文化带到工程团队的首位。然而,谈到安全性,Barti 说 Glovo 使用了几种不同的工具,当事件发生并需要调查时,工程师不知道要查看哪种安全工具。工程师必须搜索各种工具,快速适应工具提供的上下文,并手动关联脱节的字段以了解警报是误报还是真正的安全事件。
|
|
|
![]() |
通过集中警报、事件和指标来预防未来技术问题
CircleCI 团队使用的是几种拼凑起来的监控工具。随着 CircleCI 应用程序基础架构的扩展,跟踪服务器、数据库和其他 IT 组件的运行状况和性能变得非常繁琐,因为他们每周必须花费数小时手动关联现有监控解决方案的输出。最后一根稻草是 CircleCI 错过了一次本应被其监控系统及早发现的中断。Lowe 当时知道他“已经达到了 [他们的] 工具的极限”,需要实施一种更有效、更灵敏的监控解决方案,该解决方案可以随着 CircleCI 的增长而自动扩展。
|
|
|
![]() |
通过统一监控平台提高应用程序性能和 DevOps 协作
HashiCorp 的自托管监控工具可用性差,导致其系统缺乏可见性。这导致工程师无法快速获得有关新产品功能的反馈,也无法有效地解决问题。实时监控和警报的有限访问权限阻碍了团队对问题的响应,导致事件诊断和解决出现不必要的延迟。可见性的缺乏归因于 HashiCorp 当时使用的自托管监控工具可用性差,导致工程师无法有效地解决问题或获得有关新产品功能的实时反馈。实时监控和警报的有限访问权限阻碍了团队对问题的响应,导致问题诊断和解决出现不必要的延迟。如果无法跟踪和比较当前和历史状态,故障排除将成为一项被动、耗时且繁琐的任务。
|
|
|
![]() |
物联网系统的完整可观察性
Automotus 是一家路边管理公司,其 IoT 设备和扩展云资源面临挑战。他们需要一个强大的监控解决方案,以便能够查看其 IoT 设备以及扩展云资源。事实证明,他们手动和被动的监控方法效率低下。他们无法收集重要的硬件指标,例如网络吞吐量、I/O 负载和内存,这意味着他们经常错过设备性能下降的最初迹象。如果他们的设备停止发送消息,他们就不得不通过 SSH 进入系统并手动对日志进行分类,这是一个极其耗时的过程,需要所有人参与。他们也无法查看对其系统至关重要的管理和后端服务,例如 AWS IoT Core。由于缺乏一个集中式平台来查看和分析这些数据,这些问题变得更加严重。由此产生的盲点阻碍了他们的故障排除过程,他们只能祈祷一切顺利。
|
|
|
![]() |
Datadog 助力法国国家铁路公司加快数字化转型步伐
法国国有铁路运营商 SNCF 于 2016 年启动了一项重大的数字化转型计划。该计划的目标是通过将 90% 的应用程序迁移到云中并采用 PaaS 和容器化来更新其 IT 基础设施并提高竞争力。然而,SNCF 发现它没有协调一致的监控方法。业务部门一直在独立采用监控解决方案,导致公司总共使用 11 种不同的监控工具。缺乏单一的标准监控工具严重限制了每个团队的监控范围,使得不同的 IT 团队难以就共同的问题进行合作。这显然阻碍了该组织提高竞争力和敏捷性的目标。此外,SNCF 现有的监控工具不是云原生的,导致用户摩擦和额外的管理开销。
|
|
|
![]() |
使用 Datadog APM 和 Continuous Profiler 构建大规模、高吞吐量平台
Cvent 是一家市场领先的会议、活动和酒店业 SaaS 提供商,由于全球 COVID-19 疫情,该公司不得不调整其整个产品路线图战略,专注于为虚拟、混合和面对面活动构建新解决方案。他们计划在其年度客户会议 Cvent CONNECT 上推出新平台 Cvent Attendee Hub,并在该平台上举办活动。这意味着它的性能必须无可挑剔,而且他们只有六个月的时间来交付。Cvent 的站点可靠性架构师 Ian Schell 的任务是确保 Attendee Hub 能够适应虚拟活动的广泛覆盖面和增加的注册量,而虚拟活动的注册量通常会超过面对面活动。由于该产品是全新的,因此在使用模式和规模方面存在许多未知数,与某些面对面活动相比,参与者的数量可能高出一个数量级。
|
|
|
![]() |
Glovo 利用 Datadog 数据库监控扩展按需配送应用程序并消除停机时间
Glovo 是一家按需快递服务公司,业务遍及 25 个国家/地区。该公司面临着巨大的挑战,因为其数据库资源消耗无法跟上其预期的增长速度。随着公司开始向微服务迁移,它需要更好地了解其数据库,以降低 CPU 使用率并防止代价高昂的停机。随着运行的数据库和查询数量的增加,他们发现数据库配置不正确,并且经常达到 CPU 容量。这导致 2022 年停机时间长达三到四个小时。Glovo 使用的现有监控产品无法提供他们所需的洞察力。实时监控和警报的访问权限有限,阻碍了团队对问题的响应。他们还缺乏跟踪和比较当前和历史性能数据的能力,使得调查变得手动且繁琐。
|
|
|
![]() |
实现所有开发团队的运营可视性
MercadoLibre 是拉丁美洲最大的在线市场,它面临着分布式应用程序和动态混合云基础设施的可视性挑战。他们一直在使用各种开源工具来监控他们的框架,但这些不同的解决方案使他们很难且耗时地关联来自整个堆栈的遥测数据。事实证明,共享混合云环境中不同团队不断做出的更改过于动态,这些基本的监控工具无法处理。他们需要一种专门用于监控动态混合云基础设施中的多个应用程序的工具。
|
|
|
![]() |
通过为开发人员提供面向工作流的运营监控系统来提高员工生产力
随着 SimpleReach 平台的发展,团队开始花费更多时间在基础设施更新期间跟踪和比较性能指标。他们现有的开源监控工具造成了开发团队和运营团队之间的脱节,使得难以评估生产环境中频繁更改对性能的影响。潜在的问题是一个熟悉的问题:开发和运营之间的脱节。“开发人员没有意识到他们所做的更改如何影响生产环境,”Lubow 回忆道。“有些影响是巨大的,而应用程序和系统软件都需要频繁更改,这使得这种情况难以维持。”
|
|
|
![]() |
电子商务平台借助 Datadog 和 AWS 大规模提高弹性
Neto 希望将其现有的传统基础设施迁移到云中,以推动自动化并支持客户的增长。但是,他们现有的监控工具无法动态扩展,也无法跨临时基础设施组件跟踪服务。这带来了挑战,因为他们需要一种能够在高度自动化的环境中提供实时可见性的监控解决方案。在迁移到 Amazon 公共云 (AWS) 之前,维护和扩展 Neto 的传统基础设施速度慢、反应迟钝且容易出现技术问题。Neto 的基础设施环境经常不同步,如果不进行手动、耗时的流程,就很难增加容量或将更改部署到生产中。
|
|
|
![]() |
提供灵活的解决方案以适应基于服务的架构并随着业务的快速增长而扩展
Airbnb 是一家领先的社区驱动型酒店公司,它面临着保持服务可靠性的挑战,同时又要快速适应新的业务机会。他们为网站的一些组件开发了基于服务的架构,而其他组件则继续作为其主要应用程序的一部分。他们成立了单独的工程团队来支持单独的组件和功能。随着时间的推移,他们添加了许多不同的监控系统,一些系统向中央仪表板应用程序报告,另一些系统则更加独立。这种方法变得难以扩展,因此他们开始寻找更全面、更全面的运营绩效解决方案。
|
|
|
![]() |
合作伙伴在 Datadog 市场找到新的收入来源
总部位于波士顿的技术咨询公司 RapDev 希望扩展其集成和实施服务产品,以释放更多收入增长潜力。他们在 Datadog Marketplace 中看到了一个机会,即通过为旧版操作系统和内部 IT 提供支持来增强 Datadog 现有的监控功能。挑战在于利用 Datadog 平台大规模实施项目和转型,使其客户群多样化,并创造新的收入来源。
|
|
|
![]() |
自信地向数百万人提供流媒体直播体验
Seven.One Entertainment Group 是德国多频道娱乐行业的领先企业,它面临着竞争激烈的市场,观众的习惯也迅速变化。用户正在从传统电视转向视频点播和互动式第二屏体验。该公司需要以只有 DevOps 实践才能提供的敏捷性来执行。然而,缺乏一个单一的监控工具来提供整个应用程序的可见性并让工程师能够跟踪跨服务的请求,这阻碍了他们的 DevOps 思维。每个团队都使用自己的监控解决方案,因此没有工具提供整个应用程序的可见性或让工程师能够跟踪跨服务的请求。缺乏足够的监控也使 Seven.One Entertainment Group 难以提供现场互动节目,这些节目吸引了多达 1000 万同时在线观众。
|
|
|
![]() |
Arc XP 利用 Datadog 的实时可视性确保生产中的应用程序安全
Arc XP 希望增强其安全监控能力和纵深防御策略,以便能够快速检测并应对针对其 Web 应用程序和 API 的攻击。作为一家拥有独立运营部门的组织,Arc XP 希望拥有一个单一事实来源,以便其不同团队之间能够更有效地协作。此外,Arc XP 需要检测其客户代码中的可疑行为。Arc XP 平台允许客户在 Arc XP 应用程序中运行自己的代码,从而创建一个共享安全责任模型,Arc XP 负责平台,其客户负责其代码。
|
|
|
![]() |
伯克利实验室的材料项目使用 Datadog 云监控来简化 AWS 上的可观察性
材料项目是美国能源部支持的伯克利实验室研究计划,该项目希望通过更新其单体网站,让越来越多的用户能够更轻松地访问其材料研究。该项目的计算大大减少了研究人员发明新材料的时间,节省了数月甚至数年的艰苦工作。然而,随着该项目的扩展以满足美国和全球的需求,其本地单体堆栈已难以满足用户和内部需求。该项目还缺乏对服务使用情况和故障的洞察。由于材料项目是公共资助的,因此它需要一个经济实惠的解决方案来配合其基础设施堆栈各方面的现代化,以实现微服务架构。
|
|
|
![]() |
随着开发团队的分散和不断壮大,监控也随之扩展
Bazaarvoice 需要一种能够支持其不断发展和分散的开发方法的监控解决方案。扩展其现有的监控系统需要每个团队不仅要托管和管理自己的可观察性工具,还要学习基础设施监控领域的特定专业知识。Bazaarvoice 已经在其旧系统上使用了许多不同的监控解决方案。扩展现有的监控系统需要每个团队不仅要运行自己的监控服务器,还要学习基础设施监控领域的特定专业知识。对于 Bazaarvoice 来说,这将涉及 50 多个不同的监控服务器,每个服务器都有自己的自定义设置、指标和命名约定。对于一个每 6 到 9 个月规模翻一番的团队来说,在这样一个脱节的系统上保持简单有效的操作几乎是不可能的。Bazaarvoice 需要一种能够支持其不断发展和分散的开发方法的监控解决方案。
|
|
|
![]() |
监控规模随 Blue State Digital 快速增长的基础设施而扩大
Blue State Digital (BSD) 拥有一个复杂的堆栈,其中包含多层 Web 服务、数据库和负载均衡器,它们依赖于各种系统,包括 Linux、PHP、MySQL、RabbitMQ 等。他们还正在将其基础设施的部分内容迁移到 Amazon Web Services (AWS),以进一步支持快速的基础设施增长。随着 BSD 转向更具动态的云环境(包括自动服务器配置),手动更新服务器数量、检测和警报开始占用大量时间和开销。他们需要一种能够轻松与现有技术设置集成并与基础设施一起轻松扩展的监控工具。
|
|
|
![]() |
监控复杂且可弹性扩展的云基础设施以避免性能问题
GameChanger 运行一个复杂且可弹性扩展的云基础设施,该基础设施托管在 Amazon Web Services (AWS) 上,以支持其移动和基于 Web 的应用程序。此环境包括多个数据库和服务,每个数据库和服务都需要监控。从数以万计的来源获取数据,将其转换为易于阅读的片段,然后实时推送给粉丝,这意味着 GameChanger 必须随时准备好处理高流量、大量 I/O 并解决问题。GameChanger 首先从开源组件 Graphite 和 StatsD 内部构建了自己的基础设施监控工具。这些自主开发的监控工具完成了工作,但价格昂贵:它们需要额外的 1,000 美元 AWS 资源和每月超过半个 FTE 的小时数才能保持 GameChanger 的运行。
|
|