Amazon OpenSearch 服务中的可观察性 - 亚马逊 OpenSearch 服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon OpenSearch 服务中的可观察性

可观察性是通过检查复杂系统的输出来深入了解其内部状态和性能的实践。传统监控可以告诉您系统已关闭,可观察性允许您提出有关数据的新问题,从而帮助您了解系统停机的原因。

Amazon S OpenSearch ervice 通过收集和关联关键类型的遥测数据来提供统一的解决方案。

  • 日志提供带有时间戳的事件记录,例如应用程序错误、用户请求或系统状态消息。

  • 跟踪表示请求在分布式系统中通过不同服务时的旅 end-to-end程。

通过整合这些数据类型,Amazon S OpenSearch ervice 可以帮助运营团队、站点可靠性工程师和开发人员更快地检测、诊断和解决运营问题。

Service 中的 OpenSearch 可观测性工作流程

将数据从应用程序导入 S OpenSearch ervice 进行分析使用多阶段管道:

  1. 收藏

    该过程从源头开始,使用轻量级代理或收集器,这些代理或收集器从信号生产者(例如应用程序和基础架构)收集遥测数据。两种常见的开源代理是:

    • OpenTelemetry(OTel) collector — 收集日志和跟踪的行业标准和首选方法。

    • Fl@@ uent Bit — 一款轻量级、高性能的日志处理器和转发器,支持日志和跟踪 OTel 架构。

  2. 摄取(Amazon Ingestion OpenSearch )

    收集遥测数据后,数据将发送到 OpenSearch Ingestion,这是一个完全托管的无服务器数据管道。您可以创建自定义管道以:

    • 筛选-删除不必要的数据以降低存储成本。

    • 丰富-添加有价值的元数据,例如来自 IP 地址的地理信息。

    • 转换和标准化-将非结构化日志结构化为一致的格式。

    • 路由 — 将不同类型的数据发送到不同的 OpenSearch 服务索引或 Amazon S3。

  3. 分析和可视化

    处理后,数据将加载到 OpenSearch 服务域或集合中。您可以近乎实时地存储、索引和分析大量数据。您可以通过可视化界面(例如 OpenSearch UI 的可观察性工作区)与这些数据进行交互,以运行查询、构建仪表板和设置警报。

OpenSearch 用户界面和 OpenSearch 仪表板

OpenSearch Service 为可观察性提供了两个不同的用户界面。我们建议您使用 OpenSearch 用户界面,为新安装设置可观察性工作区,并从现有 OpenSearch 仪表板迁移。下表概述了 OpenSearch 用户界面与传统 OpenSearch 仪表板相比的优势。

功能 OpenSearch 用户界面 OpenSearch 仪表板
数据来源 多源-可以连接到多个 OpenSearch 服务域、 OpenSearch 无服务器集合和其他数据源。 单一来源 — 与单一 OpenSearch 服务域同地办公。
更新 新功能首先出现在这里,因为它与特定 OpenSearch 版本无关。 新功能与该 OpenSearch 版本相关。将来可能会弃用更新。
可用性 托管在AWS 云确保集群升级期间零停机时间。 在域名维护和升级期间可能暂时不可用
协作 提供工作空间,便于在特定工作流程上进行精心策划的团队协作。 协作基于在单个域中共享已保存的对象。

注意 — 为了简化入门,我们在 Amazon S OpenSearch ervice 控制台中为日志创建了新的入门工作流程,该工作流程将设置新的 OTel 量身定制的摄取管道,允许您选择现有 OpenSearch 集群,并创建具有可观察性工作空间的新 OpenSearch UI 应用程序。您所要做的就是将您的 OTel 代理指向新的摄取端点,然后就可以解锁有关 OTel 格式化数据的见解了。

由于日志和跟踪中对摄取和分析的处理方式不同,因此我们创建了单独的部分来深入研究。