Amazon CloudWatch + Pagerduty好处
- Amazon CloudWatch为AWS资源和客户运行的应用程序提供监视。该服务可以收集数据,获得洞察力,并提醒用户解决应用程序和组织中的问题。
- Amazon CloudWatch可为资源利用率提供全系统的可见性,并且可以为跨指定阈值的指标设置通知。这些通知可以自动发送到Pagerduty,该通知可靠地通过其首选的接触方法可靠地提醒正确的呼叫响应者。
笔记
此集成可用于AWS Cloud或AWS哨所上的Amazon CloudWatch。
版本
本指南详细详细介绍了CloudWatch V1集成的配置。
这个怎么运作
- 当AWS服务指标超出预定义的阈值时,CloudWatch警报将通知发送给Pagerduty端点,从而触发事件。
- 当AWS服务指标返回到预定义阈值以下的OK状态时,将解决事件发送到同一端点,从而解决PagerDuty事件。
要求
这种集成期望在信息
属性一个嵌套的JSON编码对象;如果未收到此消息,则不会触发警报。如果您有任何疑问或需要任何帮助,请联系我们的支持团队。
集成演练
在Pagerduty
亚马逊CloudWatch可以通过两种方式与Pagerduty集成:
与事件规则集成
如果您想根据AWS的有效载荷构建不同的规则,则与全球或服务级事件规则集成可能会有益。如果您想了解更多信息,请访问我们的文章规则集。
配置事件规则集成
- 来自自动化菜单,选择事件规则并点击您默认全局规则集。
- 在事件规则屏幕上,单击“传入事件源”下拉列表并复制您的集成密钥。
- 一旦有了你的集成密钥, 这集成URL将会:
https://events.pagerduty.com/x-ere/ [your_integration_key_here]
您现在可以继续前进在AWS管理控制台中下面的部分。
配置服务事件规则集成
使用服务级事件规则:
- 创建一个通用事件API集成在您的首选服务上。
- 完成后,复制集成密钥并将其粘贴到以下URL中:
https://events.pagerduty.com/integration/ [your_integration_key_here]/enqueue
您现在可以继续前进在AWS管理控制台中下面的部分。
与Pagerduty服务集成
如果您不需要根据事件有效载荷将警报从AWS路由到不同的响应者,则与PagerDuty服务集成可以直接有益。你仍然可以使用服务级事件规则执行诸如抑制之类的动作。
添加到新服务
- 至将集成添加到新服务中, 导航服务服务目录然后单击+新服务。
- 遵循提示,并配置服务符合您的喜好。在集成屏幕上,万博pc版下载选择Amazon CloudWatch从搜索栏,下拉列表或我们最受欢迎的集成列表中。万博pc版下载
- 输入服务设置后,请单击创建服务。
- 现在,您将进入服务的集成选项卡。万博pc版下载在列表中找到您的集成,然后单击查看和复制您的集成URL并将其保持在安全的地方以供以后使用。
- 您现在可以继续前进在AWS管理控制台中下面的部分。
添加到现有服务
- 至为现有服务添加集成, 去服务服务目录并选择一个服务添加集成到。选择万博pc版下载选项卡并单击+添加另一个集成。
- 选择Amazon CloudWatch从搜索栏,下拉列表或我们最受欢迎的集成列表中。万博pc版下载
- 点击添加。在列表中找到您的集成,然后单击在查看和复制您的权利集成URL并将其保持在安全的地方以供以后使用。
- 您现在可以继续前进在AWS管理控制台中下面的部分。
在AWS管理控制台中
创建一个SNS主题
- 在服务搜索栏中,搜索和选择简单的通知服务(SNS)。在SNS仪表板菜单中,选择话题然后单击创建主题在右侧。这将用于将警报路由到AWS的Pagerduty。
- 进入一个主题名称(您可能需要以Pagerduty服务的名称命名您的话题)和显示名称,然后单击创建主题。
- 现在创建了您的主题,选择订阅在左手菜单中,单击创建订阅。
- 选择您的主题Arn并确保https是选定的协议。粘贴你集成URL(以上步骤生成)进入端点字段,确保启用原始消息传递复选框是未选中然后单击创建订阅。
- 您的订阅应自动确认。单击刷新图标以确保地位是
确认的
并不是待定确认
。 - 接下来,您将创建一个CloudWatch警报,当指标落在预定义的阈值之外时,将向您的SNS主题发送通知。
创建CloudWatch警报
- 在服务搜索栏中,搜索和选择CloudWatch。选择警报所有警报然后单击创建警报在右侧。
- 点击选择指标。选择您的公制使用以下任何一种方法:
- 选择服务名称空间其中包含度量。继续选择您的首选选项,该选项将缩小您的选择范围,直到出现指标列表为止。选择复选框在您想要的旁边公制名称。
- 在搜索字段中,输入度量,维度或资源ID的名称并点击进入。然后选择所需的结果,然后继续选择您的首选选项,直到出现指标列表为止。选择复选框在您想要的度量标准旁边。
阅读有关常用指标的更多信息这里。
- 接下来,单击查看图指标按钮。在下面统计,选择其中一个统计信息或预定义的百分位数,或指定自定义百分位数(例如,P95.45)。在下面时期,选择警报的评估期。点击选择指标接着说。
- 在下一页下,从以下条件中选择阈值类型:
点击下一个接着说。
- 首先,您将配置在警报中状态通知,当指标达到预定义的阈值时,它将触发PAGERDUTITY事件。选择在警报中和选择现有的SNS主题无线电按钮,然后选择SNS主题(上面创建)从发送通知场地。
- 接下来,您将配置好的国家通知,如果该指标已恢复到确定状态(未达到或超过阈值),该通知将自动解决Pagerduty事件。选择好的和选择现有的SNS主题无线电按钮,然后选择SNS主题(上面创建)从发送通知场地。点击下一个接着说。
- 在下一页,输入警报名称和警报描述。点击下一个接着说。
- 在预览和创建屏幕上,查看警报的详细信息。如果您需要编辑任何详细信息,请单击编辑在每个步骤的右边。确认所有详细信息后,请单击创建警报。
- 然后,您应该看到一个确认对话框,即成功保存了警报。
- 恭喜,您现在已经将Amazon CloudWatch与Pagerduty集成了!现在,当达到警报阈值时,将在Pagerduty中触发事件。一旦该警报返回确定状态,该事件将在Pagerduty中自动解决。
常用指标
指标与Amazon CloudWatch集成一起通常使用的,但不限于:
EC2
将CloudWatch集成与EC2实例指标,按照集成演练中的说明进行操作,并在您时执行以下操作创建CloudWatch警报:
- 在步骤8中,选择EC2根据实例指标。
- 检查复选框旁边实例名称与您的首选公制名称在右侧。常用的指标是CPU利用率和状态检查失败。请阅读AWS的文档有关EC2指标的更多信息。
- 继续在步骤9-16中进行说明。
S3存储镜头
将CloudWatch集成与S3存储镜头指标,按照集成演练中的说明进行操作,并在您时执行以下操作创建CloudWatch警报:
- 在步骤8中,选择S3存储指标。
- 检查复选框旁边bucketname与您的首选公制名称在右侧。常用的指标是不完整的多部分上传存储字节,,,,未加密的存储字节和非电流版本存储字节。请阅读AWS的文档有关S3存储镜头指标的更多信息。
- 继续在步骤9-16中进行说明。
eks
将CloudWatch集成与eks指标,按照集成演练中的说明进行操作,并在您时执行以下操作创建CloudWatch警报:
- 在步骤8中,选择eks容器见解。
- 检查复选框旁边公制名称在右侧。常用的指标是cluster_failed_node_count和node_cpu_utilization。请阅读AWS的文档有关EKS指标的更多信息。
- 继续在步骤9-16中进行说明。
常问问题
哪些警报状态会影响Pagerduty事件?
具有状态的警报警报将触发事件,状态确定将解决它们。具有状态的警报不足的_data将要只要触发pagerduty事件。如果你需要不足的_data要解决事件,我们建议使用电子邮件集成反而。
如果我使用电子邮件集成,如何验证我的Pagerduty Service的电子邮件地址?
如果您将确认电子邮件发送到服务的Pagerduty地址,则可以查看消息主体并从Pagerduty控制台验证该地址。为此,找到电子邮件创建的事件并查看其详细信息以验证电子邮件地址。
验证的链接将在事件细节中。SNS确认页面需要JavaScript,无法在iframe中执行该消息。要确认您的订阅,请通过右键单击链接并选择在新的选项卡或窗口中打开确认链接在新标签/窗口中打开链接。
如何更改从CloudWatch的事件将其重复重复删除为Pagerduty?
导航到您的Pagerduty服务点击万博pc版下载标签点击在亚马逊CloudWatch集成的右侧点击编辑更改值相关事件选项。
为什么我的CloudWatch事件没有在Pagerduty中触发事件?
未正确从CloudWatch发送的事件将被删除,不会触发Pagerduty中的警报。这种集成期望在信息
属性一个嵌套的JSON编码对象,从中可以从中提取有关警报的有意义的数据以构成PagerDuty事件。您可以找到有关的详细信息亚马逊的SNS消息属性在这里。
AWS还在他们的身边有一些故障排除的文档在CloudWatch侧寻找的东西。
4个月前更新