事件响应
Oregondot @ flickr

主题专家

如果您在Pagerduty的任何团队中都在待命,则可能会为一个重大事件进行编写,并有望作为主题专家(SME)为您的服务做出回应。此页面详细介绍了您需要了解的一切,以便为这一责任做好准备。如果您有兴趣成为事件指挥官,请看一下事件指挥官培训页面

呼叫期望

如果您对团队有一定的待命,那么您对此有一定的期望。这同时适用于主要和次要通话。在系统中进行有关SEV-3或SEV-4的分页,与使用主要的SEV-2相比,期望的期望不同。

在待命之前

  1. 通过已经熟悉我们的事件响应政策和程序来做好准备。尤其是,
    1. 事件的不同角色- 您将充当“解析器”或“ SME”。但是您应该熟悉其他角色以及他们将要做什么。
    2. 事件致电礼节- 在事件电话中如何表现。
    3. 在事件中- 在事件中该怎么办。您对“解析器”步骤特别感兴趣,但是您应该熟悉整个文档。
    4. 词汇表- 熟悉通话过程中可能使用的术语。
  2. 确保您已经设置了警报方法,并且Pagerduty可以绕过您的“不要打扰”设置
  3. 检查您可以加入事件通话。您可能需要安装浏览器插件。您不想在第一次分页时这样做。
  4. 请注意您即将到来的电话时间,并安排旅行,假期,约会等方面的互换。
  5. 如果您是事件指挥官,请确保与事件指挥官同时不接待团队。

在呼叫期间

  1. 在您的呼叫期间,随时随身携带笔记本电脑和互联网(办公室,家,MIFI,带有绑扎计划的电话等)。
  2. 如果您有重要的约会,则需要让您的团队中的其他人提前介绍该时间段。
  3. 当您收到有关重大事件的警报时,您应该尽快加入事件通话和松弛(几分钟之内)。
    1. 事件指挥官将问您问题或采取行动。简洁地回答问题,并遵循所有采取的行动(即使您不同意它们)。

反应动员

发生事件时,必须动员或指派成为事件响应的一部分。换句话说,直到您通过页面动员到事件或事件中的其他人直接询问该事件,您才能保持自己的日常角色。动员后,您的第一个任务是签入和接收分配。虽然很诱人地看到事件发生并想跳入并提供帮助,但当出现尚未要求的资源时,事件的管理可能会受到损害。

“毫不犹豫地升级”

如果您不确定某些事情,那么从团队中引入其他中小型企业是完全可以接受的,您认为比您更了解给定的系统。不要让您的自我阻止您获得更多帮助。我们的座右铭是“毫不犹豫地升级”,因为您不知道该如何处理它,您将永远不会被视为升级。

无罪

会有事件。有些会由您造成,有些会由其他人造成……有些会发生。我们的整个事件响应过程完全是无罪的。指责人们是反生产力的,只是分散了眼前的问题。无论事件如何开始,他们都需要尽快解决。

战时与和平时期

重大事件期间的行为与您过去可能收到的任何其他警报都大不相同。我们将重大事件称为“战时”,并区分它和正常的日常操作(“和平时期”)。

和平时期

组织结构通常基于资历。团队中越高的高级成员将领导讨论,经理或团队负责人将有最终决定权。仔细考虑所有选择后,做出决定,并最大程度地降低客户的潜在风险。

战时

战时有所不同,您会在我们的主要事件电话中注意到组织结构不同。

Baidu