顾客→雷集团

Rea Group将寻呼机与PageRduty取代

Rea Group Limited是一家专门从事财产的跨国数字广告公司,在澳大利亚经营领先的房产网站,以及亚洲的着名景点。他们的目的是通过开发创新产品并创造一种促进创造性思维的动态工作文化来“改变世界经历财产”的宗旨。全世界数百万人使用Rea Group的网站每天都能找到财产,因此平台必须始终开启并表现良好,以确保人们可以随时随地随时搜索物业。因此,对于REA GROUP来说,这是关键任务,以对影响平台绩效的事件而无需客户注意到的事件。与此同时,Rea Group不能失去专注于他们的软件开发和管理团队的运营效率,特别是面对快速增长。

挑战:单片事件警报和淤泥操作

2014年,在采用PageRduty之前,Rea Group的运营团队依赖于单片,低效的警报通知系统,要求工程师始终携带物理好客。由于基于物理寻呼机的系统挑战改变和优化,因此REA团队无法保证正确的警报被交付给合适的人员,这延迟了响应时间。此外,呼叫工程师不断地通知非关键或不可动作的警报,特别是几乎没有时间。“这是夜间夜间的噩梦 - 一个非常痛苦的过程,”Rea Group的全球基础设施和建筑经理Javier Turegangano Molina在那些早期的呼叫经验中说。

该团队的第二个主要挑战是组织的淤泥结构。该组织由许多不同的群体组成,每个不同的群体负责制定公司生态系统的不同部分,但所有事件都被转发给集中运营团队。REA专注于通过拥抱Devops文化来分解这些筒仓,将业务的所有权转移到正在建立和维护申请的团队中。对于此更改成功,需要警报需要直接向团队发送,而不发送到单独的集中单元。

“我们现在有办法向合适的人员发送正确的警报,并在合适的时间。”

- javier Turegano Molina,Rea Group的全球基础设施和建筑经理

使用PageRduty实现敏捷事件管理

2014年,Turegano和他的团队实施了PageRduty,以改善事件响应时间,充分拥抱Devops的工作方式。

通过PageRduty,REA可以通过协调,简化其整个组织在整个组织中管理的方式事件应答在量身定制的敏捷时尚。事件升级政策是定制的,以便根据问题的性质,包括拥有受影响服务的团队和最适合处理问题的工程师的团队向合适的人提供警报。该团队现在非常重视设计他们的警报以匹配SLA,并确保团队没有真正的原因未知。结果是,所有拥有该服务的团队现在都有完全的责任。这需要与团队的心态进行临界转变,现在理解如果您构建它,则会运行它。“能够调整时间表对我们来说是一个非常出色的功能,”Turegano解释道。

物理寻呼机已成为过去的事情。事件通知现在通过PageRduty提供,允许通过他们的手机和已使用的其他设备通知工程师(开发人员,QA,系统等)。“没有更多的物理寻呼机已经改变了,”Turegano说。

随着PageRduty自动收集的指标,Turegano和他的团队改善了他们的运营。PageRduty提供有助于他们确定其平均修复时间(MTTR)的数据,这使REA Group追踪其运营团队的性能如何在事件期间随着时间的推移而发展。PageRduty还从各种集合中汇集了指标监控工具该团队已经使用,如AWS CloudWatch.Nagios.新遗物啪啪。这些聚合的指标对于执行而言是非常宝贵的事件后的后验尸为了防止在未来重复的类似问题,Turegano说。

Rea现在使用PageRduty来为其全部供电数字运营。“任何可以突破的东西都会发出警报到PageRduty,我们现在有办法向合适的人发送正确的警报,”Turegano说。他补充说,在他们处理警报的方式中,他不仅变得更加高效,他们经历了整个Devops文化变革,PageRduty在这次旅程中是一个伟大的推动者。

如果您想阅读更多REA,则在呼叫中缩放检查此帖科技博客

Baidu