随着CrowdStrike重大中断事件周年纪念日的临近,CIO(首席信息官)们对网络韧性有何新的认识?
图源:SOPA Images Limited via Alamy Stock Photo
2024年7月19日,CrowdStrike的一次更新引发了全球性的IT中断,影响了医院、航空公司甚至银行。当我们迎来这一事件一周年纪念日时,CIO(首席信息官)们有机会反思他们在网络韧性方面的应对方法。
尽管CrowdStrike中断的破坏规模惊人,但IT中断却是常见现象。随着IT生态系统的复杂性和互联性增加,再次发生类似重大事件的可能性始终存在。2024年PagerDuty的一项调查发现,88%的IT和企业高管预计在未来一年内,将会看到另一场像去年七月那样大规模的重大事件。
面对未来预期的服务中断,CIO(首席信息官)们是否改变了他们对组织韧性的应对方式?
一、“永不浪费停电时间”
虽然CrowdStrike服务中断席卷了一系列行业和公司,但仍有许多组织未受影响。无论CIO(首席信息官)们与中断的距离如何——是深陷其中还是旁观者,都有值得学习的经验教训。
数字运营管理公司PagerDuty的CIO(首席信息官)Eric Johnson(埃里克·约翰逊)告诉InformationWeek(信息周刊):“我们曾与一些客户交流过,他们觉得这是一次‘不浪费停机时间’的情况,你可以尝试从中学习。我们看到许多人在重新思考他们未来将要如何管理这种方式。”
CIO(首席信息官)及其团队可以利用中断来优化他们的流程。下次他们如何才能更具韧性?是否有机会改进事件响应和业务连续性?
二、敲响韧性的警钟
CrowdStrike中断事件残酷地提醒了组织在预防此类中断故障方面几乎没有控制权。当他们的供应链出现问题时,他们无法阻止,只能做出反应。
数字身份验证平台Prove的CIO(首席信息官)兼CISO(首席信息安全官)Amanda Fennell(阿曼达·芬内尔)表示:“这是最好的例子,说明你无法预见到它的到来。它将对话从‘我们能否阻止一切?’转变为‘好吧,我们能多快恢复?’ ”
韧性及恢复优先于预防,这一直是网络安全领域备受推崇的口头禅,但这种转变仍在进行中。PagerDuty的调查发现,86%的高管认为他们一直优先考虑安全性,而不是对服务中断的准备工作。
Fennell(芬内尔)发现,一些CIO(首席信息官)将CrowdStrike事件牢记在心,并着手提高韧性。但还有其他人没有这样做。
她表示:“有一群人专门学习了如何作为安全官和信息官来处理事情,因此,他们做了在每个项目中做过的相同的提升和转移计划。我不知道这群人是否真的从中成长了,或者是否会改变什么。”
那些希望变得更有韧性的CIO(首席信息官)将开始考虑单点故障并思考采取哪些措施来解决这些问题。
Johnson(约翰逊)表示:“这将成为一种趋势,成为CIO(首席信息官)工作的一部分。当它发生时,你如何应对?而不是认为它永远不会发生在你身上。”
三、了解你最关键的供应商
对于众多客户而言,CrowdStrike是关键供应商。中断事件发生后,CrowdStrike发布了根本原因分析,并采取了措施防止类似事件再次发生。
CrowdStrike的CIO(首席信息官)Justin Acquaro(贾斯汀·阿夸罗)在一份电子邮件声明中表示:“网络韧性始于阻止安全漏洞,我们在7月19日之后共同致力于提高标准,这正是众多客户和合作伙伴一直与CrowdStrike保持合作并持续发展的原因。”
然而,在当今复杂的第三方依赖关系和供应链风险世界中,CrowdStrike并非唯一的关键供应商,下一次重大中断可能源自众多供应商中的任何一个。
Fennell(芬内尔)表示:“归根结底,我们在技术上走得越远,对其依赖程度越高,我们跌倒的可能性就越大。”
识别出最关键的供应商——尤其是那些潜在的单点故障,可以帮助CIO(首席信息官)集中精力进行韧性建设。毕竟资源有限,他们无法为每一种可能发生的情况都制定计划。
一旦明确了哪些供应商是最关键的,从第三方风险管理的角度审视他们是个不错的主意。审查合同和SLA(服务水平协议),与供应商沟通,让他们带你了解他们的风险缓解策略。
Fennell(芬内尔)表示:“购买方、消费者有责任要求这种透明度并验证供应商的韧性声明。”
四、测试,测试,再测试
任何中断事件,包括CrowdStrike事件、随后发生的其他事件以及未来将要发生的,都在提醒CIO(首席信息官)重新评估他们的事件响应和业务连续性计划。
文档管理公司Laserfiche的CIO(首席信息官)兼企业战略高级副总裁Thomas Phelps(托马斯·菲利普斯)表示:“你需要在短时间内找出需要恢复的最关键系统和流程,然后调整你的业务连续性计划以做出响应。”
这些计划应该像活的、有生命的有机体一样适应变化,它们不能被束之高阁,直到中断真正发生。CIO(首席信息官)需要设想可能的场景,并对这些计划进行测试。
如果关键供应商导致中断会发生什么?企业是否有其他服务可以切换以保持运营正常进行?如果通信系统被中断摧毁,CIO(首席信息官)是否有办法与关键利益相关者沟通?
有韧性的企业不会让这些问题的答案听天由命,有韧性意识的CIO(首席信息官)会努力建立正确的流程。更重要的是确保在中断发生时有合适的人员准备好做出响应。
Johnson(约翰逊)问道:“你多久进行一次压力测试以确保合适的人员了解他们的角色和职责?”
CIO(首席信息官)可以设定一个定期的时间表进行桌面演练,看看他们的韧性计划是否能够经受住考验,这可能意味着每季度进行一次测试。Fennell(芬内尔)有桌面角色扮演游戏《龙与地下城》的背景,她乐于抓住机会进行更频繁的控制和流程测试。
她表示:“这就像去健身房一样,如果你经常测试,你就会变得强壮并随时准备做好准备。”
五、建立关系
CIO(首席信息官)们身处一个技术世界,他们需要了解IT系统如何运作、不同组件如何相互连接以及薄弱环节在哪里。但他们同时也是商业领袖,而良好的商业关系是建立在良好的人际关系基础之上的。
当发生中断时,CIO(首席信息官)需要与其他部门建立牢固的联系,而不仅仅是在IT部门内部。Phelps(菲尔普斯)强调,与面向客户的团队合作制定有效的沟通策略非常重要。
他说:“当灾难发生时,确保有应急手册和沟通计划能够联系到你的客户、终端用户、员工、其他利益相关者以及公众市场,以确保传达正确的信息。”
CIO(首席信息官)还可以将目光投向组织外部,建立有价值的关系。Phelps(菲尔普斯)超越了SLA(服务水平协议)和合同,与Laserfiche最关键的供应商工作人员建立联系。
他解释说:“我确保与他们建立C级关系,以便有任何类型的担忧、问题或改进他们产品的机会时都有一个升级的联系点。”
对于身兼数职的CIO(首席信息官)来说,拥有正确的关系是非常宝贵的,因为他们已经有很多事情要处理:安全、韧性等等。
Johnson(约翰逊)说:“当今技术领域有太多事情在发生,比如人工智能等等。对首席信息官来说,这可能是最令人兴奋的时代之一,同时也是我记忆中最具挑战性的时代之一。”
作者:Carrie Pallardy(凯莉·帕拉迪)
译者:木青
睿观:在CrowdStrike重大中断事件一周年之际,CIO们对网络韧性有了更深刻的认识。该事件残酷地提醒企业,其对关键第三方供应商的故障几乎无力预防,因此核心安全理念正从“预防”转向“快速恢复”。成功的CIO正借此机会,识别并深入审查其关键供应商,更频繁地测试与演练事件响应和业务连续性计划,并积极构建内外部的沟通与合作关系,以确保在下一次不可避免的重大事件来临时,组织能够更具韧性地快速应对。
金句:在互联互通的世界里,网络韧性的对话已从‘我们能否阻止一切?’,转变为‘我们能多快恢复?