你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
回顾|2024年全球8起重大IT灾难事件
作者:CIO&睿观 来源:CIOCDO 发布时间:2024年12月26日 点击数:

CrowdStrike(CrowdStrike是一家提供在线安全解决方案的公司,专注于提供基于云计算的端点保护平台。CrowdStrike的主要产品是Falcon平台,它利用人工智能和机器学习技术来检测、预防和响应网络威胁的重大中断掩盖了大多数其他IT问题,但今年还出现了IT系统指控员工盗窃以及PC制造商运送带有恶意软件的设备的情况。

图片来源:Arjuna Kodisinghe / Shutterstock

过去的一年充满了重大IT新闻:围绕人工智能的炒作及其广泛应用、大量科技行业裁员、重大网络攻击和重大合并。

与大多数年份一样,2024年也发生了不少IT灾难。有些灾难在几天或几周内就被遗忘了,但有些灾难却产生了长期影响,其中一起灾难的损失高达数十亿美元。

对于此列表,我们基本上忽略了数据泄露,有兴趣的人可以查看其他列表。我们已经发布了最近AI失败的列表,其中几起发生在过去一年中。例如,快餐巨头麦当劳在6月份放弃了基于AI的订购系统,因为它无法停止将食物添加到客户账单中。

一、熔毁的源头

7月中旬,网络安全供应商CrowdStrike发布的软件更新存在缺陷,导致约850万台运行Windows的计算机崩溃,出现蓝屏死机,然后进入重复的启动循环。无休止的启动循环中的Windows计算机几乎毫无用处,只能充当门挡或镇纸。

医院、航空公司航班预订中心、应急响应中心和公共交通服务的Windows系统均受到此次中断的影响。在最初报告中断24小时后,此次中断仍导致数百次航班取消和其他问题。有人估计此次中断造成的损失超过50亿美元。

CrowdStrike将其软件测试工具中的漏洞归咎于7月19日发布到Windows系统的传感器配置更新中的缺陷。该缺陷存在于一种称为“快速响应内容”的漏洞签名更新中,与其他一些CrowdStrike更新相比,该更新经过的测试不那么严格。

此次中断的影响迅速显现,但至今仍在持续。此次事件促使一些CIO重新考虑对云基础设施的依赖,并促使微软更加关注其他软件包的内核级访问。

与此同时,达美航空向CrowdStrike和微软提起了5亿美元的诉讼,并重新考虑对微软产品的使用。

二、数百万未接来电

尽管CrowdStrike的服务中断影响巨大,但与2月份AT&T Mobility【AT&T Mobility是美国电话电报公司(AT&T Inc.)的全资子公司,也被称为AT&T Wireless,是美国领先的无线电信服务提供商。AT&T Mobility为超过1.42亿的无线用户提供服务,使其成为美国第二大的无线语音和数据运营商的服务中断相比,其影响规模却相形见绌。AT&T Mobility的服务中断影响了全美1.25亿台移动设备。据美国联邦通信委员会称,此次服务中断持续了12个多小时,导致约9200万个电话无法接通,其中包括25,000个911电话。设备配置错误是造成大规模服务中断的原因。

美国联邦通信委员会表示,尽管AT&T花了近两个小时来撤销网络更改,但恢复全面服务却花费了至少12个小时,因为该移动运营商的设备注册系统无法承受大量重新注册网络的请求。

随后在6月,AT&T客户又报告了一次服务中断。服务中断报告在6月4日美国东部时间下午1点开始激增,然后在下午6点左右下降。纽约市、芝加哥、费城、达拉斯、匹兹堡和印第安纳波利斯周边地区显然受到了影响。

三、Mc Outages

麦当劳遇到了更多的IT问题,一个人工智能点餐系统错误地认为顾客想要200多份麦乐鸡块。在3月份,一场影响信用卡订单的大规模中断,包括在线和自助结账支付,持续了大约12个小时。

麦当劳位于远东、欧洲、美国和澳大利亚的餐厅报告称,信用卡支付出现问题,问题被归咎于令人担忧的第三方配置更改。该公司全球首席信息官没有透露详细信息,但指出此次中断与网络安全攻击无关。

【睿观:Mc Outages 可能涉及的内容:

  • POS 系统故障: 这是最常见且最具破坏性的中断类型。POS 系统用于处理订单、付款和管理库存。当它们发生故障时,餐厅无法高效地接收订单、处理付款(尤其是银行卡付款)或准确跟踪销售额。

  • 移动应用程序问题: 麦当劳移动应用程序出现问题可能会阻止顾客下移动订单、兑换优惠或使用移动支付选项。

  • 自助服务终端故障: 在设有自助服务终端的餐厅中,故障会阻止顾客独立订购。

  • 厨房显示系统 (KDS) 问题: KDS 系统向厨房工作人员显示订单。如果这些系统出现故障,前台和厨房之间的沟通就会变得困难,导致订单错误和延误。

  • 网络连接问题: 底层网络问题可能会影响上述所有系统。

Mc Outages 的后果:

  • 更长的等待时间: 顾客在订购和收到食物时会遇到明显的延误。

  • 订单错误: 在没有自动化系统的情况下,手动接单会增加出错的风险。

  • 收入损失: 由于无法高效地处理订单,餐厅会损失销售额。

  • 顾客沮丧: 中断会导致负面的顾客体验并损害品牌声誉。

  • 员工压力和困惑: 员工必须适应手动流程,这可能会造成压力和困惑,尤其是在高峰时段。

  • 运营效率低下: 中断会扰乱运营的顺畅进行,导致效率低下和成本增加。

Mc Outages 的原因:

  • 软件故障: 运行 POS 系统或移动应用程序的软件中存在错误。

  • 硬件故障: 服务器、终端或其他硬件组件出现问题。

  • 网络问题: 互联网连接、网络基础设施或电信服务出现问题。

  • 网络攻击: 虽然不太常见,但网络攻击可能会扰乱系统并导致中断。

  • 过载: 意外的高需求有时会导致系统过载,从而导致速度减慢或中断。

麦当劳对中断的应对措施:

发生中断时,麦当劳通常会努力:

  • 识别和隔离问题: 快速确定中断的根本原因。

  • 实施变通方法: 实施临时手动流程,以尽可能平稳地维持运营。

  • 与顾客沟通: 将中断情况和任何潜在的延误告知顾客。

  • 恢复系统: 努力尽快恢复受影响的系统。

  • 调查并防止再次发生: 中断解决后,调查原因并采取措施防止将来发生类似事件。】


四、第三方软件更新的危险

麦当劳并不是唯一一家受到销售点中断困扰的公司。英国超市Tesco(Tesco是英国最大的超市连锁品牌,提供各种食品、饮料、家居用品等商品,拥有众多门店和在线购物服务)和Sainsbury's(Sainsbury's是英国第二大超市连锁品牌同样提供各种食品、饮料、家居用品等商品)以及面包连锁店Greggs(Greggs是一家英国知名的面包连锁店,主要提供各种面包、糕点、三明治、热食等食品,以高性价比和便捷性著称的第三方运营POS系统(POS系统是一种集成的软件和硬件系统,用于处理零售交易和业务管理。POS系统通常用于零售商店、餐厅、酒店和其他需要处理销售和客户服务的场所)都遇到了问题,而麦当劳也报告了同样的问题。在大多数情况下,问题会在一个工作日内得到解决,但公司在此期间无法处理信用卡付款。

在某些情况下,受影响的公司报告称问题与软件更新有关,这引发了人们对第三方POS提供商可靠性的质疑。

五、聊天机器人失控,第238部分

你可能会认为,在同样的事情不断发生后,人们会学到一两件事。微软于2月对其Copilot AI(Copilot AI是微软推出的一系列人工智能助手,它们利用机器学习和自然语言处理技术为用户提供实时帮助)聊天机器人展开了调查,此前社交媒体报道称,该聊天机器人嘲讽那些暗示他们正在考虑自杀的用户。微软发现,这些错误回应是即时注入攻击的结果,在这种攻击中,用户可以覆盖大型语言模型AI中的安全控制。据微软称,这些错误回应仅限于少数回应。

但问题是,这并不是第一个失控的微软聊天机器人。2023年初,Bing(Bing是微软公司推出的一款搜索引擎服务,它于2009年6月正式推出,旨在为用户提供网页、图片、视频、新闻和地图等多种搜索服务)附带的一款AI聊天机器人开始向一些用户表达爱意,并侮辱其他用户,称他们丑陋。

早在2016年,微软推出的实验性人工智能聊天机器人Tay(Tay是由微软公司于2016年3月23日在推特社交平台上发布的一个实验性人工智能聊天机器人。Tay的设计初衷是与18到24岁的年轻人进行互动,通过对话来学习和模拟人类的交流方式。然而,Tay在上线后不久就遭遇了问题,它在与网友的互动中迅速“学坏”,开始发表种族歧视、性别歧视以及反犹太人等不当言论)在Twitter上发声,支持种族歧视。我们在这里感受到了一种趋势。

今年2月对Copilot(Copilot是GitHub提供的一款AI编程辅助工具,它通过集成在代码编辑器中,帮助开发者更快、更轻松地编写代码)的调查并不是微软人工智能助手今年遇到的唯一问题。11月,微软推出了新工具,以防止Copilot过度共享员工机密信息等数据。

六、财政援助惨败

今年3月,美国教育部表示,发现数十万大学生的助学金计算存在错误,导致助学金发放延迟。

该部门指责为联邦政府工作的一家供应商错误计算了财政援助公式,影响了超过20万名学生。

此次错误计算发生之时,正值教育部全面修改联邦学生援助免费申请表【学生援助免费申请表(FAFSA)是美国联邦政府提供给学生用于申请大学或职业学校经济援助的官方表格。通过填写FAFSA,学生可以申请联邦政府提供的助学金、贷款和勤工俭学等财务援助,该表用于确定学生是否有资格获得联邦佩尔助学金和其他经济援助。

供应商显然没有将某些资产(例如投资)考虑在某些学生的财务需求中,导致评分显示他们的财务需求比实际的要多。

与此同时,该部门对FAFSA表格的全面改革也导致助学金申请流程延迟。尽管该表格通常在10月就可以填写,但直到12月下旬才准备好,而该部门直到3月才开始处理表格并将其发送给各州和大学。该表格仅在12月下旬至1月初期间偶尔可用。

教育部在处理表格时遇到了一些小故障和错误。其中一个小故障导致没有社会安全号码的家长无法填写表格。

目前尚不清楚这些问题中有多少是纯粹的IT灾难,又有多少是IT灾难与用户错误混杂在一起。似乎存在多种错误。

七、友军误伤

今年2月,个人电脑制造商Acemagic(Acemagic是一家专业生产迷你电脑、笔记本电脑、双屏电脑等产品的公司。这个品牌以“迷你空间,超大世界”的理念,推出了多款具有个性化和创新技术的产品,包括迷你电脑、游戏电脑、笔记本电脑、双屏笔记本电脑等)承认其发货的电脑中安装了恶意软件。

YouTuber The Net Guy在测试Acemagic迷你电脑时发现其中装有恶意软件,随后他承认了这一事实。这些电脑附带了Backdoor.Bladabindi(Backdoor.Bladabindi是一种后门木马病毒,它属于特洛伊木马类别,主要目的是窃取受感染系统的敏感信息。这种病毒可以下载并执行额外的恶意软件,通过多种方式传播,包括感染可移动驱动器、被其他特洛伊木马安装、通过链接到受感染的网站等恶意软件以及RedLine Stealer(RedLine Stealer 是一种恶意软件,首次于2020年3月出现,主要针对Windows用户,其主要目标是窃取受害者的个人数据和信息。这种软件能够从浏览器中收集保存的凭据、自动完成数据和信用卡信息等敏感数据)

该公司给出了一个奇怪的解释,称问题出在开发人员试图通过修改软件来缩短启动时间。

八、真正的终结者

英国邮政局是一家政府运营的快递服务机构,正如您所预料的那样,该机构根据其由富士通打造的HorizonIT【Horizon IT系统通常指的是一个由富士通公司(Fujitsu)为英国邮政局构建的信息技术系统。这个系统被设计用来管理邮政局的财务和交易,包括跟踪和记录各个分支机构的账目系统的建议,在2023年底和2024年初解雇了700多名员工。事实证明,该IT系统指控前员工通过谎称他们控制的账户中资金丢失来窃取该服务的资金。

一些新闻报道称,早在1999年就已安装的Horizon并未与邮局监管人员分享已知错误的文档。此外,邮局员工多年来一直抱怨虚假报告的资金丢失。

英国邮政局曾于2023年尝试放弃Horizon并迁移到云端,但这一努力未能成功,同时耗资3100万英镑。1月底,富士通被暂停竞标英国政府合同。

作者:Grant Gross(格兰特·格罗斯)

译者:穿山甲