你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
以麻省理工学院研究实验室(MITRE)的方式利用内部 ChatGPT 实现“AI 原生化”
作者:CIO.com&睿信咨询 来源:CIOCDO 发布时间:2024年06月25日 点击数:

美国顶级政府机构的非营利性研发中心构建了自己的流行genAI 工具版本,以通过设计安全地提供强大的生产力增强功能。


黛博拉·尤曼斯(Deborah Youmans),来源:MITRE

睿观:麻省理工学院林肯实验室(MIT Lincoln Laboratory),又称 麻省理工学院研究实验室(MITRE),是一家由美国联邦政府资助的非营利性研究和开发机构,总部位于美国马萨诸塞州列克星敦。该机构成立于 1958 年,最初是麻省理工学院林肯实验室的一部分,旨在支持美国空军进行弹道导弹防御研究。1966 年,MITRE 从麻省理工学院分离出来,成为独立的非营利性机构。

(一)MITRE的主要工作领域包括:

1.国家安全和国防: MITRE开发了广泛的国家安全和国防技术,包括导弹防御系统、指挥控制系统和网络安全系统。

2.航空航天: MITRE为 NASA 和其他航空航天机构开发了各种技术,包括太空探索系统和航空交通管制系统。

3.民用应用: MITRE的技术也用于各种民用应用,包括医疗保健、交通运输和能源。

(二)MITRE涉及的著名项目包括:

1.美国国家导弹防御系统(NMD): MITRE 是美国国家导弹防御系统的主要开发人员。NMD 旨在保护美国免受弹道导弹袭击。

2.美国空军指挥控制系统(C3): MITRE 开发了美国空军的各种指挥控制系统,包括北美防空司令部 (NORAD) 和空军全球指挥和控制系统 (AFGCCS)

3.美国联邦航空局(FAA) 空中交通管制系统: MITRE 为 FAA 开发了各种空中交通管制系统,包括国家空中交通管制系统 (NAS) 和终端区域空中交通管制系统 (TRACON)

MITRE是美国政府和私营部门的重要合作伙伴,为国家安全、国防和民用领域做出了重大贡献。

(三)MITRE 的其它:

MITRE的名字来源于拉丁语“mittere”,意思是“派遣”。

MITRE的第一个项目是为美国空军开发弹道导弹防御系统

MITRE开发了世界上第一个实时图形用户界面。

MITRE开发了第一个用于商业用途的卫星导航系统。

MITRE开发了第一个用于互联网通信的协议。】

作为美国政府的非营利研发中心,MITRE对人工智能并不陌生。其研究人员长期以来一直在研究 IBM 的 Watson AI 技术,因此毫不奇怪,当 OpenAI 于 2022 年 11 月下旬发布基于 GPT 3.5 的 ChatGPT 时,MITRE 将成为首批希望利用该技术的组织之一,并在一个月后推出 MITREChatGPT


MITREChatGPT是微软 OpenAI GPT 4 的内部开发的安全版本,也是该组织首个重要的生成式 AI 工具。该项目于 2023 年 月发布,为 MITRE 赢得了2024 年 CIO 100 IT 领导力和创新奖。该项目与 MITRE 已有 65 年历史的知识库和工具集成在一起,其 10,000 名员工中有 60% 以上已将其投入生产。


该工具是对R&D 与微软密切合作的补充,现已得到增强,可满足美国六个联邦资助机构的信息请求,包括国防部、联邦航空管理局和国土安全部。它使研究团队能够以创纪录的速度分析立法和政策文件,在一天内(而不是数周)向这些重要机构提供拟议的变更计划。


MITRE最突出的项目包括开发 FAA 空中交通管制系统和 MITRE ATT&CK 框架网络犯罪攻击技术集合。


最近,MITRE在弗吉尼亚州投资了一台 Nvidia DGX SuperPod,这将加速其在气候科学、医疗保健和网络安全方面的研究。该 AI 数据中心舱还将用于支持 MITRE 的联邦 AI 沙箱和测试平台实验,以进行支持 AI 的应用程序和大型语言模型 (LLM)


一、迈向“AI原生”运营


MITRE首席信息官 Deborah Youmans 和 MITRE 创新与实验总监 Michal Cenkl 旨在利用这个不断发展的平台,将位于弗吉尼亚州麦克莱恩的研究机构转变为一个“AI 原生组织”,为政府机构提供最高效、最智能、最关键的数据。


“人工智能是我们未来的重要组成部分,”尤曼斯说,他在博思艾伦汉密尔顿公司工作了17 年,最近担任副首席信息官,于 2023 年 月被任命为首席信息官。“今年,我们的人工智能战略和政策由首席信息官办公室和首席技术官共同主导,我们未来的重点是让 MITRE 成为一个人工智能原生组织。”


作为这项努力的一部分,MITRE将在其庞大的数据内联网中利用 LLM 来创造差异化价值,长期担任 MITRE IT 领导者的 Cenkl 表示。自 MITREChatGPT 首次发布以来,该非营利组织通过将该工具集成到其知识和项目存储库中,并建立了一个全机构用户组来培训和共享用例,从而增强了其功能。


Cenkl表示,到 2024 年 月,MITREChatGPT 已对数千份文档进行了文档分析和推理,提供了一个企业提示库,并向项目提供了 GPT 3.5 API。他补充说,此后,MITRE 已使用 GPT-4 和检索增强生成 (RAG) 部署了处理超大文档的功能。


睿观:检索增强生成 (RAG) 是一种用于优化大型语言模型 (LLM) 输出的技术,使其能够在生成响应之前引用训练数据之外的权威知识库。 LLM 通常使用大量数据进行训练,并使用数十亿个参数来执行诸如回答问题、翻译语言和完成句子等任务。

RAG通过为 LLM 提供经过筛选的知识库来帮助解决这些问题,确保生成的文本以事实信息为基础。 这使得 RAG 对于准确性至关重要的应用(例如新闻报道、科学写作或客户服务)特别有价值。

RAG的工作原理是首先使用检索模型来识别与用户查询相关的文档或文本片段。 然后,将这些相关部分传递给 LLM,以生成响应。 LLM 可以使用这些信息来创建更准确、更相关和更有信息的响应。

(一)RAG的一些优点包括:

提高准确性: RAG可以帮助确保 LLM 生成的文本以事实信息为基础,这对于需要准确信息的应用非常重要。

提高相关性: RAG可以帮助 LLM 生成与用户查询更相关的响应。

提高信息量: RAG可以帮助 LLM 生成包含更多信息的响应。

(二)RAG的一些缺点包括:

增加的复杂性: RAG比传统的 LLM 架构更复杂,因为它需要额外的检索模型。

增加的计算成本: RAG比传统的 LLM 架构更昂贵,因为它需要对检索模型和 LLM 进行额外的计算。

总体而言,RAG是一种有前途的技术,可用于提高 LLM 的性能。 随着 RAG 技术的不断发展,我们可以预期它将在越来越多的应用程序中得到使用。

(三)RAG可用于各种应用程序,包括:

问答: RAG可用于提高 LLM 对问题答案的准确性。

摘要: RAG可用于帮助 LLM 生成更准确和更相关的文本摘要。

机器翻译: RAG可用于帮助 LLM 生成更准确和更流畅的翻译。

聊天机器人: RAG可用于帮助聊天机器人生成更具信息量和吸引力的响应。

(四)RAG的未来

RAG是一项仍在快速发展的技术。 随着研究人员继续开发新方法来改进 RAG 架构,我们可以预期它将在未来几年中变得更加准确、高效和通用。

以下是一些可能的未来RAG 研究方向:

改进检索模型:开发新的检索模型可以提高 RAG 识别相关文本片段的能力。

改进LLM: 开发新的 LLM 可以提高 RAG 生成响应的能力。

开发新的RAG 架构开发新的 RAG 架构可以提高 RAG 的整体性能和效率。

RAG有可能彻底改变 LLM 的工作方式。 随着 RAG 技术的不断发展,我们可以预期它将在越来越多的应用程序中得到使用,并对我们与计算机交互的方式产生重大影响。】

“我们冒了风险。我们很早就开始在整个组织内安全地部署生成式人工智能,”Cenkl 表示,并解释说,MITRE 在使用基于人工智能的系统(如 IBM 的 Watson)方面的经验使他们能够快速部署 OpenAI 的 GPT-4,这些系统可以根据其实验室和研究中心生成的信息回答问题。这意味着研究人员不必从头开始处理 MITRE 资助的联邦机构的每一次信息请求。

尤曼斯表示,MITRE积极拥抱 ChatGPT,不仅可以帮助员工减轻工作量、更快地生成报告,而且由于 MITRE 在对非营利组织海量数据存储库进行数据挖掘方面投入了大量硬件,它还将提升分析水平。

“自从我们宣布为MITRE 的联邦 AI 沙箱收购 NVIDIA DGX SuperPod 以来,我们的联邦赞助商就提出了许多信息请求,”Youmans 说道。“将 MITREChatGPT 集成到我们的内联网中,并访问我们的知识资产,有助于我们所有员工与 MITRE 的相关数据建立联系。”


二、必须安全


鉴于MITRE 手头数据的敏感性,该项目的第一步是确保 MITRE 版本的 ChatGPT 是安全的并且不提供对机密信息的访问权限。


为此,使用Azure 中的 OpenAI 服务的 MITRE 与微软协商,减少日志记录并增加安全控制,以满足其严格的安全要求,该首席信息官表示。


Youmans表示:“在我们管理的安全 Microsoft Azure 租户中拥有 OpenAI ChatGPT 实例,而不是依赖一般的公共版本,这样信息才能保持私密,这对于确保安全至关重要。对于在这种环境中可以共享哪些类型的信息,我们有指导方针。


据该公司称,除了节省研究和撰写报告的时间外,MITREChatGPT还提供编码协助、创意生成和解决问题的能力,以及减少错误的质量保证改进。


据 MITRE 称,平均而言,完成关键任务的时间减少了 10% 至 30%,该公司还在马萨诸塞州贝德福德设有一个大型研发中心。


MITRE每月都会与员工举办 AI 研讨会,指导如何有效地进行聊天提示,并帮助员工了解提示工程的细微差别。此外,Youmans 表示,MITRE 最近在公司范围内举行了第二次技术交流会议,以分享 MITREChatGPT 创新并强化有关安全要求的指导方针。


MITRE首席信息安全官 Bill Hill 向 Youmans 汇报工作,他一直致力于确保 MITREChatGPT 符合该组织信息安全团队的审核。


“我们的CISO 与组织的其他部门紧密合作,我们正在经历一场大规模的转型,以确保从 [MITRE 的 genAI 活动开始,我们就遵循 [CISA] 的安全设计原则,”Youmans 说。“我们从一开始就拥有安全性,并与我们的开发团队紧密相连。我们正在从底层开发安全性。”


Gartner副总裁兼 AI 分析师 Chirag Dekate 表示,对 MITRE 的 genAI 平台、强大的 AI 硬件和庞大存储库的需求可能会增加。


“政府机构正在考虑如何利用生成式人工智能作为能力倍增器,并内置所有护栏。在我们的合作中,我们看到政府机构使用生成式人工智能创新,包括来自谷歌和 OpenAI 等创新者的多模态技术,来构建变革性试点,旨在提高一线人员的生产力和效率,并简化复杂而错综复杂的流程,”Dekate 说道。“MITRE 的生成式人工智能创新是政府机构在构建以价值为中心的解决方案的过程中可以探索的工具集的核心部分。”