Palantir Ontology
Palantir 的软件为全球众多关键的企业和政府领域提供实时、人工智能驱动的决策支持。从公共卫生到电池生产,客户依靠 Palantir AIP 安全、可靠、高效地在其企业中利用人工智能,并推动运营成果。
Ontology旨在表示企业中的决策,而不仅仅是数据。世界上所有组织的首要任务都是在不断变化的内外部环境中,实时做出最佳决策。传统的数据架构无法捕捉决策背后的推理过程或最终的行动,因此限制了学习和人工智能的集成。传统的分析架构无法将计算置于实际环境中,因此与运营脱节。为了在当今世界取得成功,现代企业需要以决策为中心的软件架构。
为了理解Ontology的价值,让我们首先考虑任何决策的三个要素:
数据,用于做出决定的信息。
逻辑,评估决策的过程
行动,决策的执行。
从根本上讲,每个决策都由数据(用于做出决策的信息)、逻辑(评估决策的过程)和行动(决策的执行)组成。Ontology将决策的这三个组成要素整合到一个可扩展、动态、协作的基础中,从而反映出组织随着时间推移而不断变化的情况和目标。
数据
如今,企业面临着前所未有的海量数据。数据源的数量、种类和更新速度不仅在不断增长,而且随着时间的推移还在加速发展。尽管人们已经对数据清洗和统一的益处进行了大量讨论,但在人工智能时代,首要问题是数据的相关性。相关数据当然包括企业的所有数据源——结构化数据、流式和边缘数据源、非结构化存储库、图像数据等等——但也包括最终用户在决策过程中生成的数据。这种“决策数据”包含了特定决策的背景信息、评估的不同选项以及最终选择可能带来的后续影响。生成式人工智能提供了一种突破性的能力,能够从海量的决策数据中综合学习,并持续丰富人工和人工智能驱动的工作流程。当然,将所有企业数据与不断变化的决策数据环境相集成,需要一种与针对报告和分析优化的传统数据库管理解决方案截然不同的架构。
Ontology将所有数据模态整合到一个全面、高保真度的企业语义表示中。各种运营数据源(ERP、MES、WMS 等)可以与来自物联网和边缘系统的数据流、非结构化数据存储库的相关部分、地理空间数据存储等进行同步和上下文关联。Ontology整合并激活这些分散的数据池,并以企业语言呈现它们。它不再使用将丰富运营信息扁平化为狭隘模式的“黄金表”,而是以对象、属性和链接的形式展现企业的完整面貌,这些对象、属性和链接实时演化,并可直接嵌入到决策工作流程中。至关重要的是,Ontology旨在安全地捕获运营用户在日常工作中产生的决策数据(例如,在供应链、医院系统、客户服务中心等)。决策的端到端“决策谱系”,包括决策的做出时间、所依据的企业数据版本以及所使用的应用程序,都会被自动捕获并安全地提供给人类开发人员和生成式人工智能。这为大规模人工智能驱动学习提供了必要的全面基础。
Ontology将所有模态的数据整合到一个全面、全保真度的语义表示中,捕捉企业不断变化的现实,并作为强大的 AI 驱动工作流程的基础。
逻辑
数据固然是基础,但它只是决策过程的一个维度;它必须与推理或逻辑相辅相成,后者决定了何时以及如何做出特定决策。支撑决策的逻辑可以是核心业务系统中的简单业务逻辑,也可以是使用云数据科学工作台维护的预测模型,或是利用多个数据源生成运营计划的优化模型——等等,不胜枚举。在现实世界中,人类的推理能力往往决定着在特定工作流程的不同阶段使用哪些逻辑资源,以及如何将它们串联起来,形成更复杂的流程。随着生成式人工智能的出现,人工智能驱动的推理必须能够像人类历史上那样利用所有这些逻辑资源,这一点至关重要。确定性函数、算法和传统统计过程必须作为“工具”出现,以补充大型语言模型(LLM)和多模态模型的非确定性推理。
Ontology 能够将所有逻辑资产(即决定决策方式的计算和流程)连接起来,并为人类用户和人工智能用户提供上下文关联。这包括客户交互相关的业务逻辑(常见于客户关系管理系统和企业资源计划系统中);驱动传统机器学习的建模逻辑(分布于各种数据科学环境中);以及通常与特定领域工具紧密结合的规划、优化和仿真算法。Ontology灵活的“逻辑绑定”范式提供了一个一致的接口,用于构建能够无缝集成和组合异构逻辑资产的工作流——这些资产可能存在于截然不同的环境中(例如,本地数据中心、企业云环境、SaaS 环境、Palantir 平台)。最终,这意味着人工智能驱动的推理可以顺利地引入到利用各种逻辑集且传统上完全由人类用户主导的决策环境中。
Ontology使用户能够构建整合并组合异构逻辑资产的工作流。最终,这意味着可以将人工智能驱动的推理安全地引入日益复杂的决策环境中。
行动
信息(数据)和推理(逻辑)都融入到共享表示中之后,剩下的建模工作就是决策本身(行动)的执行和协调。实时决策过程中行动闭环的闭合,正是运营系统与分析系统的区别所在。自 Palantir 创立以来,决策的执行与数据综合或分析的整合同等重要。这需要设计和实现一系列广泛的功能,包括如何安全地捕获可能同时发生且潜在冲突的决策;一个协作模型,将能够探索可能决策的人员、能够暂存决策以供审查的人员以及能够最终执行决策的人员进行划分;以及一个用于将决策同步到现有数据库、边缘平台和加固型资产的完善框架。
Ontology以企业决策为中心,构建了一个统一的模型,并对其中的操作进行原生建模。如果Ontology中的数据元素是企业的“名词”(语义化的、现实世界的对象和链接),那么操作就可以被视为“动词”(动态的、现实世界的执行)。在每个本体驱动的工作流中,名词和动词通过人工和/或人工智能驱动的推理组合成完整的句子,其中融合了各种逻辑。虽然将数据整合到语义模型中本身就很有价值,而且整合评估各种可能决策所需的逻辑也至关重要,但除非执行的决策与运营系统同步,否则这一切最终都意义有限。Ontology能够将人工和人工智能驱动的操作安全地部署为场景,并使用与数据和逻辑原语相同的细粒度访问控制进行管理,同时安全地写回企业的每个底层架构——事务系统、边缘设备、自定义应用程序等等。
Ontology以企业决策为中心,在统一的模型中对操作进行原生建模,使人类和人工智能驱动的操作能够安全地作为场景进行安排,并采用与数据和逻辑原语相同的访问控制进行管理,然后安全地写回每个企业底层。简而言之,Ontology将数据、逻辑和行动整合到一个以决策为中心的企业模型中,该模型可供人类和人工智能共同使用。从数据集成到应用程序构建,再到最终用户工作流程,所有环节都通过久经考验的模块化架构驱动——使人类用户和人工智能驱动的辅助系统及自动化流程能够在共享的运营基础上进行查询、推理和行动。
让我们通过一个例子来分析Ontology是如何帮助 50 多个行业的组织在几天内激活 AI 驱动的工作流程的。
操作示例
虚构的医疗设备制造商泰坦工业公司生产一系列成品,从注射器到外科口罩,每一种产品都需要一套精确的原材料经过相应的生产流程。公司拥有一支多元化的团队,负责管理从供应商关系、仓储运营、成品生产到最终客户分销的方方面面;所有决策相互关联,并不断根据不断变化的情况进行调整。简而言之,运营这家公司每天都面临着独特的挑战。
在这个例子中,泰坦工业公司(Titan Industries)的一家主要供应商遭遇了意料之外的供货中断,该供应商提供生产医用口罩所需的关键原材料。鉴于泰坦各制造工厂的生产计划都非常紧凑,而客户对医用口罩的需求却在不断攀升,此次供货中断势必会对完成未完成的客户订单造成严重影响。幸运的是,泰坦的运营管理团队已将各种数据源、逻辑资产和行动系统整合到其企业本体中,因此能够迅速做出响应。
Titan 的Ontology汇集了应对此次原材料短缺所需的所有决策要素:它提供了对每次短缺所涉收入的全面可见性,从而为优先级排序提供信息;它允许人工智能驱动的建议和最终解决方案,这些建议和解决方案都考虑到了企业的运营实际情况;它还推动回写和持续学习,不仅使系统保持最新状态,而且还优化未来的决策。
Titan 将首先评估供应商短缺的直接影响,然后利用人工智能评估生产线上可能的重新分配策略,最后将他们的决定转化为一系列相互关联的行动,这些行动将同时更新仓库流程、生产计划和配送路线。
Titan 的Ontology提供对企业各个相互依存环节运营情况的实时、端到端可视性,使管理层和一线团队都能快速了解供应商中断情况。与供应商管理、仓库运营、工厂生产活动、配送中心处理和客户订单履行相关的关键数据系统都被整合为语义对象和链接,以反映企业的语言。运营负责人只需点击几下,即可精确定位因原材料短缺而面临风险的外科口罩生产线,并通过Ontology中的关联,找到所有同样面临风险的未完成客户订单。Ontology的细粒度安全模型确保随着响应范围扩大到企业内更多团队,更敏感的数据元素(例如财务指标)默认会被自动隐藏。
虽然操作用户可以通过直观的Workshop和SDK驱动的应用程序轻松浏览本体,但大型语言模型 (LLM) 的引入对 Titan Industries 而言却是一次倍增器。利用开源和专有 LLM 的 AI 助手能够流畅地浏览组织本体中包含的供应商信息、库存水平、实时生产指标、发货清单和客户反馈。至关重要的是,所有 AI 活动都受到与人类用户相同的安全策略的控制——确保 Titan 工程师始终能够精确控制 LLM 可以查询、推荐和执行的内容。每个构建和部署的 AI 助手都可以被视为一位新的团队成员,随着 Titan 团队成员对其性能的信心增强,其权限也会逐步扩大。
Titan 的本体整合了来自组织重要系统的数据,将其综合成语义对象和链接,从而提供对运营的实时、端到端可见性,并使领导层和一线用户都能快速评估中断的全面影响。
态势感知只是Ontology冰山一角;泰坦工业公司需要迅速找到应对供应商中断的解决方案,并探索每项可能决策的利弊权衡。幸运的是,泰坦公司已将各种预测模型、分配模型、生产优化器和其他逻辑资产以及上述数据源连接到其Ontology中。这使得供应链分析师能够快速运行一系列模拟,详细分析不同材料替代方案的后果。Ontology的互联性和实时性在此阶段至关重要,因为原材料替代可能会对使用相同材料生产的其他产品(例如注射器、手套)产生下游影响。模拟运行过程中,模拟输出会以Ontology场景的形式呈现,将拟议的变更安全地打包到Ontology的沙盒子集中——使团队能够在做出决策之前安全地探索和分析其影响。
对 Titan 团队而言,真正的变革在于 AI 驱动的辅助驾驶和自动化流程能够安全地利用所有逻辑资产以及相同的场景框架。Ontology使 LLM 能够突破以数据为中心的检索增强生成模式的局限性,并通过可扩展的工具范式与Ontology中相互关联的数据、逻辑和动作原语进行交互。这意味着,当 Titan 的分析和数据科学团队在其云工作台中创建新的机器学习模型、在企业系统中调整优化算法以及使用 Palantir 的开放模型构建框架微调 LLM 时,Ontology会将所有这些逻辑资产安全地呈现为 AI 就绪的工具。在本例中,Titan 创建了一个经过调优的 AI 辅助驾驶“Disruption Bot”,它能够使用一套Ontology驱动的工具来扫描所有企业数据源、先前类似情况下采取的行动的后续报告以及可能适用的物料重新分配模型。由于Ontology提供了丰富而密集的上下文信息,Disruption Bot 能够提出一种全新的资源重新分配方案,该方案采用了一种供应链分析师尚未考虑过的新模型。在模拟场景中安全地呈现了该方案的后果后,人工智能提出的决策将移交给人工分析师进行最终审核。
Ontology安全地将 Titan 的逻辑资产(从机器学习到优化模型)呈现为 AI 就绪工具,为人类和 AI 驱动的工作流程提供丰富、密集的上下文。
泰坦工业公司已制定出切实可行的物料短缺解决方案,需要迅速且安全地将决策下达至运行相关流程的运营系统。鉴于该公司通过收购不断发展壮大,其关键运营系统种类繁多且错综复杂,泰坦的IT团队密切关注哪些流程可以向这些系统回写,以及在何种条件下可以回写。Ontology对操作应用了与数据和逻辑相同的严格控制和验证;这实现了对特定操作执行权限的精细控制、用于发布变更的测试驱动框架、批量暂存和审查变更的能力,以及对每个事件的详细日志记录。在本例中,物料重新分配计划的执行会自动协调一系列回写例程,每个例程都针对接收系统进行了优化:仓库管理系统接收API驱动的更新;三个ERP系统分别通过原生本体驱动的连接器接收更新,这些连接器遵循各自系统中的安全机制;生产计划系统接收一个整合的平面文件,并以异步方式导入。在执行操作的过程中,Titan IT 团队可以监控系统响应,并且始终有权审核过去的活动。
Ontology为人工智能在允许的范围内安全执行操作提供了必要的保障。除了数据和逻辑之外,操作还可以自动呈现为人工智能驱动的辅助驾驶和自动化工具。操作的范围可以仅限于在Ontology本身中反映给定的更改(例如,编辑对象或创建新对象);也可以写回单个或多个系统。在 Titan 的案例中,他们授予了 Disruption Bot 和其他几个生产环境中的人工智能辅助驾驶工具有限的操作权限。默认情况下,这些操作(例如,更改工单状态或推送重新分配计划)只能由人工智能执行,然后交给人工进行最终审核。然而,借助本体(以及更广泛的 Palantir 平台)提供的细粒度日志记录和操作工具,Titan 能够精准地选择哪些值得信赖且成熟的人工智能流程可以自动完成操作闭环,而无需人工审核。随着情况的变化,人工智能的权限可以扩大或缩小,并且会立即反映在所有本体驱动的工作流程中。
Ontology使 Titan 能够自动将操作呈现为 AI 驱动的副驾驶和自动化工具,同时为 AI 提供必要的防护措施,使其能够在预定的范围内安全地采取行动。
危机之后会怎样?Titan 将数据、逻辑和行动整合到其本体中,从而能够开展强大的以决策为中心的学习。在应对物资短缺的特定解决方案中,人机协作也揭示了可推广的工作流程,Titan 希望将这些工作流程记录下来,并在未来加以利用。每个数据元素、逻辑资产和评估的行动都会被记录在端到端的决策谱系中——这为优化 AI 的性能提供了丰富的上下文信息。本体中数千名用户做出的汇总决策可以安全地用作模型微调的训练数据,并可以提炼成在 LLM 提示过程中调用的目标原则。以往隐藏在工作流程缝隙中的“经验知识”可以通过 AI 得到发掘,从而改进 AI 的应用。
Ontology会捕获每个数据元素、逻辑资产和操作在决策过程中的更新——这为随着时间的推移优化 AI 的性能提供了丰富的上下文信息。
小结
最终,Ontology使每个组织都能将人工智能直接融入其核心运营,并精确控制在当前一线环境中如何以及何时使用人工智能驱动的推荐、增强和自动化功能。这之所以成为可能,是因为Ontology以决策为中心,而不仅仅是以数据为中心;它将决策的组成要素——数据、逻辑和行动——整合到一个单一的软件系统中。新数据可以快速集成到高保真语义表示中;新的算法和业务逻辑可以无缝地呈现给人类用户和人工智能用户;通过与所有运营系统的实时连接,可以实现强大的行动集成。每个组织的Ontology都能实时反映各个团队不断变化的情况、目标和决策,从而确保人工智能始终扎根于企业的实际情况之中。
本文仅对Ontology底层以决策为中心的架构、系统原生仿真和场景构建功能、Ontology SDK提供的可扩展性、将商业和开源生成式AI模型连接到安全的数据、逻辑和操作子集的各种方法,以及在整个企业范围内扩展人机协作的方法进行了初步介绍。
来源(公众号):数据驱动智能