构建智能体的大脑:上下文图治理、企业知识以及从何开展

2026-03-05 14:14 浏览量:37

本文主要讲如何构建智能体的大脑。图的实际形态是什么样的?代理如何使用它?如何管理它?如何获取部落知识?会遇到什么问题?以及从哪里入手?

 

一个可作为起点的核心元模型

涵盖所有四个元数据类别的最小模式,既小到足以满足首次迭代的需求,又足够丰富以满足实际代理工作流程的需求:

节点:( : DataAsset { id, name, platform, lifecycle_status, sensitivity } ) ( : Field { name , type , description } ) ( : Metric { name, definition, grain, owner_team } ) ( : Policy { name, type , scope, valid_from } ) ( : Owner { id, name, team, role } ) ( : AgentRun { id, timestamp, task, outcome, success } ) ( : Decision { type , rationale, confidence, human_reviewed } ) ( : TribalKnowledge { text, source, captured_at, validated } )关系:( DataAsset ) - [ : HAS_FIELD ] -> ( Field ) ( Metric ) - [ : DERIVED_FROM ] -> ( DataAsset ) ( DataAsset ) - [ : FEEDS ] -> ( DataAsset )               // 血缘关系( Policy ) ) - [ : APPLIES_TO ] -> (数据资产|字段|指标) (所有者) - [ : OWNS ] -> (数据资产|指标) (代理运行) - [ : MADE_DECISION ] -> (决策) (决策) - [ : USED_ASSET ] -> (数据资产) (决策) - [ : USED_METRIC ] -> (指标) (决策) - [: CITED_POLICY ] -> ( Policy ) 
( Decision ) - [ : INFORMED_BY ] -> ( TribalKnowledge ) 
( AgentRun ) - [ : CORRECTED_BY ] -> ( Owner )             // 人工反馈

这是最小可行元模型。每个组织都会根据自身领域对其进行扩展,但这些节点和边涵盖了核心用例:血缘遍历、策略执行、指标消歧和决策审计

 

代理如何实际使用图

只有当智能体能够在正确的时间检索到正确的上下文时,元模型才有意义。以下三个遍历示例说明了元知识图谱在实践中的工作原理:

1. “找到回答此问题最安全的数据集。”当代理需要数据来回答查询时,它不会直接选择第一个匹配的表。它会遍历:DataAsset 节点,并根据策略合规性(我的角色是否满足策略要求?)、新鲜度(上次更新是否在服务级别协议 (SLA) 范围内?)和质量评分(信任评分是否高于阈值?)进行筛选。该图返回一组按排名排列的候选资产,而不是随意猜测。

2.“解释代理选择指标 X 的原因。”审计员或治理团队从代理的回答开始追溯:代理运行程序做出决策,该决策引用了指标(及其权威定义),该指标源自数据资产(及其沿袭关系),而该决策又参考了所有者(上个月验证该定义的领域专家)的更正。一次遍历即可获得完整的溯源信息。

3. “展示管道故障的影响。”事件触发后,代理程序会从故障数据资产的上游(其数据来源)和下游(其数据流向何处)进行遍历。它会找到依赖于该资产的下游消费者(指标,以及如果组织已扩展元模型,则还包括仪表板和报告),识别所有者,并标记受影响的代理程序运行,因为这些运行的决策可能基于过时的数据。过去需要分析师花费数小时进行手动调查的工作,现在只需进行一次图查询即可完成。

在实践中,代理通常会采用混合检索模式:首先利用图遍历获取结构信息(血缘关系、所有权、策略约束、实体解析),然后结合向量搜索获取非结构化上下文信息(例如运行手册、讨论串和先前经验知识的整合摘要,而非原始对话,因为对碎片化的多文档讨论进行向量搜索会丢失跨文档块的上下文信息,因此结果不够可靠)。最后,利用诸如新鲜度和质量评分等操作信号对结果进行重新排序。图遍历提供精确性和可审计性,而向量搜索则提供对杂乱的人工生成内容的召回率。两者结合,可以覆盖企业上下文的全部范围。

 

 

治理即图,而非行政机构

在元知识图谱中,治理是内在的,而非外在的。这是一项设计原则,而非事后考虑:从一开始就定义策略节点。

策略被建模为图中的节点,并通过“Applies_To”边连接到特定的数据资产、列或用户组。当代理请求访问数据集时,系统会从代理的身份节点遍历到目标数据节点。如果路径与代理不满足的限制性策略节点相交,则访问将被拒绝。关键在于,这种策略评估由平台的授权层强制执行,而不是由代理或LLM自行监管。这使得基于属性的动态访问控制能够随着组织复杂性的增加而扩展。

还有一种更为隐蔽的治理风险值得关注。一旦元知识图谱随着时间的推移承载了决策、假设和默认设置,它就不再仅仅是信息载体,而是开始承载权威。原本被记录为“上次我们是这样做的”的模式,可能会悄然变成“我们一直以来都是这样做的”,而这种转变并没有任何明确的授权。记忆变成了无声的政策。如果一个代理从之前的项目中继承了一条解决方案规则,它不仅仅是在重用一个模式,而是继承了一种基于特定决策的行动权限,而这个决策可能是在不同的背景下由一个可能不再对此负责的人做出的。

这意味着代理的内存管理必须像权限管理一样,而不是像文档管理一样。图中的每个持久模式和规则都应该有所有者、过期或审核日期,以及定义其适用范围的权限。该图应该能够轻松地询问:“谁授权了这条规则?何时授权的?它在这个上下文中仍然适用吗?” 如果没有这些控制措施,元知识图谱就会变成积累不受约束的权限的机制,这与其旨在提供的透明性背道而驰。

在实践中,这意味着要根据范围和敏感性对内存进行分类。针对欧洲、中东和非洲地区 (EMEA) 欺诈检测验证的规则不应自动推广到亚太地区 (APAC) 合规性。源自人力资源流程的内存不应向销售代理开放。规则应包含一个随时间衰减的置信度信号,当置信度低于阈值时触发重新验证,而不是静默地保持完全权限。该图通过与数据相同的基于路径的访问控制来强制执行此操作:如果从代理身份到内存节点的遍历路径与代理不满足的范围或敏感性限制相交,则不会显示该内存。

代理做出的每个决策都与图相关联,从而提供完整的溯源信息。如果出现问题,利益相关者可以追踪从决策节点到证据节点和规则节点的路径。治理代理可以遍历新的决策路径,并在最终确定行动之前标记偏差。

该治理层还与运营数据质量相集成。当质量检查失败时,该失败会沿着图传播,并标记下游用户。在受监管行业中,决策轨迹提供了审计人员所需的可验证的溯源信息。元知识图谱以静态政策文件永远无法实现的方式实现了治理。

 

 

获取企业知识:最难的问题

每个组织都依靠内部经验运作:不成文的规则、例外情况以及那些“人尽皆知”的假设,这些都不会被写入正式文档。这些经验散落在聊天记录(包括人与人之间的聊天记录和人与人工智能之间的聊天记录)、内部维基、代码注释和拉取请求、支持工单、事件报告和会议记录中。

让我们坦诚面对这其中的困难。部落知识之所以存在,不仅是因为将其正式化从未值得付出努力,更是因为正式化本身就令人望而生畏。它是有机演进的,一次只关注一个例外。围绕每一条细小的知识添加流程,就会引入官僚主义,反而拖慢了知识所支撑的工作效率。多年来,这些非正式规则积累成一个无形的操作系统,没有人能完全理解。掌握这些规则的人通常是组织中最忙碌的人。他们不会停下来,为了方便代理人而将其记录下来。而且,这些规则大多具有情境性、模糊性和矛盾性:一个团队的“永远这样做”可能是另一个团队的“永远不要那样做”。

一个实用的架构包含三种机制,但任何一种机制都并非完美无缺。
 

被动采集:代理监控通信渠道、文档变更和代码库(提交、拉取请求、配置变更),以识别包含知识的内容。随着编码代理的兴起,这种采集可以直接构建到开发工作流程中,从而使每次代码变更自动注册其元数据和理由。这种方法可以采集广度信息,但无法采集深度信息,并且需要明确的范围控制、最小化、编辑、保留策略以及在适用情况下获得用户许可(此处适用与决策跟踪相同的编辑处理模式)。
 

主动启发:辅助代理在领域专家的工作流程中向其提出针对性问题,例如:“您刚刚更正了这个指标定义。此更正是否应应用于所有区域?”这种方法可以采集深度信息,但依赖于专家对提示的参与。
 

结构化集成:将采集到的知识连接到图中相关节点的管道,维护来源信息并支持在推理时进行检索。这是使采集到的知识能够被利用的工程技术。

辅助代理模式值得重点关注。无论是知识工程师、分析师还是业务用户,在使用人工智能工具处理数据任务时,对话本身都包含丰富的上下文信息:澄清的问题、已作出的更正、已阐明的约束条件。在知识产生的瞬间捕获它,远比之后从日志中重建它要有效得多。这种捕获并不总是需要完全结构化。有时,一个摘要就足够了:将对话浓缩并去噪,形成一个可搜索的节点,并带有清晰的标签、来源信息以及指向相关资源的链接。与其将图节点视为僵化的数据库行,不如将其视为动态文件,代理可以通过名称、路径和关键词对其进行更新、丰富和搜索。完整的本体结构固然理想,但可查找和可链接的半结构化捕获也远胜于无任何记录。

 

 

元知识图谱如何保持正确性

与现实脱节的元知识图谱比没有图谱更糟糕:它会给用户带来虚假的自信。运行模型与数据模型同等重要。

元数据来源包括数据目录、编排平台、模式注册表、查询引擎、CI/CD 流水线、可观测性和监控工具、事件/工单系统以及代理本身。大部分元数据已经存在于其他地方。图的作用是连接这些元数据,而不是重新创建它们。

数据摄取模式。优先采用事件驱动型摄取:当管道部署、模式变更、质量检查失败或代理完成运行时,会触发事件并更新数据图。目录和注册表的批量扫描作为备用方案和协调机制。数据图的更新不应依赖于人工操作。

决策轨迹以追加事件的形式记录。这一点至关重要。代理不应实时将子图直接写入图。相反,每个代理操作都会生成一个不可变的轨迹事件(一个追加日志条目)。一个独立的处理器负责验证、在必要时编辑敏感内容、强制执行模式,并将轨迹实例化到图中。保留原始事件以供审计,保留图投影以供检索。这是一种标准的数据工程模式(将事件日志记录到经过管理的服务器层),它可以防止因允许对共享图进行不受限制的写入而导致的扩展性、并发性和隐私问题。

幂等性和去重。使用确定性标识符来标识资产和事件。设计时应考虑至少一次的摄取和幂等写入。如果同一管道运行被报告两次,则图不应创建重复节点。

回填机制。如果出现问题,需要根据源日志重建部分图。从一开始就要考虑到这一点:每个节点都应该可追溯到其源事件或元数据记录,以便可以根据其输入重建图。

这项工作并不光鲜亮丽。但如果没有它,元知识图谱的价值流失速度将远超其积累速度。

可能出现什么问题

如果没有对故障模式的真实描述,任何架构文章都是不完整的。

过时的元数据会导致错误的连接。如果图的物理层没有及时更新,代理会根据不再反映实际情况的模式信息推荐连接或数据集。自动化是唯一的防御手段。

错误的语义映射会产生看似正确的错误答案。如果语义层中“客户流失”的定义有误,那么所有依赖该定义的代理都会给出看似权威且来源可靠的错误答案。这比完全没有定义更糟糕,因为它看起来是正确的。领域专家验证至关重要。

反馈回路会放大不良模式。如果行为信号过分强调受欢迎程度,个体就会趋向于使用频率最高的路径,即使该路径并非最优。设计时应考虑多样性:既要展现已被验证的模式,也要标记个体忽略其他选择的情况。

决策追踪风险:数据臃肿和隐私泄露。如果每个微步骤都未经聚合就存储,追踪层将变得难以管理。如果追踪数据包含原始提示或个人身份信息 (PII),则会造成治理风险。因此,应实施数据保留策略,聚合低价值追踪数据,将热数据与冷数据分开存储,并使用仅追加事件模式和数据脱敏处理器。

多智能体系统与共享上下文层

企业人工智能不会是单一的智能体,而是由一系列专业化的智能体组成:数据智能体查询数据仓库,文档智能体处理合同,工作流智能体协调审批流程,分析智能体生成洞察。每个智能体都专注于特定领域,但都需要访问相同的共享上下文。

元知识图谱是协调层。一个智能体的发现会成为另一个智能体的起点。数据智能体学习到某种特定的连接模式不可靠;分析智能体则继承了这一知识。对一个智能体的输出进行修正,就能提升所有智能体未来的性能。

当智能体之间出现分歧时(这种情况不可避免),知识图谱能够清晰地展现并追溯这些分歧。一个智能体的知识图谱切片可能编码了一条与另一个智能体相冲突的规则。双方不会各自默默地覆盖对方的规则,而是会公开各自的推理过程并注明出处,然后由人类来定义在特定情境下应该优化哪个指标。这就像两位副厨在烹饪技巧上意见不一致一样:他们不会争吵解决,而是会把问题提交给主厨,由主厨根据菜肴的最终效果来做出决定。人类也可以直接覆盖智能体的结论,确保在正确的情境中使用正确的元数据。这些覆盖操作在知识图谱中拥有最高的权威性,正是因为它们代表了明确的人类判断。

对于高风险操作,默认设置应该是推荐而非执行:智能体会筛选出具有来源信息的最佳选项,然后由人工审核。随着置信度的提升和决策轨迹展现出可靠性,推荐和自主操作之间的界限可能会发生变化,但该图谱确保该界限始终可见且可审计。

这就是企业元知识图谱与本地内存存储的区别所在。它并非旨在提升单个代理的智能程度,而是旨在使整个组织的代理集群具备集体智能。

先缩小范围,然后复合

上述各层结构和元模型描述了完整的架构图。任何组织都不应该试图一次性构建所有内容。行之有效的模式是:

选择一到两个高价值的代理工作流程,例如事件分类、指标消歧、合同审查和数据集选择。选择那些错误答案代价高昂且正确答案可验证的工作流程。

为这些工作流程构建一个最小的元知识图谱切片。使用核心元模型。将资产与血缘关系、所有权、策略和派生关系连接起来。这就是您的最小可行元知识图谱。

创建评估集。提供具有代表性查询的黄金标准答案及其理由。在元知识图谱出现之前,需要多长时间?答案出错的频率如何?之后,衡量以下指标:准确率、解决时间、升级率、策略违规率。如果无法衡量改进,就无法证明扩展的合理性。

系统地记录人工修正。每当领域专家修正智能体的输出时,该修正都会反馈到图中。这些修正信息是系统中最有价值的数据。

不断迭代改进存储内容、检索内容以及上下文排序方式。第一个版本可能会存在一些有趣的错误。这正是关键所在。每一次迭代都会让下一次迭代更加完善。

第二个项目应该比第一个项目更快。第十个项目应该几乎是自动完成的。这种复利效应就是全部价值所在。

小结

企业数据架构是为人类设计的,而下一批加入团队的同事是人工智能体。智能体元数据是传统框架无法涵盖的新类别。所以构建和管理该架构的蓝图要遵循六项原则:

竞争优势不在于模型本身,而在于你的背景。背景即智慧。模型每季度都在改进,功能也在不断趋同。只有你才拥有的组织背景、你的经验知识、你的决策历史、你的业务逻辑、你积累的修正经验,这些才是任何供应商都无法复制、任何竞争对手都无法购买的。

应由领域专家参与,从语义层面进行组织。了解业务领域的人员必须定义术语的含义。LLM(生命周期管理专家)可以提出结构建议,但他们无权决定含义、治理或约束条件。技术实现应遵循业务建模,而非反之。

从一开始就要设计多智能体架构。企业级人工智能不会是单一的智能体,而是由多个共享同一上下文层的专业化智能体组成的集群。架构必须支持智能体管理自身的知识图谱切片,通过溯源信息发现冲突,并继承人类定义的解决方案。协同作用才是最终目标,而非单个智能体本身。

对代理的记忆进行管控。缺乏管控的记忆就像是无声的策略累积。每个持久模式都需要一个所有者、一个作用域、一个过期时间以及一个随时间衰减的置信度信号。代理的记忆必须像权限管理一样进行管控,而不是像文档管理那样。

让图论自我学习。每一次智能体交互、每一次修正、每一个成功的模式都会在图论中留下痕迹。随着时间的推移,这些痕迹会形成一个可挖掘的结构:隐性关系显性化、关键决策节点被识别、智能体行为聚类成可重用的模式。图论不仅存储已发生过的事情,它还能发现那些无人明确记录的信息。成功的路径会被强化,失败的路径则会逐渐消失。系统积累智能的方式,如同团队积累经验一般。

现在就开始记录决策轨迹。即使在构建完整的元知识图谱之前,记录的每一个模式选择、每一次修正、每一条理由,都会随着时间的推移而积累成宝贵的记忆。第二个项目应该比第一个项目更快。第十个项目应该几乎可以自动完成。

 

构建元知识图谱的最佳时机是创建第一个数据平台之时,其次就是当下。

 

来源(公众号):数据驱动智能

上一篇:两会上的“数据”声音

下一篇:Malt 公司AI应用和发展的实际案例|AI应用的火花

  • 分享:
龙石数据
咨询电话: 400-800-9577

400-800-9577