Dig Mind

实体与本体管理

了解如何定义项目的业务模型 (Ontology),以及 AI 如何在本体缺失时自动挂起并智能唤醒知识提取任务。

知识基石:实体与本体管理

本体 (Ontology) 是 DigMind 理解您业务逻辑的底层“语料库”。通过定义领域内的实体、属性与关系,您可以大幅提升 AI 从海量文档中提取知识的精确度。

1. 领域模型 (Domain & Objects)

在项目中,知识被组织在不同的领域 (Domain) 下:

  • 本体对象 (Objects):代表核心概念(如:汽车零部件、政策法规、竞品公司)。
  • 属性定义 (Properties):描述对象的特征(如:零部件的“材质”、法规的“颁布日期”)。
  • 关系映射 (Relations):描述对象间的联接逻辑(如:A 公司“收购了” B 公司)。

2. 智能提取与挂起机制

这是 DigMind 的核心竞争力之一。当您上传文档并触发“知识提取”时,系统会执行以下逻辑:

  • 本体完整性检查:AI 会首先检查当前项目是否已定义了必要的本体规范。
  • 自动挂载与挂起 (Auto-Suspend):如果系统识别到您的项目尚未定义任何本体模型,为了防止 AI 盲目提取导致数据混乱,提取任务会自动转入 PENDING(挂起)状态
  • 智能唤醒 (Wake-up):一旦您在本体编辑器中新增了相关的实体方案,后台监控程序会感应到这一变更,并自动唤醒之前挂起的任务,无需您手动重新提交。
  • AI 种子本体自动推断(新增):当挂起的大量资料缺乏前置定义时,系统现在支持自动进行一轮粗筛并尝试“无监督本体分析”。Agent 会为您自动总结并同步生成基础本体库规则到线上,大幅节省您人工从零归纳本体特性的时间和校验精力。
  • 提速与并发保障:图谱的持久化构建与大规模抽取现在具备更高的 Restate 并发保障与数据库隔离连接,避免了以往大批量重建带来的拥堵。系统也修复了图谱在保护机制下偶发误判“正在索引”的视觉异常。

3. 本体编辑器功能

  • 可视化定义:通过直观的表单或代码 JSON 视图定义对象结构。
  • 规则下钻:支持为特定属性定义“抽取规则”(如:仅从文档的页脚提取日期)。
  • 本体冲突处理:当系统发现同名实体但在不同文档中属性冲突时,会提示您进行“知识融合”。

4. 导出与集成

  • Schema 导出:支持将定义好的本体导出为标准的 JSON Schema,方便集成到其他 BI 或 ERP 系统。
  • 模板沉淀:您可以将成熟的本体方案保存为项目模板,在下次创建新项目时直接复用。

操作建议:如果您发现资源空间的文件始终处于“解析中”或“挂起”状态,请检查是否尚未在该项目所属的领域内定义基础本体。

On this page