实体与本体管理
了解如何定义项目的业务模型 (Ontology),以及 AI 如何在本体缺失时自动挂起并智能唤醒知识提取任务。
知识基石:实体与本体管理
本体 (Ontology) 是 DigMind 理解您业务逻辑的底层“语料库”。通过定义领域内的实体、属性与关系,您可以大幅提升 AI 从海量文档中提取知识的精确度。
1. 领域模型 (Domain & Objects)
在项目中,知识被组织在不同的领域 (Domain) 下:
- 本体对象 (Objects):代表核心概念(如:汽车零部件、政策法规、竞品公司)。
- 属性定义 (Properties):描述对象的特征(如:零部件的“材质”、法规的“颁布日期”)。
- 关系映射 (Relations):描述对象间的联接逻辑(如:A 公司“收购了” B 公司)。
2. 智能提取与挂起机制
这是 DigMind 的核心竞争力之一。当您上传文档并触发“知识提取”时,系统会执行以下逻辑:
- 本体完整性检查:AI 会首先检查当前项目是否已定义了必要的本体规范。
- 自动挂载与挂起 (Auto-Suspend):如果系统识别到您的项目尚未定义任何本体模型,为了防止 AI 盲目提取导致数据混乱,提取任务会自动转入 PENDING(挂起)状态。
- 智能唤醒 (Wake-up):一旦您在本体编辑器中新增了相关的实体方案,后台监控程序会感应到这一变更,并自动唤醒之前挂起的任务,无需您手动重新提交。
- AI 种子本体自动推断(新增):当挂起的大量资料缺乏前置定义时,系统现在支持自动进行一轮粗筛并尝试“无监督本体分析”。Agent 会为您自动总结并同步生成基础本体库规则到线上,大幅节省您人工从零归纳本体特性的时间和校验精力。
- 提速与并发保障:图谱的持久化构建与大规模抽取现在具备更高的 Restate 并发保障与数据库隔离连接,避免了以往大批量重建带来的拥堵。系统也修复了图谱在保护机制下偶发误判“正在索引”的视觉异常。
3. 本体编辑器功能
- 可视化定义:通过直观的表单或代码 JSON 视图定义对象结构。
- 规则下钻:支持为特定属性定义“抽取规则”(如:仅从文档的页脚提取日期)。
- 本体冲突处理:当系统发现同名实体但在不同文档中属性冲突时,会提示您进行“知识融合”。
4. 导出与集成
- Schema 导出:支持将定义好的本体导出为标准的 JSON Schema,方便集成到其他 BI 或 ERP 系统。
- 模板沉淀:您可以将成熟的本体方案保存为项目模板,在下次创建新项目时直接复用。
操作建议:如果您发现资源空间的文件始终处于“解析中”或“挂起”状态,请检查是否尚未在该项目所属的领域内定义基础本体。