Dig Mind

数据源配置与管理

了解如何接入外部信息源 (Info Source),配置 RSS 自动归集并管理跨项目资源。

外部触角:数据源管理

DigMind 不仅仅处理您手动上传的文件,它还能通过 信息源 (Info Source) 模块主动获取互联网上的实时情报。

1. 信息源发现与订阅

在全局的“信息源”面板中,您可以发现并接入各种高质量的外部资源:

  • 海量高价值源内置(新):系统已免费内置扩充 36Kr、Hacker News、GitHub Trending、财联社、OpenAI Blog 等数十个科技、创投、财经及 AI 前沿动态优质源。
  • 手动添加:支持通过网页链接(URL)快速录入。
  • RSS 订阅:这是系统最强大的数据接入方式。通过填入 RSS 地址(如新闻站点、研报聚合页),Agent 可以实现 24/7 的自动化情报抓取。
  • Agent 结构化提取(新):新增基于 Agent 的分层式网页抓取引擎,支持对复杂网页动态渲染和各种反爬机制的自适应抓取,获取非标信息更容易。
  • 底层数据库直连:除了传统的网络源资产,系统现在增加了对国产达梦数据库 (DaMeng DB) 的直接数据源原生支持,丰富了政企内部底座设施打通链路。
  • 精选推荐:系统会根据您的项目偏好,由 AI 推荐相关领域的高分信息源。

2. RSS 自动归集机制

为了解决外部信息零散、难以整理的问题,DigMind 实现了自动挂载逻辑

  • 手动调度控制(新):在 RSS 源管理界面,现在您可以直接手动开启或关闭指定信息流的定时更新任务,掌控更新节奏。
  • 根目录映射:一旦您在项目中关联了某个 RSS 信息源,系统会自动在资源空间(Resources)根目录下建立一个名为 “信息源” 的系统文件夹。
  • 层级分类:该文件夹内部会根据信息源的“分类标签”进一步建立子目录(如:信息源/行业研报/机器之心),确保每一篇抓取的文章都能归位。
  • 自动同步:每当 RSS 源产生更新,新文章会自动转化为 Markdown 格式存入上述路径,无需任何人工干预。

RSS与信息源配置示例

3. 信息源评价体系

并非所有的信息源都值得采纳。系统内建了一套 AI 评估模型。

  • 数据源质量前置检查(新):在您刚刚输入 RSS 链接或者通过关键字订阅的瞬间,底层嗅探机制就会先对其进行一次“试水温”的网络质量和 RSS 格式检查,直接杜绝网络解析超时导致的页面假死。
  • 中文上下文搜索优化(新):在智能发现功能中,后台 Agent 如今全面默认采用中文检索策略过滤无效外链,寻找信息源变得更加顺畅、精准。
  • 真实性评分:基于历史抓取内容的交叉核验,由 AI 给出信任得分。
  • 稳定性监控:实时监控该源的连通率,自动过滤掉无法访问或内容质量大幅下降的“僵尸源”。

4. 共享与私有

  • 社区资源:您可以将发现的高质量源贡献到系统的“公开市场”,供其他用户参考。
  • 项目私有:某些涉及内部 API 或私密系统的 RSS 源可以配置为“项目专属”,确保数据流向受控。

进阶玩法:在 Pro 模式 (Plan 先知) 下,Agent 会主动判断是否需要通过已订阅的“信息源”去获取更实时的证据,从而使得分析报告具备极强的时效性。

On this page