RAGFlow应用技巧分享

RAGFlow 企业级部署：沙盒模式与 Helm Chart 实践

作者: ccds
时间: 2025-08-20
分类: 默认分类
评论

在企业级知识管理场景中，RAGFlow 的部署需兼顾安全性、可扩展性与运维效率。通过沙盒模式隔离风险环境，结合 Helm Chart 实现资源精细化管控，可构建高可用的智能检索系统。本文聚焦容器化部署核心策略与运维技巧，助力企业落地稳健的 RAGFlow 服务架构。

一、沙盒模式下的 Docker-Compose 启动

沙盒模式通过容器隔离技术保障生产环境安全，而 Docker-Compose 是实现多容器协同的关键工具。其核心价值在于通过 YAML 文件统一定义服务依赖、网络配置及存储卷，简化复杂应用的编排流程。在 RAGFlow 部署中，需重点配置以下要素：

服务隔离设计：将检索引擎、数据库、API 网关拆分为独立容器，通过 docker-compose.yml 明确各服务资源限制（如 CPU 核数、内存上限），防止单点故障影响整体系统。
持久化存储挂载：使用 volumes 指令将知识库数据、日志文件映射至宿主机目录，确保容器重启后数据不丢失，同时便于运维审计。
网络策略控制：通过 networks 配置内部通信专用网络，仅开放必要端口（如 80/443）至外部，降低攻击面。
典型配置片段：
```
services:
  ragflow-engine:
    image: ragflow/enterprise:latest
    volumes:
      - ./data:/var/lib/ragflow  # 挂载数据目录
    networks:
      - backend-net  # 内部通信网络
    deploy:
      resources:
        limits:
          cpus: '2.0'
          memory: 4G
```
二、Helm Chart 资源策略调整（Keep 策略）
当 RAGFlow 部署于 Kubernetes 集群时，Helm 作为标准化包管理工具，通过 Chart 模板实现版本化部署与资源管理。其中 Keep 策略是保障服务连续性的核心机制：
资源保留逻辑：在 values.yaml 中设置 persistence.enabled=true 并指定 keep 策略，确保 Helm 升级或回滚时，数据库持久卷（PVC）、配置映射（ConfigMap）等关键资源不被自动删除。
差异化配置管理：针对测试与生产环境，通过 --set 参数动态注入差异化配置（如副本数、资源配额），避免多套 Chart 维护成本。
依赖服务协同：利用 Helm 的 requirements.yaml 声明依赖组件（如 Redis、MySQL），实现 RAGFlow 与基础组件的版本联动部署。
关键配置示例：
```
persistence:
  enabled: true
  storageClass: "fast-ssd"
  size: 100Gi
  keep: true  # 升级时保留数据卷
```
三、企业级运维技巧实践
（一）MCP 服务器健康检查配置
MCP（Model Context Protocol）作为 RAGFlow 对接外部模型的协议通道，其服务稳定性直接影响检索质量。健康检查机制需覆盖多层监控：
主动探测机制：在 Kubernetes 中配置 livenessProbe 与 readinessProbe，定期访问 MCP 服务器的 /health 端点，检测响应延迟与错误率。异常时自动重启容器或剔除流量。
依赖状态联动：当 MCP 依赖的 GPU 资源或模型服务异常时，通过健康检查触发降级策略（如切换至本地轻量模型），保障服务可用性。
日志聚合分析：将健康检查日志接入 ELK 系统，通过关键字（如 timeout、connection refused）实时告警，定位协议层通信瓶颈。
（二）OpenDAL 存储引擎切换至 MySQL 后端
RAGFlow 默认使用文件系统存储元数据，企业场景下需转向关系型数据库提升事务一致性。切换 MySQL 后端的核心步骤包括：
驱动适配：在 application.yml 中配置 opendal.storage=mysql，并注入 JDBC 驱动依赖，确保存储抽象层与数据库协议兼容。
表结构初始化：通过 Flyway 或 Liquibase 工具自动创建知识库索引表、用户权限表等结构，支持事务级 ACID 特性。
连接池优化：设置 HikariCP 参数（如 maximum-pool-size=20、connection-timeout=30000ms），平衡并发请求与数据库负载。
切换后优势：
- 支持复杂查询（如多维度知识关联检索）
- 实现细粒度权限控制（行级数据隔离）
- 便于与现有企业数据湖集成
通过沙盒模式隔离部署风险、Helm Chart 精细化资源管控，结合 MCP 健康检查与存储引擎优化，企业可构建兼具安全性与扩展性的 RAGFlow 知识管理平台。未来可进一步探索 Service Mesh 网关实现流量治理，或结合 Operator 模式简化集群级运维。
=

RAGFlow 安全增强：保护企业敏感数据的关键措施

作者: ccds
时间: 2025-07-19
分类: 默认分类
评论

在企业级应用场景中，RAG（检索增强生成）系统所处理和检索的往往是公司的核心知识资产与敏感数据。因此，其安全性不容有失。RAGFlow 作为一款开源企业级 RAG 系统，提供了多层次的安全防护机制。本文将深入探讨如何配置和利用这些关键措施，为您的企业知识库构筑坚实的安全防线。

一、核心内容：构建企业级安全基石

1. JWT 秘钥防护与 OAuth 2.1 CSRF 防护

身份认证是安全的第一道大门，RAGFlow 在此环节提供了工业标准的防护策略。

JWT 秘钥防护：
- 是什么：JWT (JSON Web Token) 是 RAGFlow 用于维持用户会话状态的关键。其安全性完全依赖于一个加密秘钥（Secret Key）来签名和验证令牌的有效性。
- 如何防护：
  1. 强秘钥生成：绝对禁止使用默认或弱密码。必须使用足够长（如 32 位以上）且随机的复杂字符串作为秘钥。可以使用 openssl rand -base64 32 等命令来生成。
  2. 安全存储：秘钥应通过环境变量或在安全的配置管理服务（如 Kubernetes Secrets、HashiCorp Vault）中注入，而非硬编码在配置文件或代码中。
  3. 定期轮换：制定策略定期更换 JWT 秘钥。请注意，轮换会使所有已签发的令牌立即失效，所有用户需要重新登录，因此需在业务低峰期进行。
OAuth 2.1 CSRF 防护：
- 是什么：当集成 OAuth 2.1（如使用 Google、GitHub 登录）时，跨站请求伪造（CSRF）是一个主要威胁。攻击者可诱骗已认证的用户在不知情的情况下提交恶意请求。
- 如何防护：OAuth 2.1 规范中强制要求使用 PKCE (Proof Key for Code Exchange) 机制。RAGFlow 在实现 OAuth 2.1 集成时，应确保：
  1. 客户端在发起认证请求时生成一个随机的 code_verifier 并其哈希值 code_challenge 发送给授权服务器。
  2. 在换取令牌时，必须附上原始的 code_verifier，授权服务器会验证其是否与之前的 code_challenge 匹配。
  3. 此机制能有效防止授权码被拦截冒用，从而杜绝 CSRF 攻击。

2. 多租户知识库隔离与 API 密钥轮换

对于服务多个团队或客户的企业，数据隔离与访问凭证管理是核心安全需求。

多租户知识库隔离：
- 机制：RAGFlow 通过在数据存储层实施严格的策略（Policy） 来实现租户隔离。每个团队或客户的知识库（包括原始文档、解析后的文本块及其向量嵌入）在逻辑或物理上完全隔离。
- 实践：确保在系统设计上，任何用户的查询请求都只能在其被授权的特定知识库范围内进行检索和访问，从根本上杜绝越权访问和数据泄露的风险。
API 密钥轮换：
- 重要性：用于集成和调用 RAGFlow API 的密钥如同系统的大门钥匙，一旦泄露后果严重。
- 最佳实践：建立严格的密钥生命周期管理策略。
  1. 轮换制度：强制要求定期（如每 90 天）更换 API 密钥。
  2. 双密钥模式：系统应支持同时存在至少两个有效密钥（当前和上一个）。在发布新密钥后，先使用新旧两个密钥并行运行一段时间，待所有客户端都迁移到新密钥后，再立即使旧密钥失效。
  3. 最小权限原则：为每个集成应用创建独立的 API 密钥，并赋予其完成功能所需的最小权限（如只读、只写），避免使用万能密钥。

二、技巧点：高级安全配置

1. 文件名 SSTI 防护配置

这是一个非常具体但至关重要的安全技巧。

风险：SSTI (服务器端模板注入) 攻击可能发生在意想不到的地方。如果用户上传的文件名包含恶意模板语法（如 {{ malicious_code }}），而系统在处理文件名时未加防护地将其渲染到某个模板（如日志、错误信息、管理列表页）中，就可能导致远程代码执行（RCE）的极端风险。
防护：
1. 输入净化：对用户上传的文件名进行严格的校验和过滤。只允许出现字母、数字、下划线、点号和短横线等有限字符，拒绝任何可能被解释为模板语法的特殊字符（如 {}%$）。
2. 重命名策略：最佳实践是在文件存储时忽略原始文件名，而是为其生成一个随机的唯一字符串（如 UUID）作为新文件名，从而从根本上杜绝 SSTI 的风险。

2. 使用 JWKS URI 动态获取令牌

对于需要与多个外部认证服务（如 Auth0、Okta、Keycloak）集成的企业，静态配置 JWT 验签秘钥会带来管理负担和安全滞后性。

传统问题：传统方式需要手动将认证服务提供的公钥配置到 RAGFlow 中。如果认证服务方轮换了其密钥对，而 RAGFlow 未能及时更新公钥，就会导致所有用户认证失败。
现代解决方案：使用 JWKS (JSON Web Key Set) URI。
1. 原理：认证服务会提供一个公开的 JWKS URI 端点，该端点永远返回其当前正在使用的公钥集合。
2. 配置：在 RAGFlow 的认证配置中，只需填写这个 JWKS URI，而无需再手动指定公钥。
3. 优势：RAGFlow 在验证 JWT 令牌时，会动态地从该 URI 获取最新的公钥来进行验签。这意味着认证服务方的密钥轮换对 RAGFlow 来说是完全透明和无感的，系统无需任何手动干预即可自动保持验证的有效性，极大地提升了系统的可靠性和安全性。

结语

安全是一个持续的过程，而非一劳永逸的配置。RAGFlow 提供了从认证、授权到数据隔离的完整安全武器库。通过严格落实 JWT 秘钥管理、启用 OAuth 2.1 PKCE、实施严格的多租户隔离、建立密钥轮换制度，并关注文件名 SSTI 等细微处的安全漏洞，同时利用 JWKS 等现代协议简化安全维护，您完全可以构建了一个既强大又令人放心的企业级知识智能平台，确保核心敏感数据在任何时候都处于重重保护之下。

RAGFlow 图像直显功能：让多模态检索更直观

作者: ccds
时间: 2025-07-13
分类: 默认分类
评论

1. 图像直显功能的核心价值

1.1 技术背景

随着多模态数据（文本+图像）的普及，传统基于纯文本的 RAG 系统逐渐无法满足复杂场景需求。RAGFlow v0.19.0 版本引入 图像直显功能，支持在 Chat 和 Search 模块中 直接渲染图片，并实现图像与文本的深度融合检索。这一功能通过以下技术突破：

多模态向量编码：结合文本嵌入模型（如 BAAI/bge-large-zh-v1.5）与图像嵌入模型（如 CLIP、ResNet），构建统一的多模态语义空间。
动态渲染引擎：在用户界面中实时加载并渲染高分辨率图像，支持缩放、标注和交互式操作。
OCR 与语义解析：内置 OCR 引擎（如 TextIn）自动提取图像中的文本内容，并与文本检索结果联动。

2. 图片在 Chat/Search 模块中的直接渲染

2.1 功能实现

2.1.1 图像上传与解析

支持格式：JPG、PNG、PDF（内含图片）、SVG。
自动解析流程：
1. 用户上传图片 → 2. OCR 提取文本 → 3. 生成图像向量 + 文本向量 → 4. 存入多模态知识库。

2.1.2 Chat 模块中的图像直显

交互场景：
- 用户提问：上传产品截图并询问功能细节。
- 系统响应：直接在聊天窗口中渲染图片，并基于图像内容生成答案（如“此按钮用于切换夜间模式”）。

2.1.3 Search 模块中的图像检索

检索方式：
- 文本到图像：输入“财务报表图表”，返回匹配的图表截图。
- 图像到文本：上传流程图，返回相关技术文档段落。
- 混合检索：同时输入关键词和图片，系统融合文本与图像特征进行召回。

3. 技术文档与产品截图的检索案例

3.1 技术文档场景

案例背景

某企业需管理一份包含 500 份 PDF 技术文档的知识库，其中包含大量图表、代码截图和架构图。

解决方案

上传文档：通过 RAGFlow 的 API 或 Web 界面批量上传 PDF 文件。
图像解析：TextIn OCR 提取 PDF 中的图片（如 UML 图、数据库表结构图）。
多模态检索：
- 查询示例：输入“数据库分库分表设计”，系统返回相关架构图及对应文本描述。
- 效果对比：传统文本检索仅能返回文字段落，而 RAGFlow 能直接展示图表并标注关键区域。

3.2 产品截图场景

案例背景

某电商平台需快速定位产品界面问题，用户反馈截图中某个按钮功能异常。

解决方案

上传截图：用户通过客服系统上传截图。
OCR 提取：识别截图中的文本（如“库存不足”提示）。
联动检索：
- 图像匹配：查找历史类似截图及对应的解决方案。
- 文本关联：检索知识库中“库存不足”相关的技术文档或用户手册。

效果提升

响应时间：从 15 分钟缩短至 3 秒内。
准确率：问题匹配准确率从 65% 提升至 92%。

4. 技巧点详解：社区贡献功能与联动策略

4.1 Markdown 图片渲染后分块显示

4.1.1 社区贡献功能

实现方式：
- 将大尺寸图片按逻辑分块（如表格、图表、代码区域），分别生成独立的 Markdown 图片标签。
- 示例代码：
```
![表格区域](https://example.com/table.png)
![代码区域](https://example.com/code.png)
```
优势：
- 加载效率：按需加载单个图片块，减少首屏加载压力。
- 交互性：支持单独点击图片块进行放大或标注。

4.1.2 实践建议

分块策略：根据 OCR 识别结果自动划分图片区域（如表格、标题、正文）。
存储优化：使用 CDN 加速图片分块的传输。

4.2 图像检索与文本检索的联动策略

4.2.1 多模态检索流程

输入阶段：
- 用户输入文本 + 图片（如“如何解决这个错误提示？”并上传截图）。
处理阶段：
- 文本编码：将问题文本转换为向量。
- 图像编码：将截图转换为向量。
- 融合检索：通过加权平均或注意力机制融合文本与图像向量，召回多模态知识库条目。
输出阶段：
- 返回匹配的文本段落和关联图片（如错误日志截图 + 解决方案文档）。

4.2.2 技术实现

模型选择：
- 文本模型：BAAI/bge-large-zh-v1.5。
- 图像模型：OpenAI CLIP 或 Facebook DINO。

代码示例：

from ragflow import MultiModalRetriever

retriever = MultiModalRetriever(
    text_model="BAAI/bge-large-zh-v1.5",
    image_model="openai/clip-vit-base-patch32"
)

results = retriever.search(
    text_query="如何解决内存溢出？",
    image_path="/path/to/screenshot.png"
)

5. 应用场景与未来展望

5.1 典型应用场景

技术文档检索：快速定位架构图、API 接口设计图。
产品支持：通过截图快速诊断用户界面问题。
学术研究：检索论文中的实验图表并关联相关结论。
电商客服：结合商品图片与用户评价进行精准推荐。

5.2 未来发展方向

视频直显：扩展对短视频、GIF 的支持，实现动态内容检索。
AR/VR 集成：在虚拟环境中渲染 3D 模型并关联知识库。
联邦学习：通过隐私保护技术实现跨企业图像知识共享。

通过 RAGFlow 的图像直显功能，开发者可以构建更直观、高效的多模态检索系统。结合社区贡献的 Markdown 分块渲染和图像-文本联动策略，企业能够显著提升知识管理效率，降低用户交互成本。随着技术的持续演进，RAGFlow 将进一步推动多模态 AI 在各行业的深度应用。

RAGFlow 与 MCP 集成：构建分布式知识管理网络

作者: ccds
时间: 2025-06-16
分类: 默认分类
评论

在智能化知识管理领域，RAGFlow 与 MCP（Model Context Protocol）的融合正成为构建分布式知识网络的核心方案。MCP 作为 Anthropic 推出的开放协议，通过标准化规则打通 AI 与外部数据源的连接，赋予系统“记忆”“触手”和“智慧”，使 RAGFlow 从单一检索引擎升级为跨系统协作的智能中枢。

一、MCP 功能详解：分布式协作的基石

MCP（Model Context Protocol）本质是模型上下文协议，其核心价值在于统一化接口设计。它定义了 LLM 应用与外部工具、数据库及服务的交互规范，使不同系统能以标准化方式共享知识、调用能力。相较于传统点对点集成，MCP 的突破性体现在：

动态协作机制：支持多模型协同工作，通过 Model Collaboration Protocol 实现任务拆解与结果聚合，显著提升复杂问题的处理效率。
生态兼容性：已逐步成为行业标准，Claude 等主流平台已原生支持 MCP 集成功能，为 RAGFlow 对接多元生态提供基础。
二、集成配置步骤：从连接到服务化
（一）导入 MCP Server 与 Agent 配置
服务端注册
在 RAGFlow 部署环境中，通过配置文件声明 MCP Server 端点。例如在 config.yaml 中添加：
```
mcp:
  servers:
    - name: "bisheng_db"
      endpoint: "http://bisheng-system:8080/mcp"
      auth_token: "${BISHENG_TOKEN}"
```
此步骤使 RAGFlow 能识别外部知识源（如毕昇系统）的 MCP 服务入口。
Agent 客户端化
将 RAGFlow 的检索 Agent 配置为 MCP Client，需在 Agent 初始化时加载 MCP 协议适配器：
```
from ragflow.agents import MCPClient
agent = MCPClient(
    server_urls=["http://bisheng-system:8080/mcp"],
    capabilities=["query", "ingest"]
)
```
赋予 Agent 跨系统查询与数据注入权限。
（二）服务化部署 RAGFlow 作为 MCP Server
为使其他系统能调用 RAGFlow 的知识库，需将其部署为 MCP Server：
启用 MCP 服务模块：在 RAGFlow 服务端添加 --enable-mcp-server 参数，暴露标准接口。
定义能力清单：在 /mcp/capabilities 端点声明支持的操作（如 semantic_search、document_rerank），供客户端调用时动态发现。
三、核心技巧：释放分布式知识网络价值
（一）跨系统知识共享的实践路径
关键在于利用 MCP 的上下文传递机制实现无缝协作。例如与毕昇系统集成时：
双向同步：RAGFlow 通过 MCP Client 从毕昇拉取实时业务数据，同时将优化后的知识索引以 MCP 协议推回毕昇库，避免数据孤岛。
智能路由：基于查询类型动态选择数据源。技术文档请求优先调用 RAGFlow 本地库，而市场动态类查询则通过 MCP 转发至毕昇的实时数据库。
（二）RAGFlow 作为 MCP Server 的服务化设计
部署时需注重性能与安全平衡：
分层服务架构：将高频访问的通用知识（如产品手册）部署为公共 MCP Server，敏感数据（如客户记录）通过私有 MCP Server 隔离，采用 Token 鉴权控制访问。
异步任务处理：对于大规模文档注入操作，通过 MCP 的 async_task 接口提交任务，RAGFlow 后台完成索引更新后回调通知，避免阻塞客户端。
结语
RAGFlow 与 MCP 的集成不仅是技术栈的融合，更是知识管理范式的革新。通过 MCP 的标准化协作能力，RAGFlow 突破了单点系统的限制，成为分布式知识网络的核心节点。未来随着 MCP 生态的持续扩展（如新增 Integration 功能），基于 RAGFlow 的智能中枢将更高效地连接企业内外部知识资产，真正实现“无处不在的智能检索与生成”。

RAGFlow Agent 开发：从单 Agent 到 Multi-Agent 协同

作者: ccds
时间: 2025-05-09
分类: 默认分类
评论

RAGFlow 的此次更新，真正将其从一款强大的检索增强生成工具，进化为了一个能够自主理解、规划并执行复杂任务的智能体（Agent）开发平台。特别是从 0.20.0 版本开始，其全新的 Agent 架构引入了规划与反思、视觉支持等核心能力，并支持构建多智能体（Multi-Agent）团队，极大地拓展了 RAG 应用的边界。本文将带您探索如何利用这些新特性，从创建一个单 Agent 到 orchestrating 一个高效协同的 Multi-Agent 团队。

一、核心内容：新版 Agent 架构的革命性特性

1. 架构新特性：规划、反思与视觉

RAGFlow 0.20.0 的 Agent 架构不再是简单的“提问-检索-回答”管道，而是具备了接近自主智能的关键能力：

规划（Planning）：Agent 能够根据用户的目标，自主制定分步执行计划。例如，当用户提出“分析一下公司今年Q2的销售情况并与Q1做对比”时，Agent 不会盲目搜索，而是先规划出步骤：1. 查找Q2销售报告；2. 提取关键数据；3. 查找Q1销售报告；4. 进行数据对比；5. 生成分析结论。这种“先思考后行动”的模式大幅提升了复杂任务的成功率。
反思（Reflection）：这是“规划”的完美搭档。当 Agent 执行某一步骤失败或得到的结果不理想时，它具备“反思”能力，能够分析错误原因，并调整策略或重试。例如，如果第一次搜索“Q2销售报告”没有找到正确文件，它会反思关键词，尝试换用“第二季度财报”、“2024年4-6月销售”等术语再次检索，直到成功。
视觉支持（Vision）：新版 Agent 集成了多模态模型，使其具备看懂图片的能力。这意味着它可以分析上传的图表、示意图、产品海报甚至界面截图。你可以直接问：“这张图表反映了什么趋势？” 或 “根据这个产品架构图，给我解释一下各个组件的作用。” 这项能力将知识库的范围从纯文本扩展到了丰富的视觉世界。

2. 创建 Deep Research 架构的 Multi-Agent 团队

单兵作战能力再强，也有其极限。对于极其复杂的任务，最好的方式是组建一个专家团队。RAGFlow 允许你创建多个 Agent，并为它们分配不同角色，让其协同完成一项任务。我们以构建一个“深度研究（Deep Research）”团队为例：

“调度者” Agent (Manager)：这是团队的核心，负责与用户沟通，理解最终目标（例如：“为我提供一份关于‘固态电池’最新技术突破的详细报告，包括主要厂商和面临的挑战”），并进行顶层任务规划和分解。
“信息搜集员” Agent (Researcher)：负责执行调度者下发的子任务。它利用强大的检索能力，在知识库和互联网（如果配置了）中爬梳相关信息，并汇总初步找到的资料和数据。
“分析师” Agent (Analyst)：接收研究员搜集到的信息，负责进行数据的清洗、对比、归纳和总结。它需要辨别信息的重要性、真伪性和关联性。
“撰稿人” Agent (Writer)：根据分析师提供的结构化结论，负责撰写符合用户要求格式的最终报告，保证内容的流畅、准确和条理清晰。

在 RAGFlow 中，你可以通过工作流的方式，将这些各司其职的 Agent 连接起来，让信息、指令和结果在它们之间有序流动，最终整合成一个完美的成果。

二、技巧点：释放 Agent 的全部潜能

1. 使用 Code 组件运行 Python/JavaScript 脚本

这是 RAGFlow Agent 最强大的技巧之一。单纯的文本生成和检索有时无法解决所有问题，而 Code 组件赋予了 Agent 执行代码的能力，从而可以处理数学计算、数据分析和外部API调用等任务。

场景示例：
- 数据处理：当检索到一份包含销售数据的 CSV 文件时，Agent 可以自动调用一个 Python 脚本（使用 pandas 库）来读取文件、计算同比增长率、并生成一个可视化图表，然后将图表和结论一并返回给用户。
- 调用外部服务：用户问：“北京的天气怎么样？” Agent 可以规划出一个步骤，先调用一个 JavaScript 脚本，通过调用天气 API 获取实时数据，再将数据结果填入提示词中，生成一个友好的天气回复。
价值：这几乎无限扩展了 Agent 的能力边界，使其从一个“知识工作者”变成了一个“工具使用者”。

2. Human-in-the-loop 流程设计（用户干预节点）

完全自主的 Agent 虽然强大，但在高风险或需要主观判断的场景下，让其完全“自动驾驶”是危险的。RAGFlow 支持在 Agent 工作流中插入人工审核节点。

如何运作：你可以配置在工作流的特定阶段（例如，在“撰稿人”Agent 发布最终报告之前），流程自动暂停，并将当前结果发送给指定的人工审核者。审核者可以选择“批准”、“拒绝”或“修改后批准”。
应用场景：
- 内容安全：确保所有对外发布的内容都经过人工审核，符合规范。
- 质量控制：在关键决策点（如采购建议、投资分析结论）引入专家判断，避免AI幻觉带来的风险。
- 流程优化：人类可以发现Agent工作流中的不足，并对其进行实时调整。
价值：实现了人工智能与人类智慧的完美结合，既利用了AI的效率，又保留了人类的控制和判断，让整个系统更加可靠和可信。

结语

RAGFlow 的新版 Agent 架构，特别是 Multi-Agent 协同和 Code 执行能力，标志着其正从一个“问答系统”向一个“自主智能体生态”演进。通过精心设计单个 Agent 的角色，并将它们组织成高效的团队，再辅以人类智慧的监督，你将能够构建出前所未有强大的AI应用，从容应对各种复杂、多步骤的实时任务，真正释放出人工智能的巨大潜力。

RAGFlow 企业级部署：沙盒模式与 Helm Chart 实践

一、沙盒模式下的 Docker-Compose 启动

二、Helm Chart 资源策略调整（Keep 策略）

三、企业级运维技巧实践

（一）MCP 服务器健康检查配置

（二）OpenDAL 存储引擎切换至 MySQL 后端

RAGFlow 安全增强：保护企业敏感数据的关键措施

一、核心内容：构建企业级安全基石

1. JWT 秘钥防护与 OAuth 2.1 CSRF 防护

2. 多租户知识库隔离与 API 密钥轮换

二、技巧点：高级安全配置

1. 文件名 SSTI 防护配置

2. 使用 JWKS URI 动态获取令牌

结语

RAGFlow 图像直显功能：让多模态检索更直观

1. 图像直显功能的核心价值

1.1 技术背景

2. 图片在 Chat/Search 模块中的直接渲染

2.1 功能实现

2.1.1 图像上传与解析

2.1.2 Chat 模块中的图像直显

2.1.3 Search 模块中的图像检索

3. 技术文档与产品截图的检索案例

3.1 技术文档场景

案例背景

解决方案

3.2 产品截图场景

案例背景

解决方案

效果提升

4. 技巧点详解：社区贡献功能与联动策略

4.1 Markdown 图片渲染后分块显示

4.1.1 社区贡献功能

4.1.2 实践建议

4.2 图像检索与文本检索的联动策略

4.2.1 多模态检索流程

4.2.2 技术实现

5. 应用场景与未来展望

5.1 典型应用场景

5.2 未来发展方向

RAGFlow 与 MCP 集成：构建分布式知识管理网络

一、MCP 功能详解：分布式协作的基石

二、集成配置步骤：从连接到服务化

（一）导入 MCP Server 与 Agent 配置

（二）服务化部署 RAGFlow 作为 MCP Server

三、核心技巧：释放分布式知识网络价值

（一）跨系统知识共享的实践路径

（二）RAGFlow 作为 MCP Server 的服务化设计

结语

RAGFlow Agent 开发：从单 Agent 到 Multi-Agent 协同

一、核心内容：新版 Agent 架构的革命性特性

1. 架构新特性：规划、反思与视觉

2. 创建 Deep Research 架构的 Multi-Agent 团队

二、技巧点：释放 Agent 的全部潜能

1. 使用 Code 组件运行 Python/JavaScript 脚本

2. Human-in-the-loop 流程设计（用户干预节点）

结语

最新文章

最近回复

分类

归档

其它