RAGflow 能力拆解

用户4389

用户4392

用户3862

2025年11月26日修改

❤️

原创: Stuart

支持的embedding模型

🌟

RAGflow支持配置上LLM, embedding, STT, img2text, 和内容审核Moderation模型. 配置方式大同小异.​

公网MaaS

•
通常只需要一个API key即可对接, 默认提供了通义千问.  比较特殊的是OpenAI的接口上提供了修改endpoint, 也就是支持中间商. (下图中Ollma之外的都是公网模型)​

实际上RAGflow悄悄的对接了更多公网模型, 在创建数据集时能看到: ​

50%

实际测试选择这些模型后, RAGflow会尝试从huggingface下载对应的模型.​

本地部署

目前仅支持Xinference和Ollama方式部署. 但是实际上只要是API接口一致, 对接方式一致都可以用该方式对接. 此处基础Url只需要写到v1为止, 不需要写embeddings的二级接口.​

PS: 添加模型后需要在“系统模型配置”中设置, 方能让模型生效.​

文档拆分方式

🥛

RAGflow的思路是面向应用场景提供适配性的文档拆分. 当遇到不在列表中的情况时, 选择通用, 或者类似的场景来使用.​

1.
General 通用​

在通用模式下, 主要拆分参考是每个块的token数量. 实测中, 它还考虑了语意的完整性, 切分段落的点都在句号或者叹号这种完整句子结束处. ​

代码块

"General" 分块方法说明​
​
支持的文件格式为DOCX、EXCEL、PPT、IMAGE、PDF、TXT。​
此方法将简单的方法应用于块文件：​
​
系统将使用视觉检测模型将连续文本分割成多个片段。​
接下来，这些连续的片段被合并成Token数不超过“Token数”的块。​
​

结论: 拆分结果和langchain的拆分大同小异, 没有做其他任何处理和修改.​

RAGflow 能力拆解​