Rag 系统架构 | AI Time

Rag 系统架构

LangChain
LLM - GPT 4o
Embeddeds 模型：将文本转换为向量
向量数据库
数据处理：加载、分割、向量化

检索架构先检索、后推理

检索要求

提高召回率
减少无关信息，准确率要高
速度快

二级索引

一级索引：关键信息
二级索引：原始文本

切分关键信息抽取 chunk_size 切分，不能满足复杂的业务场景；chunk_overloap 重叠区域

切分

基于 NLP 篇章分析工具，识别段落的主从关系
Bert、NSP 训练任务，基于阈值 t

keyLLM

keyBert 基于关键字匹配训练模型，存储的是向量数据库，向量检索
ElasticSearch 基于关键字检索，存储的是JSON，字符串检索

参考 #

KeyBERT Minimal keyword extraction with BERT