AI 中的 RAG 是什么?
检索增强2026-05-26AI 小集
221
RAG 是 retrieval augmented generation,即检索增强生成。简单说,就是先检索相关信息,把它放进模型上下文,再让模型基于这些材料生成答案。
典型 RAG 系统会导入文档、切分片段、生成嵌入、存入向量库、检索相关片段,再把筛选出的上下文和用户问题一起交给模型。
当知识经常变化、回答需要引用,或企业希望 AI 助手使用私有文档而不重新训练模型时,RAG 很有用。
RAG 并不能自动保证真实。切分不佳、文档过期、排序弱或缺少来源元数据,仍然可能产生自信但不完整的答案。
如果问题是缺少知识、事实变化或需要来源支撑,优先考虑 RAG;如果问题是风格、格式或重复任务行为,再考虑微调。