这个技术让 AI 秒变行业专家!10 分钟吃透 RAG 核心逻辑

2026-04-11
这个技术让 AI 秒变行业专家!10 分钟吃透 RAG 核心逻辑 关注 新手上路 关注 新手上路 关注 新手上路 关注 新手上路 2025/05/29 08:27

前面我们介绍了如何使用 dify 快速开发 AI 模型应用。在开发 AI 模型应用的过程中还有一个非常重要的技术——RAG。下面我们详细讲解一下。

  爱壹帆电影yfsp.app jogodotigrinhodemo a5game.app

什么是 RAG?

  slotpix a5game.app

RAG 即检索增强生成(Retrieval-Augmented Generation),是一种结合检索和生成技术框架。

 

它在处理用户查询时,先从外部知识库中检索相关信息,再利用这些信息指导语言模型生成文本,以提高生成内容的质量和准确性。

  一帆视频yfsp.app

可以分为三部分来理解。检索向量数据库中的内容,增强提示词模板内容,然后让大语言模型来生成更加满足要求的回答。 pragmaticplay a5game.app JogodoTigrinho a5game.app

 

为什么要使用 RAG

 

大模型在被训练时,基于一些通用的知识来训练的,并不具备特定行业、特定领域的知识。这使得我们在向 AI 提问一些特定领域的内容时,他只会给我们回复一些很空泛的回答。 海外华人视频网xiaobaotv.video

  fortuneoxdemográtis a5game.app

那么如何解决这个问题呢?第一种解决方法就是今天提到的 RAG,另一种方法是微调,我们之后再讲。RAG 的难度复杂度相对于微调更低一些,更多的是让大模型能基于外部提供的知识库来回答。

 

RAG 的原理

 

Image

  小宝影院电影xiaobaotv.video

RAG 是基于外部知识库来进行回答,知识库中可以包含像 word、pdf、PPT、Excel、网页等信息。有了这新信息后,需要对这些信息进行分块、向量化。 pgslot a5game.app 爱一番yfsp.app

 

分块是把文本分成更小、更易管理文本块,可以提高检索效率。

  xiaobao xiaobaotv.video

向量化可以把非结构化的文本转为数值向量,方便计算机高效理解与处理。这些向量在高维空间中表示文本的语义信息,语义相近的文本在空间向量中距离更近。 电影爱壹帆yfsp.app

  tigrinho gratis a5game.app

之后再提问的时候,会从向量数据库中进行检索,检索出和问题相近的内容,然后作为上下文,添加到提示词模板中。 pgslotgacor a5game.app 足球比分 a5game.app 爱壹帆影视yfsp.app sugarrush1000demo a5game.app

 

然后一起发送给大语言模型,它就会针对提示词提供的内容,进行更加准确的回答。 Caça-níqueis a5game.app demotigrinho a5game.app 小寶影院xiaobaotv.video

 

RAG 在 dify 中的应用

  fortunetigerbônusgrátissemdepósito a5game.app fortunedragon demo a5game.app

文档、图像等非结构化数据如何实习向量化呢?向量化需要通过嵌入模型来实现。所以我们需要安装一下 ollama 提供的 bge-m3 这个嵌入模型。 fortunetigerdemográtis a5game.app demo a5game.app

  爱壹帆免费版yfsp.app

安装命令:

 

ollama pull bge-m3

  slotdemo a5game.app

查看是否安装成功:

  小宝影院xiaobaotv.video

ollama list

  fortuneoxdemográtis a5game.app 小寶影院电影xiaobaotv.video

Image

  sweetbonanza1000demo a5game.app pragmatic a5game.app

下载好后之后在 dify 的模型供应商中添加一下该模型,用于后续的向量化数据处理。

  ifun yfsp.app

Image

  pg a5game.app pg a5game.app

添加好之后,可以在「系统模型设置」中指定一下我们添加的这个 bge-m3 模型。

  爱壹帆电影 yfsp.app

Image

  爱一帆 yfsp.app 小宝影院在线视频xiaobaotv.video demo a5game.app

dify 自带知识库,接下来在知识库中加入我们本地的文档。

  爱壹帆在线yfsp.app

Image

  Cassinos a5game.app ifuntvyfsp.app slots a5game.app

导入后,设置一下分段最大长度、分段重叠长度。 jogosdemopg a5game.app

 

分段最大长度(chunk_size):一个分段包含多少个字,比如 100 个字、1000 个字作为一个分段。

分段重叠长度(chunk_overlap):相邻分段之间重复的字数,用于保留上下文连贯性。

 

举个🌰:分段最大长度是 100 字,分段重叠长度是 10 个字。那么第一个分段是 1-100 字,第二个分段是 91-190。这样一方面可以防止关键概念断裂,另一方面重叠部分可以帮助算法理解前后段落的逻辑关系。

 

在设置分段时,一般来说小一些好,但太小了的话处理起来比较慢,而且会缺失上下文信息。 小宝影院电影xiaobaotv.video

  nba比分 a5game.app

分段后点保存 ——> 然后就进入到分快、向量化这个处理过程了 pgdemo a5game.app

  pglucky88 a5game.app

Image

  爱壹帆yfsp.app

向量化后数据被保存到向量数据库中。dify 为我们提供了向量数据库,可以直接在 docker 里查看。当然,dify 也可以对接外部的向量数据库。 plataformademo a5game.app

  爱壹帆国际版 yfsp.app 爱壹帆寻秦记yfsp.app

接下来我们创建一个聊天助手应用,然后把刚才创建好的知识库添加进来。 slot a5game.app iyf yfsp.app

  slotsdemo a5game.app 一帆yfsp.app

Image

  a5game a5game.app

通过提问,我们发现现在它是结合文档内容后回答的,大功告成!!! tigrinhodemo a5game.app iyifanyfsp.app ifvodyfsp.app

  plataformademográtis a5game.app 爱亦凡yfsp.app

Image

  电影小宝影院xiaobaotv.video 免费在线影院xiaobaotv.video

以上就是本次分享的 RAG 理论与实践。如果有收获的话,不妨点一个免费的小赞鼓励一下。如果在理解和应用中遇到问题,也欢迎一起交流学习呀!!! iyftvyfsp.app



  aiyifan yfsp.app 华人影视xiaobaotv.video 寻秦记爱壹帆yfsp.app

00目录 0
    讨论 我来说一句 发布发表评论 发布0等 0 人为本文章充电 还没有介绍自己 关注