从0到1构建一个RAG检索增强系统

智能计算芯世界 2024-11-04 07:56

【北京12.5号】无线前沿新技术与测试技术峰会 【有奖直播】无线前沿新技术与测试技术峰会

RAG（Retrieve Augment Generation，检索增强）是“驯服”大语言模型的主要手段之一。它允许大语言模型在从固定的数据库中抽取相关内容的基础上生成答案，从而限制随意发挥，提升答案的可靠性。

知识全解系列

存储系统基础知识全解（PDF）

存储系统基础知识全解（PPT版）

服务器基础知识全解(终极版)

SSD闪存技术基础知识全解（PPT终极版）

SSD闪存技术基础知识全解（PDF终极版）

800+份重磅ChatGPT专业报告

（持续更新中...）

核心组件：

RAG(检索增强生成)系统的核心组件主要包括以下三个部分:

检索(Retrieval)组件:负责从外部数据源或知识库中获取与用户查询相关的信息。包括对输入查询的理解和解析,以及使用索引和检索算法从文本数据中提取相关内容。检索的质量和效率直接影响生成文本的准确性和相关性。
增强(Augmentation)组件:处理检索到的信息,将其与原始查询结合,形成丰富的上下文。可能涉及数据清洗、分块和使用嵌入模型等优化技术。目的是为生成模型提供更全面、准确的信息基础。
生成(Generation)组件:通常是一个大型语言模型(LLM)。利用检索和增强阶段提供的信息作为上下文。生成符合用户需求的自然语言文本或回答。

检索组件首先从知识库中获取相关信息。增强组件处理和整合这些信息。生成组件最后利用这些增强的信息来生成最终的输出。

RAG系统的优势在于它结合了信息检索的准确性和自然语言生成的灵活性,能够提供更准确、相关和知情的回答,特别是在处理需要最新或专门知识的查询时。

构建过程：

文档处理

开发RAG系统的第一步是准备文档，这些文档将作为RAG系统的基础输入数据。

文本提取

接下来，使用 OCR（光学字符识别）模型处理文档。如果需要，该模型可以从图像中提取文本。

文本分块

将提取的文本分解为更小、更易管理的部分。这种分块处理有助于提高后续处理和分析的效率。

嵌入模型（文本嵌入）

然后每个文本块都会通过嵌入模型。该模型将块转换为向量，即捕获文本语义的数字表示。

向量存储

将生成的向量存储在一个向量数据库中。上一步将文本转换为向量数据库需要存储到向量数据库中（例如PgVector），该数据库允许系统根据语义相似性有效地检索相关信息。

用户输入问题并检索

用户向系统输入问题，该问题将用于从矢量数据库中检索最相关的信息（其实就是从向量库中匹配相似的数据）。

问题嵌入

接下来需要将用户输入的问题转换成相同的向量纬度，只有转换成和文档相同的向量纬度，确保了问题和文本块都位于同一向量空间中，才能从向量数据库中匹配到相似的数据。

向量匹配

系统根据相似性将嵌入的问题与数据库中的向量进行匹配，并检索出最相似的文本块。同上，将嵌入后的问题在向量存储库中检索匹配相似的数据。

信息处理

系统根据相似度得分检索最相关的文档。然后，LLM（大语言模型）处理这些相关信息，从向量库中匹配到相似的数据后，系统将交由LLM 处理相关信息以对用户的问题制定详细的答案。

最终答案（数据呈现）

最终，LLM将针对用户的问题，并结合向量库中匹配到的相似的数据分析，输出最终的语义化文本内容给用户

优势与挑战

优势

提高准确性：通过结合外部知识库的信息，RAG能够提供更准确和相关的答案。
增强可解释性：由于生成答案时参考了具体的上下文信息，因此答案的可解释性也得到了提升。
解决知识局限性：RAG弥补了大语言模型在专业领域知识理解和最新知识掌握方面的不足。

挑战

计算资源需求高：大规模的知识库检索和信息整合需要大量的计算资源。
实时性问题：对于需要快速响应的应用场景，RAG可能面临延迟的问题。

总之，RAG技术通过结合检索和生成两大关键技术，为自然语言处理领域带来了革命性的进步，并在多个应用场景中展现了卓越的潜力。随着技术的不断发展，RAG有望在未来发挥更大的作用。

下载链接：

800+份重磅ChatGPT专业报告

半导体行业研究框架专题报告（2024）

沙利文：2024年中国生成式AI行业最佳应用实践

AI市场趋势洞察（2024年）

AR洞察与应用实践白皮书

《2024 OCP全球峰会合集（Chiplets篇）》

《2024 OCP全球峰会合集（Server篇）》

《2024 OCP全球峰会合集（Security篇）》

《2024 OCP全球峰会合集（Composable Memory Systems篇）》

《2024 OCP全球峰会合集（HPC/NIC/OAI篇）》

《2024 OCP全球峰会合集（MHS篇）》

智能化软件开发落地实践指南报告（2024年）

《2024全球人工智能开发与应用大会》

《2024 ODCC大会技术研究合集》

《2024全球人工智能开发与应用大会（下）》

《2024全球人工智能开发与应用大会（上）》

大规模智算集群的管理与性能调优实践

计算机自主可控系列：国产AI算力万卡集群，多芯混合时代来临

2024年AI原生路由器白皮书

端侧AI行业：引领边缘智能革命，激发数据潜能

2024全球AI芯片研究报告

大模型时代的AI能力工程化

大模型时代的工业质检方法论

大模型时代数据库技术创新

大模型在融合通信中的应用实践

《大模型实践案例合集集》

1、2024大模型典型示范应用案例集 2、2023大模型落地应用案例集

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

进入专栏

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

文章：1523篇粉丝：197人

 私信

从0到1构建一个RAG检索增强系统

核心组件：

构建过程：

文档处理

文本提取

文本分块

嵌入模型（文本嵌入）

向量存储

用户输入问题并检索

问题嵌入

向量匹配

信息处理

最终答案（数据呈现）

优势与挑战

优势

挑战

最近文章

热门文章

推荐

最新资讯