第二支羽毛

利用Transformer、DPR、FAISS和BART对检索增强生成（RAG）进行深入技术探索

利用Transformer、DPR、FAISS和BART对检索增强生成（RAG）进行深入技术探索 |文末点击阅读原文查看网页版| 更多专栏文章点击查看： LLM 架构专栏

RAG

1W2000字一文读懂向量数据库：原理、索引技术与选型指南

本文1W2000字，本文简要介绍了向量数据库，重点阐述了其在检索增强生成（RAG）应用中的关键作用。文章突出了ChromaDB、Pinecone和Weaviate等热门数据库，强调了高效存储和检索对优化 RAG 性能的重要性。文中深入探讨了各种索引技术和算法，对Annoy、倒排文件（IVF）索引、

RAG

1W8000字探秘 RAG 应用搜索：从语义搜索到评估指标的深度解析

本文1W8000字，在这篇文章中，我们探讨了检索增强生成（RAG）应用程序中的搜索过程，重点介绍了使用向量数据库的语义搜索。我们强调了其减少处理时间和支持实时更新等优势，同时也指出了面临的挑战，比如对独特查询可能给出不太理想的回复。预防这些问题的策略包括监控查询密度和收集用户反馈。优化工作应贯穿构建

RAG

2W8000字揭秘RAG：从基础到高级的逆袭，彻底重塑大模型！

2W8000字揭秘RAG：从基础到高级的逆袭，彻底重塑大模型！ 🕙发布时间：2025-02-24 本文2W8000字，配图58张，分了11个小节介绍RAG技术，后续会把最新的方法更新进来~，有些内容是翻译自HuggingFace和一些论文，更多LLM架构文章：

RAG

缓存增强生成（CAG）对比检索增强生成（RAG）：谁才是大语言模型的最优解？

缓存增强生成（CAG）对比检索增强生成（RAG）：谁才是大语言模型的最优解？ 1. 前期准备：RAG与KV-Cache（CAG） RAG 是什么 RAG是一种检索增强生成方法，它利用检索器查找相关文档，然后将这些文档传递给大语言模型，以生成最终答案。优势处理大型或频繁更新的数据集时，无需一次性加

RAG

典型的RAG流程、每个模块的最佳实践和综合评估

典型的RAG流程、每个模块的最佳实践和综合评估近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏

RAG

用DeepSeek R1和Ollama构建本地RAG系统，向PDF提问不再是梦！

用DeepSeek R1和Ollama构建本地RAG系统，向PDF提问不再是梦！有没有想过能直接向PDF文件或者技术手册提问？如何利用开源推理工具DeepSeek R1和运行本地AI模型的轻量级框架Ollama，搭建一个检索增强生成（RAG）系统。为什么选DeepSeek R1？ DeepSee

RAG

DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建

DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建 DeepSeek R1学习方法概述 DeepSeek R1的特点在于使用强化学习（RL）进行后期训练。一般来说，大规模语言模型的开发要经过以下几个步骤：预训练：利用大规模语料库创建一个 “预测下一个单词” 的模型。监督微调（SFT

RAG

向量相似性搜索与图数据库：数据处理的创新融合

向量相似性搜索与图数据库：数据处理的创新融合近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏

RAG

置顶 深度解析创新RAG：PIKE-RAG与DeepRAG，RAG技术的创新变革

置顶
深度解析创新RAG：PIKE-RAG与DeepRAG，RAG技术的创新变革