基于 Jetson 和 LlamaIndex 的本地 RAG
介绍
如今,越来越多的人开始使用大型语言模型来解决日常问题。然而,大型语言模型在回答某些问题时可能会出现幻觉,向用户提供错误信息。不过,RAG 技术可以通过向大型语言模型提供相关数据来减少幻觉的发生。因此,使用 RAG 技术来减少大型语言模型中幻觉的产生已成为一种趋势。
在这里我们向您介绍基于 Jetson 的 RAG,它使用 LlamaIndex 作为 RAG 框架,ChromaDB 作为向量数据库,以及量化的 Llama2-7b 模型 LLM MLC 作为问答模型。通过这个本地 RAG 项目,它可以保护您的数据隐私并为您提供低延迟的通信体验。
硬件组件
reComputer(基于 RAM >= 16GB 的 Jetson) |
---|
![]() |
准备运行环境
步骤 1:安装 MLC Jetson 容器
# 安装 jetson-container 及其依赖项
git clone --depth=1 https://github.com/dusty-nv/jetson-containers
cd jetson-containers
pip install -r requirements.txt
步骤 2:安装项目
# 安装 RAG 项目
cd data
git clone https://github.com/Seeed-Projects/RAG_based_on_Jetson.git
步骤 3:安装由 MLC LLM 量化的 Llama2-7b 模型
# 安装 LLM 模型
sudo apt-get install git-lfs
cd RAG_based_on_Jetson
git clone https://huggingface.co/JiahaoLi/llama2-7b-MLC-q4f16-jetson-containers
步骤 4:运行 docker 并安装依赖项
cd ../../
./run.sh $(./autotag mlc)
# 这里您将进入 Docker,下面的命令将在 Docker 内运行
cd data/RAG_based_on_Jetson/
pip install -r requirements.txt
pip install chromadb==0.3.29
运行 pip install chromadb==0.3.29
后,您将看到如下所示的界面。
note
忽略错误是没有问题的。
让我们运行它
# 在 docker 中运行
python3 RAG.py
项目展望
在这个项目中,TXT 和 PDF 文档被解析为向量数据库,并使用 RAG 技术来减少模型对特定问题的幻觉。未来,我们将使用多模态模型来支持图像和视频的检索。