# 图像RAG **Repository Path**: xuelanghanbao/image-rag ## Basic Information - **Project Name**: 图像RAG - **Description**: 还在为找不到合适的表情包或MEME图而苦恼吗?来试试图像RAG吧。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-09 - **Last Updated**: 2025-06-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 12MEME_RAG 项目说明 ## 项目简介 本项目用于基于图像和文本的特征提取与检索,支持中文CLIP模型,包含图片数据库(imgdb)的构建与管理。 ## 预训练模型 目前仅支持clip_cn_rn50模型,需将预训练权重文件放置于`data/pretrained_weights/clip_cn_rn50.pt`路径下。详细情况及模型下载方式请参考[Chinese-CLIP官方仓库](https://github.com/OFA-Sys/Chinese-CLIP/tree/master)。 ## 数据集路径格式 - 图片数据集默认路径为:`data/imgs/raw/`,其中存放所有原始图片。 - 特征提取与数据库相关文件默认存放于:`data/imgs/` 目录下。 ## imgdb生成的文件路径说明 - `data/imgs/raw/`:原始图片文件夹。 - `data/imgs/eval_imgs.tsv`:图片ID与图片base64编码的TSV文件。 - `data/imgs/eval_imgs.dict`:图片ID到图片路径的映射字典(JSON格式)。 - `data/imgs/eval_imgs.img_feat.jsonl`:图片特征文件(由CLIP特征提取生成)。 - `data/imgs/tsv.hash`:TSV文件的哈希值校验文件。 - `data/imgs/lmdb/eval/imgs`:图片的LMDB数据库。 - `data/imgs/lmdb/eval/pairs`:图片-文本对的LMDB数据库(如有文本对时)。 ## 主要流程 1. 将图片放入`data/imgs/raw/`目录。 2. 初始化imgdb,会自动生成上述文件。 3. 使用CLIP模型进行特征提取,生成`eval_imgs.img_feat.jsonl`。