# SearchEngine **Repository Path**: daddybod/SearchEngine ## Basic Information - **Project Name**: SearchEngine - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-02-01 - **Last Updated**: 2025-02-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 搜索引擎技术 1. **搜索引擎基础** * 搜索引擎的基本概念 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_01.pdf)] [[YouTube](https://youtu.be/ddi6_rGEIdk)] [[Bilibili](https://www.bilibili.com/video/BV1Wr421b7uP/)] * 什么决定用户满意度? [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_02.pdf)] [[YouTube](https://youtu.be/MjdAP_bqMFk)] [[Bilibili](https://www.bilibili.com/video/BV1Lm421J7Xz/)] * 搜索引擎的评价指标 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_03.pdf)] [[YouTube](https://youtu.be/_1_-dvNAMlo)] [[Bilibili](https://www.bilibili.com/video/BV1BT421m7UQ/)] * 搜索引擎的链路 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_04.pdf)] [[YouTube](https://youtu.be/V1BrdtN2d30)] [[Bilibili](https://www.bilibili.com/video/BV1UM4m1D7L3/)] 2. **相关性** * 相关性的定义与分档 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/02_Rel_01.pdf)] * 相关性的评价指标 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/02_Rel_02.pdf)] * 文本匹配分数 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/02_Rel_03.pdf)] * 相关性BERT模型及其推理 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/02_Rel_04.pdf)] * 相关性BERT模型的训练 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/02_Rel_05.pdf)] 3. **查询词处理** * 分词:基于字典匹配的方法 & 新词发现 * 分词:基于深度学习的方法 * 词权重 (Term Weight) * 类目识别 * 意图识别 * 查询词改写 4. **召回** * 倒排索引和文本召回 * 向量召回 * 缓存召回 5. **排序** * 排序的原理 * 融合模型的训练方法 6. **查询词推荐** * 查询词推荐的场景 * 查询词推荐的召回 * 查询词推荐的排序