# SearchEngine **Repository Path**: sometao/SearchEngine ## Basic Information - **Project Name**: SearchEngine - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-03-21 - **Last Updated**: 2024-04-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 搜索引擎技术 1. **搜索引擎基础** * 搜索引擎的基本概念 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_01.pdf)] * 什么决定用户满意度? [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_02.pdf)] * 搜索引擎的评价指标 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_03.pdf)] * 搜索引擎的链路 [[slides](https://github.com/wangshusen/SearchEngine/blob/main/Slides/01_Basics_04.pdf)] 2. **相关性** * 相关性的定义与分档 * 文本匹配分数 * 相关性BERT模型 * 相关性BERT模型的训练 3. **其他决定用户满意度的因子** * 内容质量 * 时效性 * 地域性 * 个性化 4. **查询词处理** * 分词:基于字典匹配的方法 & 新词发现 * 分词:基于深度学习的方法 * 词权重 (Term Weight) * 类目识别 * 意图识别 * 查询词改写 5. **召回** * 倒排索引和文本召回 * 向量召回 * 缓存召回 6. **排序** * 排序的原理 * 融合模型的训练方法 7. **查询词推荐** * 查询词推荐的场景 * 查询词推荐的召回 * 查询词推荐的排序