# boost **Repository Path**: uyeonashi/boost ## Basic Information - **Project Name**: boost - **Description**: boost搜索引擎项目的开发学习! - **Primary Language**: C++ - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-24 - **Last Updated**: 2026-01-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # boost #### 介绍 boost搜索引擎项目的开发学习! #### 说明 Boost搜索引擎是一个基于 Boost 文档的站内搜索引擎,用户可以根据浏览器访问该搜索引擎,当用户通过页面的搜索框输入查询关键字后,就能快速的快速的查询出相关的Boost在线文档。 该项目的实现主要包含五个模块: - 数据清洗模块:对 Boost 离线文档进行数据清洗,包括提取网页标题title、获取网页内容content、构建官方文档URL等,最后将清洗出来的数据保存到一个文件中。 - 索引建立模块:根据清洗出来的数据构建正排索引和倒排索引。 - 搜索引擎模块:获取索引,根据提供的搜索关键字进行搜索,最后将搜索结果按照权值进行排序并返回。 - Web模块: 基于cpp-httplib, 搭建HTTP服务器, 提供HTTP接口, 编写前端页面 - 前端界面模块:为用户提供搜索框的展示页面,然后将搜索结果展示给用户。 项目解析:https://blog.csdn.net/uyeonashi/article/details/147491671?spm=1001.2014.3001.5502