# translator_qt **Repository Path**: r1Way/translator_qt ## Basic Information - **Project Name**: translator_qt - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-08 - **Last Updated**: 2026-03-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
基于llama.cpp的英译汉翻译工具,支持文本输入翻译和屏幕截图OCR翻译功能
## 项目结构 - `llama/` - 包含llama.cpp的库文件(.dll, .lib)以及头文件 - 版本:llama.cpp git 哈希版本 9e10bd2ea - `tessdata/` - 包含Tesseract OCR所需的数据文件 - 包含:chi_sim.traineddata(中文)、eng.traineddata(英文) - `resource_icon/` - 应用程序图标资源 - 包含:logo.png(应用程序图标,由豆包生成)、nail.svg(置顶图标,由阿里云图标提供) - 源代码文件: - `widget.cpp` - 主界面和核心功能实现 - `configmanager.cpp` - 配置管理 - `screencapture.cpp` - 屏幕截图功能 - `settingsdialog.cpp` - 设置对话框 ## 技术栈 - **编译工具链**:MSVC(用于 x86 的 Microsoft (R) C/C++ 优化编译器 19.44.35207.1 版,对应Visual Studio 2022 17.4版本) - **操作系统**:Windows 11 - **C++库管理**:vcpkg - **OCR引擎**:Tesseract - **AI模型**:腾讯Tencent-HY-MT1.5(具体为HY-MT1.5-1.8B-Q8_0.gguf,模型文件大小约2G) - 模型地址:[https://huggingface.co/tencent/HY-MT1.5-1.8B-GGUF](https://huggingface.co/tencent/HY-MT1.5-1.8B-GGUF) - 理论上也可以使用7B版本 ## 功能特性 1. **文本翻译**:输入英文文本,获得中文翻译 2. **实时翻译**:输入停止后自动触发翻译 3. **屏幕截图OCR**:截取屏幕区域,自动识别文本并翻译 4. **全局热键**:支持设置全局热键快速启动OCR功能 5. **窗口置顶**:可将窗口置顶显示 6. **配置管理**:支持自定义模型路径、热键等设置 ## 系统要求 - **内存**:至少8GB内存(CPU推理) ## 推理性能 以我的某次测试为例,使用CPU推理的性能参考: ### 首次推理 - 首字时间 (First Token Time): 3999.03 ms - 生成 Token 总数: 29 - 平均吞吐量 (Throughput): 13.9494 tokens/sec - 每个 Token 平均耗时: 69.2159 ms ### 后续推理 - 首字时间 (First Token Time): 1233.4 ms - 生成 Token 总数: 37 - 平均吞吐量 (Throughput): 19.1257 tokens/sec - 每个 Token 平均耗时: 50.8727 ms ## 快速开始 1. 确保已安装Visual Studio 2022 17.4或更高版本 2. 使用vcpkg安装必要的依赖 3. 编译项目 4. 运行生成的可执行文件 5. 在设置中配置模型路径 ## 开发者注意事项 对于开发者,请注意修改以下路径配置: - **CMakeLists.txt**中的vcpkg路径:需要修改为您本地安装的tesseract等包的路径(本人使用的是绝对地址) - **ggml相关库文件和头文件路径**:请根据您的实际安装位置修改相应的路径配置 ## 使用说明 1. **文本翻译**:在输入框中输入英文文本,系统会自动翻译或点击"翻译"按钮手动触发 2. **OCR翻译**:使用全局热键(默认为Ctrl+Shift+O)启动屏幕截图,选择需要识别的区域,系统会自动识别文本并翻译 3. **设置**:点击"设置"按钮配置模型路径、热键等选项 ## 注意事项 - 首次运行时需要加载模型,可能会有较长的初始化时间 - OCR功能依赖于tessdata文件夹中的训练数据 - 翻译质量取决于使用的模型质量 ## 许可证 本项目基于腾讯混元(Tencent HY)社区许可协议开源。