# goWord **Repository Path**: l_g_g/go-word ## Basic Information - **Project Name**: goWord - **Description**: 理解文本处理和词频统计的基本概念。 掌握Go语言中字符串操作、正则表达式、并发处理等特性。 学习数据结构的选择和应用。 练习编写单元测试验证代码正确性。 - **Primary Language**: Go - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-06-01 - **Last Updated**: 2024-06-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: Go语言, demo ## README # goWord #### 介绍 理解文本处理和词频统计的基本概念。 掌握Go语言中字符串操作、正则表达式、并发处理等特性。 学习数据结构的选择和应用。 练习编写单元测试验证代码正确性。 #### 功能说明 基础词频统计:实现一个函数,读取文本并统计单词出现次数。 分词函数:实现一个分词函数,处理英文大小写和标点。 数据存储结构:设计并实现数据结构存储单词及其频率。 词频统计与排序:实现排序和输出词频统计结果的功能。 单元测试:编写测试用例,确保程序各部分的正确性。 程序优化:使用并发处理优化分词过程。 高级数据结构:研究并实现使用Trie树优化存储和查找。 #### 使用说明 运行main方法,执行execute里面6个方法 1.执行基础词频统计 execute.Bwfs() //调用bwfs中的方法执行基础词频统计 2.分词函数 execute.Wsf() //调用wsf中的方法执行分词函数 3.数据存储结构 execute.Dss() //调用dss中的方法执行数据存储结构 4.词频统计与排序 execute.Sort() //调用sort中的方法执行词频统计与排序 5.程序优化:Program optimization execute.Po() //调用po中的方法执行使用go的goroutine实现并发 6.使用 Trie 树来优化存储和查找 execute.Trie() //调用trie中的方法执行使用Trie树来优化存储和查找 7.单元测试:编写测试用例,确保程序各部分的正确性。 test 可以去执行test方法 #### 运行截图 main: ![img.png](img.png) test: 例 ![img_1.png](img_1.png)