# homework2 **Repository Path**: poseychan/homework2 ## Basic Information - **Project Name**: homework2 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-01-08 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # homework2 #### 介绍 实现一个能够对文本文件中的单词的词频进行统计的控制台程序。 #### 软件架构 实现一个命令行程序,不妨称之为WordCount。 统计文件的字符数: 只需要统计Ascii码,汉字不需考虑 空格,水平制表符,换行符,均算字符 统计文件的单词总数,单词:以英文字母开头,跟上字母数字符号,单词以分隔符分割,不区分大小写。 英文字母: A-Z,a-z 字母数字符号:A-Z, a-z,0-9 分割符:空格,非字母数字符号 例:file123是一个单词, 123file不是一个单词。file,File和FILE是同一个单词 统计文件的有效行数:任何包含非空白字符的行,都需要统计。 统计文件中各单词的出现次数,最终只输出频率最高的10个。频率相同的单词,优先输出字典序靠前的单词。 按照字典序输出到文件result.txt:例如,windows95,windows98和windows2000同时出现时,则先输出windows2000 输出的单词统一为小写格式