# Dissertation **Repository Path**: STILLxjy/wyx ## Basic Information - **Project Name**: Dissertation - **Description**: 汉语文本字数统计,汉语分词,词频统计,分词等级统计,词汇多样性,词汇复杂度计算,根据分词等级作色工具 - **Primary Language**: Python - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2022-02-07 - **Last Updated**: 2025-07-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Dissertation #### 介绍 汉语文本字数统计,汉语分词,词频统计,分词等级统计,词汇多样性,词汇复杂度计算,根据分词等级作色工具 #### 样例: ![输入图片说明](https://images.gitee.com/uploads/images/2022/0207/165454_eeb24f01_7943121.png "1.png") 词云: ![输入图片说明](https://images.gitee.com/uploads/images/2022/0207/165639_5a6a1d27_7943121.png "2.png") 统计结果表: ![输入图片说明](https://images.gitee.com/uploads/images/2022/0207/165743_15494775_7943121.png "在这里输入图片标题") 词汇作色图: ![输入图片说明](https://images.gitee.com/uploads/images/2022/0207/165855_3354430d_7943121.png "4.png") #### 安装教程 下文适合windows操作系统 1. 安装Spyder 访问Spyder官网(https://www.spyder-ide.org/),下载并安装好Spyder IDE 2. 安装好后,将Spyder安装目录下的 Python文件夹目录(例如: D:\Spyder\Python)加入到系统环境变量中。 3. 安装pip 执行 py文件夹中的 get-pip.py脚本,安装pip,用于库文件的下载。 具体步骤:按住win + r, 输入cmd回车,cd 到get-pip.py目录下,再黑框中输入 python get-pip.py #### 使用说明 1. 安装依赖库 pip install jieba pip install pandas pip install xlwt pip install xlrd pip install wordcloud pip install python-docx 2. 将需要分析的txt文本放在 sample 目录下 3. 修改程序中 filename = "潘《一块牛排》" 的值为需要分析的文件名(当前为 “潘《一块牛排》”) 4. 运行代码即可,结果保存在 result文件夹下,以“潘《一块牛排》_”开头 5. 结果样例 ![输入图片说明](https://images.gitee.com/uploads/images/2022/0207/165023_5d3a3823_7943121.png "微信图片_20220207165012.png") 其中 潘《一块牛排》_res_fc.txt 为分词结果 潘《一块牛排》_res.xls 统计了词频,词汇等级统计,词汇多样性和词汇复杂度结果 潘《一块牛排》_res_img.png 为词云图 潘《一块牛排》_color.docx 为词汇作色图,红黄蓝绿黑分别表示丁丙乙甲和未收录词汇