代码拉取完成,页面将自动刷新
同步操作将从 SE-net16/PersonalProject-Java 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
package word;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.Scanner;
public class Word {
/*
* 统计字符数
*/
public int getCharCount(String text) {
char[] c = text.toCharArray();
int count = 0;
for (char cTemp : c) {
if ((cTemp >= 32 && cTemp <= 126) || cTemp == '\n' || cTemp == '\r' || cTemp == '\t') {
count++; // 判断合法字符
}
}
return count;
}
/*
* 统计有效行数
*/
public int getLineCount(String text) {
String[] len = text.split("\r\n"); // 以回车为分隔符
int count = 0;
for (String str : len) {
if (str.length() > 0) { // 有效行
count++;
}
}
return count;
}
/*
* 截取单词,为统计单词总数,统计单词出现次数、单词总数服务
*/
public String getWord(String text) {
char[] c = text.toCharArray();
StringBuffer str = new StringBuffer();
for (int i = 0; i < c.length; i++) {
if ((c[i] >= 48 && c[i] <= 57) || (c[i] >= 65 && c[i] <= 90) || (c[i] >= 97 && c[i] <= 122) || c[i] == 32) {
str.append(c[i]); // 截取以字母数字组成的单词
} else {
if (i == 0) {
continue;
}
str.append(" "); // 单词间的分隔符
}
}
String textTemp = str.toString();
str.setLength(0);
String[] word = textTemp.split(" +");
for (String s : word) {
if (s.length() < 4) {
continue;
} else {
for (int i = 0; i < 4; i++) { // 判断前四个字母是英文字母
boolean flag = false;
if (!(s.charAt(i) >= 'A' && s.charAt(i) <= 'Z' || s.charAt(i) >= 'a' && s.charAt(i) <= 'z')) {
break;
}
if (i == 3) {
str.append(s + " ");
}
}
}
}
textTemp = str.toString();
System.out.println(textTemp);
return textTemp; // 返回单词字符串,以空格为分隔符
}
/*
* 统计单词总数
*/
public int getWordCount(String text) {
if (text.length() == 0) {
return 0;
}
String[] word = text.split(" +");
return word.length;
}
/*
* 统计单词出现频率
*/
public Map getWordFrequency(String text) {
Map<String, Integer> map = new HashMap<>();
String[] strTemp = text.split(" +");
for (String s : strTemp) {
if (!map.containsKey(s)) { // 单词首次出现,存入map,置值为1
map.put(s, 1);
} else {
map.put(s, (map.get(s) + 1)); // 单词已存在,值加1
}
}
return map;
}
/*
* 统计指定长度词组的词频
*/
public Map getPhraseFrequency(String text, int length) {
Map<String, Integer> map = new HashMap<>();
String[] strTemp = text.split(" +");
System.out.println(length);
for (int i = 0; i < strTemp.length - length + 1; i++) {
String str = "";
for(int j = i;j < length + i;j++) {
str = str + strTemp[j] + " ";
}
if (!map.containsKey(str)) { // 单词首次出现,存入map,置值为1
map.put(str, 1);
} else {
map.put(str, (map.get(str) + 1)); // 单词已存在,值加1
}
}
return map;
}
/*
* 排序,先按词频数,然后按字典
*/
public List sort(Map map) {
List<Map.Entry<String, Integer>> arraylist = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());
Collections.sort(arraylist, new Comparator<Map.Entry<String, Integer>>() { // 重写比较器
public int compare(Map.Entry<String, Integer> obj1, Map.Entry<String, Integer> obj2) {
return ((Integer) obj2.getValue()).compareTo((Integer) obj1.getValue());
}
});
return arraylist;
}
}
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。