灯火互联
管理员
管理员
  • 注册日期2011-07-27
  • 发帖数41778
  • QQ
  • 火币41290枚
  • 粉丝1086
  • 关注100
  • 终身成就奖
  • 最爱沙发
  • 忠实会员
  • 灌水天才奖
  • 贴图大师奖
  • 原创先锋奖
  • 特殊贡献奖
  • 宣传大使奖
  • 优秀斑竹奖
  • 社区明星
阅读:3503回复:0

Java统计各个单词的个数并排序

楼主#
更多 发布于:2012-09-08 09:42

这个比较简单,我用来练练手,觉得好玩,便把代码贴出来,比如说我们统计"hello,my name is Tom,what is your name?he said:\"my name is John\"";这句英语中单词的总数和各个单词的数量并排序输出,运行结果如下:
总共单词数:15
is:3
name:3
my:2
hello:1
said:1
what:1
Tom:1
your:1
John:1
he:1

直接上代码:

[plain]
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.StringTokenizer;
import java.util.Map.Entry;



public class wordCount {
public static void main(String arg[]){
    int wordCount=0;      //用于统计单词的总个数
    Map<String,Integer> map=new HashMap<String,Integer>();//用于统计各个单词的个数,排序
    String sentence="hello,my name is Tom,what is your name?he said:\"my name is John\"";
    StringTokenizer token=new StringTokenizer(sentence);//这个类会将字符串分解成一个个的标记
    while(token.hasMoreTokens()){                      //循环遍历
        wordCount++;                                  
        String word=token.nextToken(", ?.!:\"\"''\n");  //括号里的字符的含义是说按照,空格 ? . : "" '' \n去分割,如果这里你没明确要求,即括号里为空,则默认按照空格,制表符,新行符和回车符去分割
        if(map.containsKey(word)){     //HashMap不允许重复的key,所以利用这个特性,去统计单词的个数
            int count=map.get(word);
            map.put(word, count+1);     //如果HashMap已有这个单词,则设置它的数量加1
        }
        else
            map.put(word, 1);          //如果没有这个单词,则新填入,数量为1
    }
    System.out.println("总共单词数:"+wordCount);
    sort(map);                        //调用排序的方法,排序并输出!
}
public static void sort(Map<String,Integer> map){
    List<Map.Entry<String, Integer>> infoIds = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());  
    Collections.sort(infoIds, new Comparator<Map.Entry<String, Integer>>() {    
        public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {    
            return (o2.getValue() - o1.getValue());    
        }    
}); //排序
    for (int i = 0; i < infoIds.size(); i++) {   //输出
        Entry<String, Integer> id = infoIds.get(i);
    System.out.println(id.getKey()+":"+id.getValue());
        }
}
}


喜欢0 评分0
游客

返回顶部