现在的位置: 首页Linux教程 > 正文
sort +awk+uniq 统计文件中出现次数最多的前10个单词
关键词:无 ┊ 来源: 原创收藏

实例
cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100

使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词。

cat words.txt | sort | uniq -c | sort -k1,1nr | head -10

主要考察对sort、uniq命令的使用,相关解释如下,命令及参数的详细说明请自行通过man查看,简单介绍下以上

指令各部分的功能:

sort:  对单词进行排序
uniq -c:  显示唯一的行,并在每行行首加上本行在文件中出现的次数
sort -k1,1nr:  按照第一个字段,数值排序,且为逆序
head -10:  取前10行数据
相关文章
    暂无相关文章
本文由 jack 发布于 1727天 23小时 58分钟前,目前已有 16379 人浏览
欢迎大家转载分享,请注明来源及链接;商业媒体转载请获得授权,谢谢合作!
 
匿名网友: 1楼1126天 1小时 57分钟前
学习了,谢谢楼主
匿名网友: 2楼737天 3小时 28分钟前
请问楼主,如果我要输出至少出现3次的的单词。应该怎么改呢。也就是最后|后面要把head -10改成什么呢。求教啊!
匿名网友: 3楼336天 5小时 16分钟前
留言是种美德,写点什么...

添加评论