求教linux命令的问题
本帖最后由 pig2 于 2014-3-5 03:24 编辑一个文件里面的内容是这样:
http://www.baidu.com/123.html
http://map.baidu.com/index.html
http://www.baidu.com/uiouioj/jfdks.html
http://www.baidu.com/woaini.ht
http://www.sina.com/ffff
http://map.baidu.com/
如何通过linux命令查出这样的结果呢?
3 www.baidu.com
2 map.baidu.com
1 www.sina.com
即按照域名出现的次数排序,后面是相应的域名。
linux不是太熟悉,还望各位帮帮忙。谢谢大家了
好歹也顶一下啊,大哥大姐们 顶,好帖。基本上可以使用mapreduce来实现
第一步:先通过split,刨离带有域名的
第二步:分区
第三步:reduce,统计输出
具体命令只能等高手了。
搞出来了。。。
awk -F '/' '{print $3}' filename |sort | uniq -c | sort -r
自己拼出来的,能出来结果,希望大神加以指正! 云里看花 发表于 2014-3-2 14:05
搞出来了。。。
awk -F '/' '{print $3}' filename |sort | uniq -c | sort -r
绝对的好帖!!! hiqj 发表于 2014-3-2 14:17
绝对的好帖!!!
谢谢啊,亲 看不太懂,看来得继续学习了 perfri 发表于 2014-3-2 18:28
看不太懂,看来得继续学习了
可以去看看百度百科看看awk的解释,写得挺详细的 新手路过,不懂
页:
[1]