云里看花 发表于 2014-3-2 13:07:28

求教linux命令的问题

本帖最后由 pig2 于 2014-3-5 03:24 编辑

一个文件里面的内容是这样:
http://www.baidu.com/123.html
http://map.baidu.com/index.html
http://www.baidu.com/uiouioj/jfdks.html
http://www.baidu.com/woaini.ht
http://www.sina.com/ffff
http://map.baidu.com/

如何通过linux命令查出这样的结果呢?


3 www.baidu.com
2 map.baidu.com
1 www.sina.com





即按照域名出现的次数排序,后面是相应的域名。

linux不是太熟悉,还望各位帮帮忙。谢谢大家了



云里看花 发表于 2014-3-2 13:21:26

好歹也顶一下啊,大哥大姐们

pig2 发表于 2014-3-2 13:23:36

顶,好帖。基本上可以使用mapreduce来实现

第一步:先通过split,刨离带有域名的
第二步:分区
第三步:reduce,统计输出

具体命令只能等高手了。

云里看花 发表于 2014-3-2 14:05:34

搞出来了。。。
awk -F '/' '{print $3}' filename |sort | uniq -c | sort -r

自己拼出来的,能出来结果,希望大神加以指正!

hiqj 发表于 2014-3-2 14:17:03

云里看花 发表于 2014-3-2 14:05
搞出来了。。。
awk -F '/' '{print $3}' filename |sort | uniq -c | sort -r



绝对的好帖!!!

云里看花 发表于 2014-3-2 15:03:47

hiqj 发表于 2014-3-2 14:17
绝对的好帖!!!

谢谢啊,亲

perfri 发表于 2014-3-2 18:28:20

看不太懂,看来得继续学习了

hiqj 发表于 2014-3-3 16:19:53

perfri 发表于 2014-3-2 18:28
看不太懂,看来得继续学习了

可以去看看百度百科看看awk的解释,写得挺详细的

SuperTong 发表于 2014-3-26 08:44:46

新手路过,不懂
页: [1]
查看完整版本: 求教linux命令的问题