分享

去公司面试,记录下的最新hadoop面试题

bioger_hit 发表于 2014-10-8 10:39:40 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 29 160618
fish_tx 发表于 2015-6-2 17:05:07
第14题仅用Linux命令来完成,这个怎么做,版主有答案吗?
回复

使用道具 举报

YLV 发表于 2015-6-7 23:37:37
第14题答案,大家可以参考下:(对应把ip1,ip2分别换为a,b即可)
1):cat ip1.txt |awk -F"[\t]" '{w[$1]+=1}END{for (a in w) print a,w[a]}'|wc -l
2):diff ip1.txt  ip2.txt |grep '>' |sed 's/> //g'|awk '{w[$1]+=1}END{for(a in w)print a}'
3):
cat ip1.txt ip2.txt|awk '{u[$1" "$2]+=1}END{for(i in u) print i,u[i]}'|awk 'BEGIN{print "user" "\t" "user_count" "\t" "ip_count"}{u[$2]+=$3;ip[$2]+=1}END{for(i in u)print i"\t"u[i]"\t"ip[i]}'
回复

使用道具 举报

lwj_wenzi 发表于 2015-9-3 09:17:00
回复

使用道具 举报

YWX 发表于 2015-10-16 22:48:42
努力解题中  静候楼主公布答案
回复

使用道具 举报

zhao2hadoop 发表于 2016-3-3 09:53:39
帖子收下,刘明
回复

使用道具 举报

a530491093 发表于 2016-3-9 10:56:14
快两年过去了,真的没大神能给点答案或提示吗?
回复

使用道具 举报

fpw85 发表于 2016-9-8 11:34:39
感觉好难,一个都不会
回复

使用道具 举报

anotatta 发表于 2016-9-20 15:09:33
不错。谢谢分享。
回复

使用道具 举报

123
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条