¼Ü¹¹´óÊý¾Ý·ÖÎöÓ¦ÓÃ-Êý¾Ý·ÖÎö-AboutÔÆ-ËóÂ×¿Æ¼¼

xuanxufeng ·¢±íÓÚ 2016-5-20 20:57:50

¼Ü¹¹´óÊý¾Ý·ÖÎöÓ¦ÓÃ

ÎÊÌâµ¼¶Á

1.ÈçºÎ¶¨Òå´óÊý¾Ý±íÕ÷?
2.¼Ü¹¹Êý¾Ý·ÖÎöÓ¦ÓÃ±¾ÎÄÓÃµ½ÁËÄÄÐ©¼¼Êõ£¿
3.±¾ÎÄÊÇÈçºÎ¹æ»®´óÊý¾Ý¼Ü¹¹µÄ£¿

static/image/hrline/4.gif

Êý¾Ý¹ÜÀí±ÈÒÔÍù¸ü¼Ó¸´ÔÓ£¬µ½´¦¶¼ÊÇ´óÊý¾Ý£¬°üÀ¨Ã¿¸öÈËµÄÏë·¨ÒÔ¼°²»Í¬µÄÐÎÊ½:¹ã¸æ , Éç½»Í¼Æ×,ÐÅÏ¢Á÷ ,ÍÆ¼ö ,ÊÐ³¡, ½¡¿µ, °²È«, Õþ¸®µÈµÈ.¹ýÈ¥µÄÈýÄêÀï£¬³ÉÇ§ÉÏÍòµÄ¼¼Êõ±ØÐë´¦Àí»ãºÏÔÚÒ»ÆðµÄ´óÊý¾Ý»ñÈ¡£¬¹ÜÀí ºÍ·ÖÎö; ¼¼ÊõÑ¡ÐÍ¶ÔIT²¿ÃÅÀ´ËµÊÇÒ»¼þ¼è¾ÞµÄÈÎÎñ£¬ÒòÎªÔÚ´ó¶àÊýÊ±¼äÀïÃ»ÓÐÒ»¸ö×ÛºÏµÄ·½·¨À´ÓÃÓÚÑ¡ÐÍ.µ±×Ô¼ºÃæÁÙÑ¡ÔñµÄÊ±ºò£¬Í¨³£»áÎÊÈçÏÂµÄÎÊÌâ: Ê²Ã´Ê±ºòÐèÒª¿¼ÂÇÔÚITÏµÍ³ÖÐÊ¹ÓÃ´óÊý¾Ý? ×¼±¸ºÃÊ¹ÓÃÁËÃ´? ´ÓÄÄÀï¿ªÊ¼? ¸Ð¾õ´óÊý¾ÝÖ»ÊÇÒ»ÖÖÊÐ³¡Ç÷ÊÆ£¬ÎÒ»¹ÊÇÓ¦¸ÃÈ¥×öÃ´£¿ÕâÐ©ÎÊÌâÝÓÈÆ×ÅCIOºÍCTOÃÇ£¬µ±¾ö¶¨²¿ÊðÒ»¸öÈ«¾Ö»¯·Ö²¼Ê½´óÊý¾Ý¼Ü¹¹Ê±£¬¿ÉÄÜ»á°ÑÆóÒµÖÃÓÚÎ£ÏÕÖ®ÖÐ¡£±¾ÕÂÄ¿µÄÊ±¶¨Òå´óÊý¾ÝµÄ±íÕ÷¡ª»»¾ä»°Ëµ£¬¾ÍÊÇÊ²Ã´Ê±ºòÐèÒª¿¼ÂÇ½«´óÊý¾Ý·ÅÈë¼Ü¹¹¡£ µ«ÊÇ£¬Ò²Ö¸³öÁË¸÷ÖÖ´óÊý¾Ý¼¼ÊõµÄÇø±ð£¬ÄÜ¹»Àí½âÔÚºÎÖÖÇé¿öÊ¹ÓÃÄÄÖÖ¼¼Êõ¡£×îºó, »ùÓÚÕæÊµÊÀ½çµÄÀý×Ó£¬¹¹½¨ÁËµäÐÍ·Ö²¼Ê½´óÊý¾Ý¼Ü¹¹µÄ»ù´¡Ä£ÐÍ¡£¶¨Òå´óÊý¾Ý±íÕ÷»ùÓÚ²»Í¬µÄÐèÒª£¬¿ÉÄÜÑ¡Ôñ¿ªÊ¼´óÊý¾ÝÏîÄ¿s: ÒòÎªËùÐè´¦ÀíµÄÊý¾ÝÈÝÁ¿, ÒòÎªÏµÍ³ÖÐÊý¾Ý½á¹¹µÄ¶àÑùÐÔ, ÒòÎªÀ©Õ¹ÐÔÎÊÌâ, »òÕßÒòÎªÐèÒªÏ÷¼õÊý¾Ý´¦ÀíµÄ³É±¾¡£ ±¾½ÚÖÐ£¬½«¿´µ½ÔõÑùµÄÕ÷Õ×ÒâÎ¶×ÅÒ»¸öÍÅ¶ÓÐèÒª¿ªÊ¼Ò»¸ö´óÊý¾ÝÏîÄ¿ÁË¡£
Êý¾Ý´óÐ¡ÄÄÐ©ÊÂÊ¹ÈËÃÇ¿ªÊ¼¿¼ÂÇ´óÊý¾ÝµÄÁ½¸öÖ÷ÒªÁìÓòÊÇºÎÊ±³öÏÖÁËÓëÊý¾Ý´óÐ¡ºÍÈÝÁ¿ÓÐ¹ØµÄÎÊÌâ¡£¾¡¹Ü´ó¶àÊýÊ±¼äÕâÐ©ÎÊÌâÊÇ¿¼ÂÇ´óÊý¾ÝµÄºÏÇéºÏÀíµÄÔÒò£¬µ«½ñÌì¶øÒÑ£¬Õâ²¢²»ÊÇÎ¨Ò»µÄÔÒò¡£ÓÐÆäËûµÄ±íÕ÷¡ªÀýÈçÊý¾ÝµÄÀàÐÍ. ÈçºÎÔÚ´«Í³Êý¾Ý´æ´¢ÖÐ¹ÜÀí²»¶ÏÔö¼ÓµÄ¸÷ÖÖ¸÷ÑùµÄÊý¾ÝÀàÐÍ, ÈçSQLÊý¾Ý¿â, »¹ÆÚÍûÏó½¨±íÄÇÑùµÄ½á¹¹»¯Ã´? ²»Ôö¼ÓÁé»îÐÔÊÇ²»¿ÉÐÐµÄ£¬µ±³öÏÖÐÂµÄÊý¾Ý½á¹¹ÊÇÐèÒª¼¼Êõ²ãÃæµÄÎÞ·ì´¦Àí¡£µ±ÌÖÂÛÊý¾ÝÀàÐÍÊÇ£¬ÐèÒªÏëÏó·Ç½á¹¹»¯Êý¾Ý£¬Í¼Êý¾Ý£¬Í¼Æ¬£¬ÊÓÆµ£¬ÓïÒôµÈµÈ¡£²»µ«ÒªºÜºÃµÄ´æ´¢·Ç½á¹¹»¯Êý¾Ý£¬¶øÇÒ×îºÃÊÇµÃµ½Ò»Ð©ËûÃÇÖ®ÍâµÄ¶«Î÷¡£ÁíÒ»±íÕ÷À´×ÔÓÚÕâÒ»³ÐÅµ: ´óÊý¾ÝÒ²¿ÉÒÔ´Ó´óÈÝÁ¿µÄ¸÷ÖÖÊý¾ÝÖÐÌáÈ¡ÔöÖµÐÅÏ¢.Èô¸ÉÄêÇ°£¬¶ÔÓÚ´óÁ¿¶Á¶àÓÚÐ´µÄ²Ù×÷£¬Í¨ÓÃµÄ»º´æ»òÊý¾Ý¿â¶ÓÓÑÃ¿ÖÜµÄETL (extract, transform,load) ´¦ÀíÊÇ×ã¹»µÄ¡£Èç½ñ²»ÔÙÊÇÕâÑùµÄÇ÷ÊÆ¡£ÏÖÔÚ£¬ÐèÒªÒ»¸ö¼Ü¹¹¾ß±¸³¤Ê±¼ä´¦ÀíºÍ×¼ÊµÊ±Êý¾Ý´¦ÀíµÄÄÜÁ¦¡£ÕâÒ»¼Ü¹¹ÊÇ·Ö²¼Ê½µÄ£¬¶ø²»ÊÇÒÀÀµÓÚ¸ßÐÔÄÜÇÒ¼Û¸ñ¸ß°ºµÄÉÌÓÃ»ú£¬È¡¶ø´úÖ®µÄÊÇ£¬¸ß¿ÉÓÃ£¬ÐÔÄÜÇý¶¯ºÍÁ®¼Û¼¼ÊõËù¸³ÓèµÄÁé»îÐÔ¡£µ±ÏÂ£¬ÈçºÎ³ä·ÖÀûÓÃÔöÖµÊý¾ÝÒÔ¼°ÈçºÎÄÜ¹»ÔÉúµØËÑË÷µ½ËüÃÇÄØ£¿ÎªÁË»Ø´ðÕâÒ»ÎÊÌâ£¬ÔÙ´Î¿¼ÂÇ´«Í³´æ´¢ÖÐÎªÁË¼ÓËÙ²éÑ¯¶ø´´½¨µÄË÷Òý¡£Èç¹ûÎªÁË¸´ÔÓ²éÑ¯¶øË÷ÒýÉÏ°ÙÁÐ¶øÇÒ°üº¬ÁËÖ÷¼üµÄ²»È·¶¨ÐÔ£¬»áÊÇÊ²Ã´Ñù×Ó£¿²»Ï£ÍûÔÚÒ»¸ö»ù´¡SQL Êý¾Ý¿âÖÐ×öÕâÐ©;È¡¶ø´úÖ®µÄÊÇ£¬ÐèÒª¿¼ÂÇ°´ÕÕÌØÊâÐèÒª¶øÊ¹ÓÃÒ»¸ö NoSQL´æ´¢. ËùÒÔ£¬¼òµ¥»Ø¹ËÒ»ÏÂÖ÷ÒªÂ·¾¶£ºÊý¾Ý»ñÈ¡£¬½á¹¹»¯£¬¿ÉÊÓ»¯ÕâÐ©ÕæÕýÊý¾Ý¹ÜÀíµÄ³¡¾°£¬ÏÔ¶øÒ×¼û£¬Êý¾Ý´óÐ¡²»ÔÙÊÇÖ÷ÒªµÄ¿¼Á¿ÒòËØ¡£µäÐÍµÄÉÌÎñÊ¹ÓÃ³¡¾°³ýÁË¼¼ÊõºÍ¼Ü¹¹¿¼ÂÇ£¬ÐèÒªÃæ¶ÔµäÐÍ´óÊý¾ÝÓÃÀýµÄÊ¹ÓÃ³¡¾°¡£ËüÃÇ²¿·ÖºÍÌØÊâµÄ¹¤ÒµÁìÓòÏà¹Ø£» ÁíÍâµÄ²¿·Ö¿ÉÄÜÊÊÓ¦ÓÚ¸÷ÖÖÁìÓò¡£ÕâÐ©¿¼ÂÇÒ»°ã¶¼ÊÇ»ùÓÚ·ÖÎöÓ¦ÓÃµÄÈÕÖ¾£¬ÀýÈçweb·ÃÎÊÈÕÖ¾,Ó¦ÓÃ·þÎñÆ÷ÈÕÖ¾£¬ºÍÊý¾Ý¿âÈÕÖ¾£¬µ«ÊÇÒ²¿ÉÒÔ»ùÓÚ¸÷ÖÖÆäËûµÄÊý¾ÝÔ´ÀýÈçÉç½»ÍøÂçÊý¾Ý¡£µ±Ãæ¶ÔÕâÐ©Ê¹ÓÃ³¡¾°µÄÊ±ºò£¬Èç¹ûÏ£ÍûËæ×ÅÉÌÎñµÄÔö³¤¶øµ¯ÐÔÀ©Õ¹£¬¾ÍÐèÒª¿¼ÂÇÒ»¸ö·Ö²¼Ê½µÄ´óÊý¾Ý¼Ü¹¹¡£¿Í»§ÐÐÎª·ÖÎö¸ÐÖª¿Í»§, »òÕß½Ð×ö ¡°360-¶È¿Í»§ÊÓ½Ç¡±¿ÉÄÜÊÇ×îÁ÷ÐÐµÄ´óÊý¾ÝÊ¹ÓÃ³¡¾°¡£¿Í»§ÊÓ½ÇÍ¨³£ÓÃÓÚµç×ÓÉÌÎñÍøÕ¾ÒÔ¼°¿ªÊ¼ÓÚÒ»¸ö·Ç½á¹¹»¯µÄµã»÷Á÷¡ª»»¶øÑÔÖ®, ÓÉÒ»¸ö·Ã¿ÍÖ´ÐÐµÄÖ÷¶¯µã»÷ºÍ±»¶¯µÄÍøÕ¾µ¼º½²Ù×÷×é³É¡£Í¨¹ý¼ÆËãºÍ·ÖÎöµã»÷Á¿ºÍÃæÏò²úÆ·»ò¹ã¸æµÄÓ¡Ïó£¬¿ÉÒÔÒÀÀµÐÐÎª¶øÊÊÅä·Ã¿ÍµÄÓÃ»§ÌåÑé£¬ Ä¿±êÊÇµÃµ½ÓÅ»¯Â©¶·×ª»»µÄ¼û½â¡£ÇéÐ÷·ÖÎö¹«Ë¾¹Ø×¢µÄÊÇÆäÔÚÉç½»ÍøÂçÉÏËù±»¸ÐÖªµÄÐÎÏóºÍÉùÓþ; °Ñ¿ÉÄÜÊ¹ËûÃÇÉùÃûÀÇ½åµÄ¸ºÃæÊÂ¼þ×îÐ¡»¯²¢³ä·ÖÀûÓÃÕýÃæÊÂ¼þ. Í¨¹ý×¼ÊµÊ±ÅÀÏÂ´óÁ¿µÄÉç½»Êý¾Ý£¬¿ÉÒÔÌáÈ¡³öÉç½»ÉçÇøÖÐ¹ØÓÚÆ·ÅÆµÄ¸ÐÊÜºÍÇéÐ÷£¬´Ó¶øÕÒµ½Ó°ÏìÓÃ»§²¢Á·Ï°ËûÃÇ£¬¸Ä±ä²¢Ç¿»¯ÓëÕâÐ©ÓÃ»§µÄ½»»¥¡£CRM Onboarding»ùÓÚ·Ã¿ÍµÄÉç½»ÐÐÎª£¬¿ÉÒÔ½«¿Í»§µÄÐÐÎª·ÖÎöºÍÊý¾ÝµÄÇé¸Ð·ÖÎö½áºÏÔÚÒ»Æð¡£¹«Ë¾Ï£Íû½«ÕâÐ©ÔÚÏßÊý¾ÝÔ´ºÍÒÑ¾´æÔÚµÄÀëÏßÊý¾Ý½áºÏÔÚÒ»Æð£¬Õâ½Ð×ö CRM (customer relationship management) onboarding, ÒÔ±ãÓÚµÃµ½¸üºÃºÍ¸ü×¼È·µÄ¿Í»§¶¨Î». ½ø¶ø,¹«Ë¾ÄÜ¹»³ä·ÖÀûÓÃÕâÒ»¶¨Î»£¬´Ó¶ø½¨Á¢¸üºÃµÄÄ¿±êÏµÍ³Ê¹ÊÐ³¡»î¶¯µÄÐ§Òæ×î´ó»¯¡£Ô¤²â´ÓÊý¾ÝÖÐÑ§Ï°ÔÚ¹ýÈ¥¼¸ÄêÒÑ¾³ÉÎªÖ÷ÒªµÄ´óÊý¾ÝÇ÷ÊÆ¡£»ùÓÚ´óÊý¾ÝµÄÔ¤²âÔÚÐí¶àÒµ½çÊÇ·Ç³£ÓÐÐ§µÄ, ÀýÈçµçÐÅ½ç, ÕâÀï¿ÉÒÔÔ¤²â´óÖÚ»¯µÄÂ·ÓÉÈÕÖ¾·ÖÎö. Ã¿Ò»´ÎÔÚÉè±¸ÉÏ·¢ÉúÁËÎÊÌâ, ¹«Ë¾¿ÉÒÔÔ¤²âËü²¢±ÜÃâå´»úÊ±¼ä»òÀûÈó¶ªÊ§¡£µ±½áºÏÒÔÉÏµÄÊ¹ÓÃ³¡¾°µÄÊ±ºò£¬¸ù¾ÝÓÃ»§µÄÕûÌåÐÐÎª£¬¿ÉÒÔÊ¹ÓÃÒ»¸öÔ¤²âÐÍ¼Ü¹¹À´ÓÕ»ó²úÆ·Ä¿Â¼µÄÑ¡ÔñºÍ¼Û¸ñ¡£Àí½â´óÊý¾Ý¼¼ÊõÉúÌ¬ÏµÍ³Ò»µ©È·ÊµÒªÊµÊ©Ò»¸ö´óÊý¾ÝÏîÄ¿, ×îÀ§ÄÑµÄÊÂÊÇ¼Ü¹¹ÖÐµÄ¼¼ÊõÑ¡ÐÍ¡£Õâ²»½öÊÇÑ¡Ôñ×îÖøÃûµÄHadoopÏà¹Ø¼¼Êõ£¬¶øÇÒÐèÒªÀí½âÈçºÎ¸øËüÃÇ·ÖÀà²ÅÄÜ¹¹½¨Ò»¸öÒ»ÖÂÐÔµÄ·Ö²¼Ê½¼Ü¹¹¡£ÎªÁËµÃµ½´óÊý¾ÝÐÇÔÆÖÐµÄÏîÄ¿ÊýÁ¿£¬¿ÉÒÔ²Î¼û https://github.com/zenkay/bigdata-ecosystem#projects-1 £¬ÕâÀïÓÐ100¶à¸ö¹¤³ÌÏîÄ¿¡£ÕâÀï£¬Äã¿ÉÒÔ¿¼ÂÇÑ¡ÔñÒ»¸öHadoopµÄ·¢²¼°æ,Ò»¸ö·Ö²¼Ê½ÎÄ¼þÏµÍ³ ,Ò»¸öÀàSQL´¦ÀíÓïÒô, Ò»¸ö»úÆ÷Ñ§Ï°ÓïÑÔ, µ÷¶ÈÆ÷,ÃæÏòÏûÏ¢µÄÖÐ¼ä¼þ, NoSQLÊý¾Ý´æ´¢,Êý¾Ý¿ÉÊÓ»¯µÈµÈ¡£¼ÈÈ»±¾ÊéµÄÄ¿µÄÊÇÃèÊö¹¹½¨Ò»¸ö·Ö²¼Ê½¼Ü¹¹µÄ¿ÉÀ©Õ¹·½·¨£¬ËùÒÔ²»ÉîÈëµ½ËùÓÐµÄÏîÄ¿ÖÐ£»È¡¶ø´úÖ®£¬ÖØµãÔÚµäÐÍ´óÊý¾Ý¹¤³ÌÖÐ×î¿ÉÄÜÊ¹ÓÃµÄ¶«Î÷¡£ÏÔÈ»£¬¼Ü¹¹µÄÑ¡ÔñºÍÏîÄ¿µÄ¼¯³ÉÒÀÀµÓÚ¾ßÌåµÄÐèÒª£¬Äã¿ÉÒÔ¿´µ½ÔÚÌØ¶¨µÄÁìÓò¿ÉÒÔÊ¹ÓÃÕâÐ©ÏîÄ¿µÄ¾ßÌåÊµÀý¡£ÎªÁËÊ¹Hadoop ¼¼Êõ±íÏÖµÄ¸üÓÐÏà¹ØÐÔ£¬ÕâÒ»·Ö²¼Ê½¼Ü¹¹½«ÊÊÓÃÓÚÇ°ÃæÃèÊöµÄµäÐÍ³¡¾°£¬ÃüÃûÈçÏÂ£º
[*]¿Í»§ÐÐÎª·ÖÎö
[*]ÇéÐ÷·ÖÎö
[*]CRM onboarding ºÍÔ¤²â
Hadoop ·¢²¼°æÔÚº¸ÇÁËHadoop ÉúÌ¬ÏµÍ³µÄ´óÊý¾ÝÏîÄ¿ÖÐ£¬ÓÐÁ½¸öÑ¡Ôñ£º
[*]ÔÚÒ»¸öÁ¬¹á£¬µ¯ÐÔºÍÒ»ÖÂµÄ¼Ü¹¹ÖÐ·Ö±ðÏÂÔØÏà¹ØÏîÄ¿£¬È»ºó³¢ÊÔ´´½¨»ò×é×°ËüÃÇ
[*]Ê¹ÓÃÒ»¸ö¹ã·ºÁ÷ÐÐµÄ Hadoop·Ö·¢°æ, ÒÑ¾×°Åä»ò´´½¨ºÃÁËÕâÐ©¼¼Êõ.
¾¡¹ÜÑ¡ÏîÒ»ÍêÈ«¿ÉÐÐ£¬Äã»¹ÊÇ¿ÉÄÜÑ¡Ôñ·½°¸¶þ£¬ÒòÎªÒ»¸öHadoop ·¢ÐÍ°ü±£Ö¤ÁËËùÓÐ°²×°×é¼þµÄ¼æÈÝÐÔ£¬°²×°£¬ÅäÖÃ²¿Êð£¬¼à¿ØºÍÖ§³Ö¶¼·Ç³£¼òµ¥¡£Hortonworks ºÍCloudera ÊÇÕâÑùÁìÓòµÄÖ÷½Ç¡£¾¡¹ÜËüÃÇÖ®¼äÓÐÐ©Çø±ð£¬µ«ÊÇ´Ó´óÊý¾Ý°üµÄ½Ç¶ÈÉÏ¿´£¬ËüÃÇÊÇÒ»ÑùµÄ£¬Äã²»ÐèÒªÄÇÐ©×¨ÊôµÄ²å¼þ¡£ÎÒÃÇµÄÄ¿±ê²»ÊÇÃèÊöÃ¿¸ö·¢²¼°æµÄËùÓÐ×é¼þ£¬¶þÊÇ¾Û½¹ÔÚÃ¿¸öÌá¹©ÕßÔÚ±ê×¼ÉúÌ¬ÏµÍ³ÖÐËùÔö¼ÓµÄ²¿·Ö¡£Í¬Ê±£¬ÃèÊöÁËÔÚÃ¿ÖÖÇé¿öÏÂ£¬¸Ã¼Ü¹¹ËùÒÀÀµµÄÆäËû×é¼þ¡£Cloudera CDHCloudierÔÚHadoop»ù´¡×é¼þÉÏÔö¼ÓÁËÒ»¸öÄÚ²¿»ú¹¹×é¼þµÄ¼¯ºÏ; ÕâÐ©×é¼þ±»Éè¼Æ³É¸øÄã¸üºÃµÄ¼¯Èº¹ÜÀíºÍËÑËØÌåÑé¡£²¿·Ö×é¼þÁÐ±íÈçÏÂ£º
[*]Impala: Ò»¸öÊµÊ±£¬²¢ÐÐ»¯£¬»ùÓÚSQLµÄÒýÇæÀ´ËÑË÷ HDFS
(Hadoop Distributed File System)ºÍ HBaseÖÐµÄÊý¾Ý. Impala±»ÈÏÎªÊÇHadoop ·¢²¼°æÌá¹©ÉÌÊÐ³¡ÖÐ×î¿ìµÄ²éÑ¯ÒýÇæ£¬ÊÇUC Bekeley Spark µÄÖ±½Ó¾ºÕùÕß¡£
[*]Cloudera Manager: ÕâÊÇCloudierµÄ¿ØÖÆÌ¨£¬ÓÃÀ´¹ÜÀíºÍ²¿ÊðHadoop¼¯ÈºÄÚµÄHadoop×é¼þ.
[*]Hue: Ò»¸öÓÃÓÚÖ´ÐÐÓÃ»§½»»¥Êý¾Ý²Ù×÷ºÍÖ´ÐÐ½Å±¾µÄ¿ØÖÆÌ¨£¬¿ÉÒÔ²Ù×÷¼¯ÈºÄÚ²»Í¬µÄHadoop×é¼þ.
Figure 1-1 ½âÊÍÁËCloudera¡¯s Hadoop·Ö·¢°üÓÐÈçÏÂ×é¼þ·ÖÀà:
[*]³ÈÉ«²¿·ÖÊÇHadoopºËÐÄÕ».
[*]·ÛÉ«²¿·ÖÊÇ Hadoop ÉúÌ¬ÏµÍ³ÏîÄ¿
[*]À¶É«²¿·ÖÊÇ ClouderaµÄÌØÊ¹×é¼þ.
Figure 1-1. Cloudera Hadoop·¢²¼°æHortonworks HDPHortonworks ÊÇÒ»¸ö°Ù·ÖÖ®°ÙµÄ¿ªÔ´¶øÇÒÊ¹ÓÃÁËÎÈ¶¨µÄ×é¼þ°ü£¬¶ø²»ÊÇ1Hadoop ÏîÄ¿ÖÐ×îÐÂµÄ·Ö·¢°æ±¾¡£ËüÔö¼ÓÁËÒ»¸ö×é¼þ¹ÜÀí¿ØÖÆÌ¨À´ÓëCloudera Manager¶Ô±È¡£Figure 1-2 Õ¹Ê¾ÁËHortonworks ·¢²¼°æÓëFigure 1-1 ÏàÓ¦µÄ·ÖÀà£ºÂÌÉ«²¿·ÖÊÇHortonworksµÄÌØÊâ×é¼þ.Figure 1-2. Hortonworks Hadoop distributionÈçÇ°ËùÊö£¬µ±ÎÒÃÇ¹¹½¨¼Ü¹¹µÄÊ±ºò£¬ÕâÁ½¸ö·¢²¼°æ(Hortonworks ºÍCloudera) ÊÇÒ»ÑùµÄ¡£¾¡¹ÜÈç´Ë, Èç¹û¿¼ÂÇµ½Ã¿¸ö·¢²¼°æµÄ³ÉÊì¶È£¬Ó¦µ±Ñ¡Ôñ; Cloudera Manager±ÈAmbari¸üÍêÕûºÍÎÈ¶¨ .½øÒ»²½£¬¿¼ÂÇÊµÊ±Óë´óÊý¾Ý¼¯½»»¥£¬¸üÓ¦¸ÃÒòÎªËüµÄÐÔÄÜ×¿Ô½¶øÊ¹ÓÃCloudera.Hadoop Distributed File System (HDFS)Äã¿ÉÄÜÒÉÂÇÉãÈ¡µ½Hadoop¼¯ÈºÖÐµÄÊý¾Ý´æ´¢µ½ÄÄÀï¡£Ò»°ã¶¼ÔÚÒ»¸ö×¨ÓÐµÄÏµÍ³ÉÏ£¬½Ð×öHDFS¡£HDFSµÄºËÐÄÌØÐÔ:
[*]·Ö²¼Ê½
[*]¸ßÍÌÍÂÁ¿·ÃÎÊ
[*]¸ß¿ÉÓÃ
[*]ÈÝ´í
[*]²ÎÊýµ÷Õû
[*]°²È«
[*]¸ºÔØ¾ùºâ
HDFS ÊÇHadoop¼¯ÈºÖÐÊý¾Ý´æ´¢µÄÍ·µÈ¹«Ãñ¡£Êý¾ÝÔÚ¼¯ÈºÊý¾Ý½ÚµãÖÐ×Ô¶¯¸´ÖÆ¡£
Figure 1-3 Õ¹Ê¾ÁËHDFSÖÐµÄÊý¾ÝÈçºÎÔÚ Ò»¸ö¼¯ÈºµÄÎå¸ö½ÚµãÖÐ¸´ÖÆµÄ¡£Figure 1-3. HDFS data replication¿ÉÒÔ´Ó hadoop.apache.org»ñµÃ¸ü¶àµÄÓÐ¹ØHDFSµÄÐÅÏ¢¡£Data AcquisitionÊý¾ÝµÄ»ñÈ¡»òÕßÉãÈ¡¿ªÊ¼ÓÚ²»Í¬µÄÊý¾ÝÔ´£¬¿ÉÄÜÊÇ´óµÄÈÕÖ¾ÎÄ¼þ£¬Á÷Êý¾Ý£¬ ETL´¦Àí¹ýµÄÊä³ö£¬ÔÚÏßµÄ·Ç½á¹¹»¯Êý¾Ý£¬»òÕßÀëÏßµÄ½á¹¹»¯Êý¾Ý¡£Apache Flumeµ±²é¿´Éú³ÉµÄÉãÈ¡ÈÕÖ¾µÄÊ±ºò£¬Ç¿ÁÒÍÆ¼öÊ¹ÓÃApache Flume; ËüÊÇÎÈ¶¨ÇÒ¸ß¿ÉÓÃµÄ£¬Ìá¹©ÁËÒ»¸ö¼òµ¥£¬Áé»îºÍ»ùÓÑÁ÷Êý¾ÝµÄ¿É¸ÐÖª±à³ÌÄ£ÐÍ¡£»ù±¾ÉÏ£¬½öÍ¨¹ýÅäÖÃ¹ÜÀí²»ÐèÒªÐ´Ò»ÐÐ´úÂë¾Í¿ÉÒÔÅã×ÅÒ»¸öÊý¾ÝÁ÷Ë®Ïß¡£Flume ÓÉsources, channels, ºÍsinks×é³É. Flume source »ù±¾ÉÏ´ÓÒ»¸öÍâ²¿Êý¾ÝÔ´À´Ïû·ÑÒ»¸öÊÂ¼þÈç Apache Avro source,È»ºó´æµ½channel. channelÊÇÒ»¸öÏñÎÄ¼þÏµÍ³ÄÇÑùµÄ±»¶¯´æ´¢ÏµÍ³ ; ËüÔÚsink Ïû·ÑÊÂ¼þÇ°Ò»Ö±³ÖÓÐËü. sink Ïû·ÑÊÂ¼þ£¬È»ºó´ÓchannelÖÐÉ¾³ý¸ÃÊÂ¼þ£¬²¢·Ö·¢¸øÒ»¸öÍâ²¿µÄÄ¿±ê¡£Figure 1-4 ÃèÊöÁËÒ»¸öweb serverºÍHDFS¼äµÄÈÕÖ¾Á÷Èç Apache,Ê¹ÓÃÁËFlume Á÷Ë®Ïß.

Figure 1-4. Flume architectureÍ¨¹ý Flume, ¿ÉÒÔ½«web·þÎñÆ÷²úÉúµÄ²»Í¬ÈÕÖ¾ÎÄ¼þÒÆ¶¯µ½HDFS. ÀÎ¼ÇÎÒÃÇ¹¤×÷ÔÚÒ»¸ö·Ö²¼Ê½µÄ¼Ü¹¹£¬¿ÉÄÜ°üº¬ÓÐ¸ºÔØ¾ùºâÆ÷£¬HTTP servers,Ó¦ÓÃ·þÎñÆ÷£¬·ÃÎÊÈÕÖ¾µÈµÈ . ÎÒÃÇÊÇÒ»²»Í¬µÄ·½Ê½³ä·ÖÀûÓÃÕâÐ©×ÊÔ´£¬Ê¹Ö®ÄÜ¹»±»FlumeÁ÷Ë®Ïß´¦Àí . ÏêÇé²Î¼û flume.apache.org.Apache SqoopSwoopÊÇÒ»¸ö´Ó½á¹¹»¯Êý¾Ý¿â´«Ëµ´óÁ¿Êý¾Ýµ½HDFS. Ê¹ÓÃËü£¬¼È¿ÉÒÔ´ÓÒ»¸öÍâ²¿µÄ¹ØÏµÐÍÊý¾Ý¿â½«Êý¾Ýµ¼Èëµ½HDFS, Hive, »òÕß HBase, Ò²¿ÉÒÔHadoop ¼¯Èºµ¼³öµ½Ò»¸ö¹ØÏµÐÍÊý¾Ý¿â»òÕßÊý¾Ý²Ö¿â.Sqoop Ö§³ÖÖ÷Á÷µÄ¹ØÏµÐÍÊý¾Ý¿âÀýÈçOracle, MySQL, ºÍPostgres. Õâ¸öÏîÄ¿°ÑÄã´ÓÐ´½Å±¾´«ÊäÊý¾ÝÖÐ½âÍÑ³öÀ´;ËüÌá¹©ÁË¸ßÐÔÄÜÊý¾Ý´«ÊäµÄÌØÐÔ.ÒòÎª¹ØÏµÐÍÊý¾Ý¿âÖÐµÄÊý¾ÝÔö³¤Ñ¸ËÙ, ×îºÃ´Ó¿ªÊ¼¾Í¶¨ÒåÄÇÐ©¿ìËÙÔö³¤µÄ±í£¬È»ºóÊ¹ÓÃSqoop½«Êý¾ÝÖÜÆÚÐÔµØ´«Êäµ½Hadoop£¬ÒÔ±ãÓÃÓÚ·ÖÎö.È»ºó£¬½áºÏHadoopÓëÆäËûÊý¾Ý£¬¿ÉÒÔÊ¹ÓÃSqoop µ¼³öÊý¾Ý×¢Èëµ½BI ·ÖÎö¹¤¾ßÖÐ. ÏêÇé²Î¼û sqoop.apache.org.´¦ÀíÓïÑÔÒ»µ©Êý¾Ýµ½ÁËHDFS,¿ÉÒÔÊ¹ÓÃ²»Í¬µÄ´¦ÀíÓïÑÔ´ÓÔÊ¼Êý¾ÝµÃµ½×îºÃµÄ½á¹û.Yarn: NextGen MapReduceMapReduce ÊÇµÚÒ»´úHadoop¼¯ÈºÖÐµÄÖ÷Òª´¦Àí¿ò¼Ü; Ëü»ù±¾ÉÏ½«»¬¶¯Êý¾Ý·Ö×é(Map) ÔÚÒ»Æð£¬È»ºóÒÀÀµÌØÊâµÄ¾ÛºÏ²Ù×÷(Reduce)À´¾Û»áÊý¾Ý¡£ÔÚHadoop 1.0ÖÐ, ÓÃ»§ÃÇ¿ÉÒÔÊ¹ÓÃ²»Í¬µÄÓïÑÔÀ´Ð´ MapReduce jobs¡ªJava, Python,
Pig, HiveµÈµÈ. ÎÞÂÛÓÃ»§Ñ¡ÔñÁËÊ²Ã´ÓïÑÔ, ¶¼ÒÀÀµÓÚÏàÍ¬µÄ´¦ÀíÄ£ÐÍ:MapReduce.Ëæ×ÅHadoop 2.0µÄ·¢²¼, ÓÐÁËHDFSÖ®ÉÏÐÂµÄÊý¾Ý´¦Àí¼Ü¹¹. ÏÖÔÚÒÑ¾ÊµÏÖÁËYARN (Yet Another Resource Negotiator), MapReduce ÒÑ¾³ÉÎªÁËÖÚ¶à´¦ÀíÄ£ÐÍÖÐµÄÒ»¸ö. ÕâÒâÎ¶×Å¿ÉÒÔÒÀÀµÌØÊâµÄÊ¹ÓÃ³¡¾°À´²ÉÓÃÌØÊâµÄ´¦ÀíÄ£ÐÍ.
Figure 1-5 Õ¹Ê¾ÁËHDFS, YARN, ºÍ´¦ÀíÄ£ÐÍÊÇÈçºÎ×éÖ¯µÄ.Figure 1-5. YARN structureÎÒÃÇÎÞ·¨ÉóÊÓËùÓÐµÄÓïÑÔºÍ´¦ÀíÄ£ÐÍ; ×¨×¢ÓÚ Hive ºÍSpark, ËüÃÇ¸²¸ÇÁËÎÒÃÇËùÓÃµÄÓÃÀý£¬³¤Ê±¼äÊý¾Ý´¦ÀíºÍÁ÷´¦Àí¡£Ê¹ÓÃHiveµÄÅú´¦Àíµ±¾ö¶¨Ð´µÚÒ»¸öÅú´¦ÀíjobµÄÊ±ºò, Ê¹ÓÃËùÏ²»¶ÓïÑÔÊµÏÖËü£¬ÀýÈçJava»ò Python,µ«Èç¹ûÕæµÄÒª×ö£¬×îºÃÊæ·þµØÊ¹ÓÃmapping ºÍreducing Éè¼ÆÄ£Ê½, µ«ÕâÐèÒª¿ª·¢µÄÊ±¼äºÍ¸´ÔÓµÄ±àÂë£¬ÓÐÊ±ºòºÜÄÑÈ¥Î¬»¤¡£×÷ÎªÒ»¸öÌæ´ú·½Ê½, ¿ÉÒÔÊ¹ÓÃÀýÈçHiveÕâÑùµÄ¸ß¼¶ÓïÑÔ, ÒÔÀàSQL·½Ê½¼òµ¥¶øÓÖÇ¿´óµØ´ÓHDFSÖÐ²éÑ¯Êý¾Ý. ÔÚÓÃJavaÐ´ÁË10ÐÐ´úÂëµÄMapReduceµØ·½,ÔÚHiveÖÐ, Ö»ÐèÒªÒ»Ìõ SQL ²éÑ¯Óï¾ä.µ±Ê¹ÓÃÆäËûÓïÑÔ¶ø²»ÊÇÔÉúMapReduce, ÆäÖ÷ÒªµÄÈ±ÏÝÊÇÐÔÄÜ.ÔÚ Hive ºÍ MapReduceÖ®¼äÓÐ×ÅÌìÈ»µÄÊ±ÑÓ; ÁíÍâ, SQL²éÑ¯Ò²Óë¹ØÏµÐÍÊý¾Ý¿âÖÐµÄ²éÑ¯½ØÈ»²»Í¬¡£ÏêÇé²Î¼û hive.apache.org.Hive ²»ÊÇÒ»¸öÊµÊ±»ò×¼ÊµÊ±µÄ´¦ÀíÓïÑÔ£¬±»ÓÃ×÷Åú´¦Àí£¬ÀýÈçÒ»¸öµÍÓÅÏÈ¼¶µÄ³¤Ê±¼ä´¦ÀíÈÎÎñ. ´¦ÀíÁ÷Ê½Êý¾Ý£¬ÐèÒªÊ¹ÓÃSpark Streaming.Ê¹ÓÃSpark StreamingµÄÁ÷´¦ÀíSpark Streaming ¿ÉÒÔÍ¨¹ýJava, Scale, »òÕßPythonÀ´Ð´Åú´¦ÀíÈÎÎñ, µ«ÊÇ¿ÉÒÔ´¦ÀíÁ÷Êý¾Ý. Õâ·Ç³£ÊÊºÏ´¦Àí¸ßÍÌÍÂÁ¿µÄÊý¾ÝÔ´TÀýÈçÉç½»ÍøÂç(Twitter), µã»÷Á÷ÈÕÖ¾, »òÕß web ·ÃÎÊÈÕÖ¾.Spark Streaming ÊÇSparkµÄÒ»¸öÀ©Õ¹, Ëü³ä·ÖÀûÓÃÁË·Ö²¼Ê½Êý¾Ý´¦Àí¼Ü¹¹£¬°ÑÁ÷Ê½¼ÆËã×÷Îª Ò»ÏµÁÐ²»È·¶¨µÄÐ¡Ê±¼ä¼ä¸ôµÄÎ¢ÐÍÅú´¦Àí¼ÆËã¡£ÏêÇé²Î¼û spark.apache.org.Spark Streaming ¿ÉÒÔ´Ó¸÷ÖÖÔ´»ñµÃÊý¾Ý£¬Í¨¹ýÓëÈçApache KafkaÕâÑù¹¤¾ßµÄ½áºÏ, Spark Streaming ³ÉÎªÇ¿ÈÝ´íºÍ¸ßÐÔÄÜÏµÍ³µÄ»ù´¡¡£ÃæÏòÏûÏ¢µÄÖÐ¼ä¼þApache KafkaApache Kafka ÊÇÒ»¸öÓÉLinkedin¿ª·¢µÄ¶©ÔÄ£·¢²¼ÏûÏ¢µÄ·Ö²¼Ê½Ó¦ÓÃ¡£Kafka¾³£Óë Apache ActiveMQ »òÕßRabbitMQ¶Ô±È, µ«¸ù±¾²»Í¬ÊÇKafka Ã»ÓÐÊµÏÖJMS (Java Message Service). È»¶ø, KafkaÊÇÒ»¸ö³Ö¾Ã»¯ÏûÏ¢µÄ¸ßÍÌÍÂÁ¿ÏµÍ³ , Ö§³Ö¶ÓÁÐºÍ»°ÌâÓïÒâ£¬ Ê¹ÓÃ ZooKeeperÐÎ³É¼¯Èº½Úµã¡£
Kafka ÊµÏÖÁË¶©ÔÄ£·¢²¼µÄÆóÒµ¼¶¼¯³É£¬Ö§³Ö²¢ÐÐ»¯£¬ÒÔ¼°ÐÔÄÜºÍÈÝ´íµÄÆóÒµ¼¶ÌØÐÔ¡£
Figure 1-6 ¸ø³öÁË¶©ÔÄ£·¢²¼¼Ü¹¹µÄ¸ß²ãÊÓ½Ç£¬ÏûÏ¢ÔÚbroker´«Êä£¬·þÎñÓÚ·ÖÇøµÄ»°Ìâ¡£Figure 1-6. Kafka partitioned topic exampleÊ¹ÓÃ KafkaÔÚÎÒÃÇ¼Ü¹¹ÖÐµÄÒýµ¼µã £¬Ö÷ÒªÓÃÓÚ½ÓÊÜÊý¾Ý²¢ÍÆËÍµ½Spark
Streaming. ÏêÇé²Î¼û kafka.apache.org.»úÆ÷Ñ§Ï°µ±ÎÒÃÇÒÔÎÞÏÞÊÕÁ²Ä£ÐÍ´¦ÀíÐ¡Êý¾Ý²ÉÑùÊ±£¬ÔÚ¼Ü¹¹ÖÐÌÖÂÛ»úÆ÷Ñ§Ï°»¹ÎªÊ±ÉÐÔç¡£ÎÒÃÇÊÇ³ä·ÖÀûÓÃÏÖÓÐµÄ·Ö²ã»òÌØÊâÓïÑÔÀ´Ê¹ÓÃ»úÆ÷Ñ§Ï°£¬ÀýÈç
SparkÖÐµÄ Spark MLlib¡£Spark MLlibMLlibÊÇSparkÉÏµÄ»úÆ÷Ñ§Ï°¿â, ³ä·ÖÀûÓÃÁË Spark Direct Acyclic Graph (DAG) Ö´ÐÐÒýÇæ, ËùÌá¹©µÄAPI ¼¯ºÏ·½±ãµØ¼¯³Éµ½SparkÖÐ. ËüÓÉ¸÷ÖÖµÄËã·¨×é³É £º»ù±¾Í³¼Æ, Âß¼»Ø¹é£¬ k-means ¾ÛÀà, ´Ó»ìºÏ¸ßË¹µ½ÆæÒìÖµ·Ö½âÒÔ¼°¶àÎ¬ÆÓËØ±´Ò¶Ë¹¡£Í¨¹ý Spark MLlib ÕâÐ©¿ªÏä¼´ÓÃËã·¨£¬¿ÉÒÔÓÃ¼¸ÐÐ´úÂë¾ÍÄÜ¹ý¼òµ¥µØÑµÁ·Êý¾Ý²¢¹¹½¨Ô¤²âÄ£ÐÍa ÏêÇé²Î¼û spark.apache.org/mllib.NoSQL ´æ´¢NoSQL ´æ´¢ÊÇÊý¾Ý¼Ü¹¹µÄ»ù´¡×é¼þ£¬ÒòÎªËüÃÇ¿ÉÒÔÉãÈ¡´óÁ¿Êý¾Ý£¬Ìá¹©µ¯ÐÔÉìËõ£¬¸ß¿ÉÓÃÐÔÒÔ¼°¿ªÏä¼´ÓÃ¡£Couchbase ºÍ ElasticSearchÊÇÁ½ÖÖÎÒÃÇ¾Û½¹µÄ¼¼Êõ£¬ÏÈ×ö¼òµ¥ÌÖÂÛ£¬ÉÔºóÊ¹ÓÃËüÃÇ¡£CouchbaseCouchbaseÊÇÒ»¸öÃæÏòÎÄµµµÄNoSQLÊý¾Ý¿â£¬Ìá¹©ÁËÒ»¸öÁé»îµÄÄ£ÐÍÇáËÉËõ·Å£¬ÒÔ¼°Ò»ÖÂÐÔµÄ¸ßÐÔÄÜ¡£Ê¹ÓÃ Couchbase×÷ÎªÎÄµµÊý¾Ý´æ´¢£¬»ù±¾ÉÏÖØ¶¨Ïò´ÓÇ°¶ËÀ´µÄËùÓÐ²éÑ¯ µ½ Couchbase ·ÀÖ¹ÁË¹ØÏµÐÍÊý¾Ý¿âµÄ¸ßÍÌÍÂÁ¿¶Á²Ù×÷¡£ÏêÇé²Î¼û couchbase.com.ElasticSearchElasticSearch ÊÇÒ»ÖÖ·Ç³£Á÷ÐÐµÄ NoSQL ¼¼Êõ£¬ÓµÓÐ¿ÉÉìËõ·Ö²¼Ê½Ë÷ÒýÒýÇæºÍËÑË÷ÌØÐÔ£¬Ïàµ±ÓÚÒ»°ã¼Ü¹¹ÖÐApache Lucene ¼ÓÉÏÊµÊ±Êý¾Ý·ÖÎöºÍÈ«ÎÄËÑË÷.
ElasticSearchÊÇELKÆ½Ì¨µÄÒ»²¿·Ö£¨ ElasticSearch + Logstash + Kibana,£©£¬ÊÇÓÉElastic¹«Ë¾·¢²¼µÄ¡£Èý¸ö²úÆ·½áºÏÔÚÒ»ÆðÌá¹©ÁËÊý¾Ý²É¼¯£¬´æ´¢ºÍ¿ÉÊÓ»¯×îºÃµÄ¶Ëµ½¶ËÆ½Ì¨:
[*]Logstash ´Ó¸÷ÖÖÊý¾ÝÔ´²É¼¯Êý¾Ý£¬ÀýÈçÉç½»Êý¾Ý£¬ÈÕÖ¾£¬ÏûÏ¢¶ÓÁÐ£¬»òÕß´«¸ÐÆ÷£¬Ö§³ÖÊý¾ÝµÄ·á¸»ÐÔºÍ×ª»»£¬È»ºó´«Êäµ½Ò»¸öË÷ÒýÏµÍ³ÀýÈçElasticSearch.
[*]ElasticSearch ÔÚÒ»¸öµ¯ÐÔÉìËõµÄ·Ö²¼Ê½ÏµÍ³ÖÐË÷ÒýÊý¾Ý£¬ÎÞ·ìÌá¹©ÁË¶àÓïÑÔ¿â£¬ºÜÈÝÒ×ÔÚÓ¦ÓÃÖÐÊµÏÖÊµÊ±ËÑË÷ºÍ·ÖÎö¡£
[*]Kibana ÊÇÒ»¸ö¶¨ÖÆ»¯µÄÓÃ»§½çÃæ£¬¿ÉÒÔ¹¹½¨´Ó¼òµ¥µ½¸´ÔÓµÄÒÇ±íÅÌ£¬À´Ì½Ë÷ºÍ¿ÉÊÓ»¯ElasticSearch Ë÷ÒýµÄÊý¾Ý¡£
Figure 1-7 Õ¹Ê¾ÁËElastic²úÆ·µÄ½á¹¹.Figure 1-7. ElasticSearch productsÈçÇ°Í¼ËùÊ¾, Elastic Ò²Ìá¹©ÁËÉÌÓÃ²úÆ·ÀýÈçMarvel,»ùÓÚKibanaµÄÒ»¸ö¼à¿Ø¿ØÖÆÌ¨; Shield, Ò»¸ö°²È«¿ò¼Ü, ÀýÈçÌá¹©ÊÚÈ¨ºÍÈÏÖ¤; Watcher, Ò»¸ö¸æ¾¯ºÍÍ¨ÖªÏµÍ³. µ«±¾ÊéÖÐ²»Ê¹ÓÃÕâÐ©ÉÌÓÃ²úÆ·¡£ÎÒÃÇÖ÷ÒªÊ¹ÓÃElasticSearch×÷ÎªËÑË÷ÒýÇæÀ´³ÖÓÐSpark²úÉúµÄ²úÆ·¡£ÔÚ´¦ÀíºÍ¾ÛºÏÖ®ºó£¬Êý¾ÝÔÚElasticSearchÖÐ±»Ë÷Òý£¬Ê¹µÚÈý·½ÏµÍ³Í¨¹ýElasticSearchÒýÇæ²éÑ¯Êý¾Ý¡£ÁíÒ»·½Ãæ£¬ÎÒÃÇÒ²Ê¹ÓÃ ELKÀ´´¦ÀíÈÕÖ¾ºÍÐéÄâ»¯·ÖÎö£¬¶ø²»Ö»ÊÇÆ½Ì¨²Ù×÷ÊÓ½Ç¡£ÏêÇé²Î¼û elastic.co.´´½¨ÓÐ³¤Ô¶¹æ»®µÄ´óÊý¾Ý¼Ü¹¹¼Ç×¡ËùÓÐÕâÐ©´óÊý¾Ý¼¼Êõ£¬ÏÖÔÚÀ´¹¹½¨ÎÒÃÇµÄ¼Ü¹¹¡£¼Ü¹¹¸ÅÀÀ´Ó¸ß²ãÊÓ½ÇÀ´¿´, ÎÒÃÇµÄ¼Ü¹¹¿´ÆðÀ´ÏóÁíÒ»¸öµç×ÓÉÌÎñÓ¦ÓÃ¼Ü¹¹£¬ÐèÒªÈçÏÂ£º
+ Ò»¸öwebÓ¦ÓÃ£¬·Ã¿Í¿ÉÒÔÓÃËüµ¼º½Ò»¸ö²úÆ·Ä¿Â¼
+ Ò»¸öÈÕÖ¾ÉãÈ¡Ó¦ÓÃ£ºÀÈ¡ÈÕÖ¾²¢´¦ÀíËüÃÇ
+ Ò»¸ö»úÆ÷Ñ§Ï°Ó¦ÓÃ£ºÎª·Ã¿Í´¥·¢ÍÆ¼ö
+ Ò»¸ö´¦ÀíÒýÇæ£º×÷Îª¸Ã¼Ü¹¹µÄÖÐÑë´¦Àí¼¯Èº
+ Ò»¸öËÑË÷ÒýÇæ£ºÀÈ¡´¦ÀíÊý¾ÝµÄ·ÖÎöFigure 1-8 Õ¹Ê¾ÁËÕâÐ©²»Í¬Ó¦ÓÃÈçºÎÔÚ¸Ã¼Ü¹¹×éÖ¯ÆðÀ´µÄ¡£Figure 1-8. Architecture overviewÈÕÖ¾ÉãÈ¡ÈÕÖ¾ÉãÈ¡Ó¦ÓÃ±»ÓÃ×÷Ïû·ÑÓ¦ÓÃÈÕÖ¾ÀýÈçweb ·ÃÎÊÈÕÖ¾. ÎªÁË¼ò»¯Ê¹ÓÃ³¡¾°£¬Ìá¹©Ò»¸öweb·ÃÎÊÈÕÖ¾£¬Ä£Äâ·Ã¿Íä¯ÀÀ²úÆ·Ä¿Â¼£¬ÕâÐ©ÈÕÖ¾´ú±íÁËµã»÷Á÷ÈÕÖ¾£¬¼ÈÓÃ×÷³¤Ê±´¦ÀíÒ²ÓÃ×÷ÊµÊ±ÍÆ¼ö¡£¼Ü¹¹ÓÐÁ½¸öÑ¡Ïî£ºµÚÒ»¸öÊÇÒÔFlumeÀ´´«ÊäÈÕÖ¾£»µÚ¶þ¸öÊÇÒÔLEK À´´´½¨·ÃÎÊ·ÖÎö¡£Figure 1-9 Õ¹Ê¾ÁËELK ºÍFlumeÊÇÈçºÎ´¦ÀíÈÕÖ¾µÄ.Figure 1-9. Ingestion applicationÎÒÃÇÔÚ¼Ü¹¹ÖÐÊ¹ÓÃELK £¬ÒòÎªLEKµÄÈý¸ö²úÆ·ÎÞ·ì¼¯³É£¬ÄÜ¹»±ÈÊ¹ÓÃFlume¸øÎÒÃÇ¸ü¶àµÄ¼ÛÖµ ¡£»úÆ÷Ñ§Ï°»úÆ÷Ñ§Ï°Ó¦ÓÃ½ÓÊÕÊý¾ÝÁ÷£¬¹¹½¨ÍÆ¼öÒýÇæ¡£ÕâÒ»Ó¦ÓÃÊ¹ÓÃÒ»¸ö»ù±¾µÄËã·¨À´»ùÓÚSpark MLlib ½éÉÜ »úÆ÷Ñ§Ï°µÄ¸ÅÄî¡£Figure 1-10 Õ¹Ê¾ÁË¸Ã»úÆ÷Ñ§Ï°Ó¦ÓÃÈçºÎÊ¹ÓÃKafka ½ÓÊÕÊý¾Ý£¬È»ºó·¢ËÍ¸øSpark ´¦Àí,×îºóÔÚElasticSearch ½¨Á¢Ë÷ÒýÎª½«À´Ê¹ÓÃ×ö×¼±¸¡£Figure 1-10. Machine learning´¦ÀíÒýÇæ´¦ÀíÒýÇæÊÇ¸Ã¼Ü¹¹µÄÐÄÔà; Ëü½ÓÊÕ¸÷ÖÖÔ´µÄÊý¾Ý£¬´úÀíºÏÊÊÄ£ÐÍµÄ´¦Àí¡£
Figure 1-11 Õ¹Ê¾ÁËÓÉHive×é³ÉµÄ´¦ÀíÒýÇæÈçºÎ½ÓÊÕÊý¾Ý£¬ÒÔ¼°SparkµÄÊµÊ±/×¼ÊµÊ±´¦Àí¡£Figure 1-11. Processing engineÕâÀïÊ¹ÓÃKafka Óë Logstash½áºÏ°ÑÊý¾Ý·Ö·¢¸øElasticSearch. SparkÎ»ÓÚ Hadoop ¼¯ÈºµÄ¶¥¶Ë£¬ µ«²»Ëµ±ØÐëµÄ¡£ÎªÁË¼ò»¯Æð¼û£¬±¾Êé²»½¨Á¢ Hadoop¼¯Èº£¬¶øÊÇÒÔstandaloneÄ£Ê½ÔËÐÐSpark¡£ÏÔÈ»£¬Ó¦ÓÃÍ¬Ñù¿ÉÒÔ²¿ÊðÔÚËùÑ¡ÔñµÄHadoop ·¢²¼°æÉÏ¡£ËÑË÷ÒýÇæËÑË÷ÒýÇæ³ä·ÖÀûÓÃ´¦ÀíÒýÇæËù´¦ÀíµÄÊý¾Ý£¬Í¬Ê±±©Â¶³ö×¨ÓÐµÄRESTful APIÒÔ±ãÓÚ·ÖÎöÊ¹ÓÃ¡£

Mr.k ·¢±íÓÚ 2017-8-7 17:01:02

ºÜºÃµÄÎÄÕÂ

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

¼Ü¹¹´óÊý¾Ý·ÖÎöÓ¦ÓÃ