·ÖÏí

ΪʲôҪѧϰSpark£¿

±¾Ìû×îºóÓÉ pig2 ÓÚ 2014-7-10 00:58 ±à¼­
ÎÊÌâµ¼¶Á£º
1¡¢Ê²Ã´ÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸£¿

2¡¢ÓÐÕâô¶à´óÊý¾Ýƽ̨£¬ÎÒÃÇΪʲôҪѡÔñSpark£¿

3¡¢Spark±Èmapreduce¿ìµÄÔ­ÒòÊÇʲô£¿




Ç°ÑÔ
½²µ½Spark£¬ÎÒÃÇÒªÏȽ²½«´óÊý¾Ý£¬ÒòΪSparkÊÇÒ»¸ö´¦Àí´óÊý¾ÝµÄƽ̨¡£ÄÇʲôÊÇ´óÊý¾ÝÄØ£¿´óÊý¾ÝÒ²³ÆΪº£Á¿Êý¾Ý£¬Í¨³£¶¼ÊÇÖ¸TG¼¶¡¢PB¼¶µÄÊý¾Ý£¬µ«ÊÇËæ×Åʱ¼äµÄÁ÷ÊźÍÑéÖ¤£¬Ò»Ð©ÈËÃǶԴóÊý¾ÝÒ²·¢ÉúÁ˹ÛÄîÉϵÄת±ä£¬¶øÊǰѶÔÆóÒµÓмÛÖµµÄÊý¾Ý³ÆΪ´óÊý¾Ý£¬Ëü²»Ò»¶¨´ó£¬µ«ÒªÓмÛÖµ¡£
        ½ü¶þÊ®ÄêÀ´£¬Ëæ׿ÆËã»ú¼¼ÊõºÍ»¥ÁªÍø¼¼ÊõµÄ¸ßËÙ·¢Õ¹£¬¼ÆËã»úÔڼǼ×ÅÈËÀàµÄÈÕ³£»î¶¯£¬ÈçÊÖ»úͨѶ¡¢ÍøÕ¾·ÃÎÊ¡¢Î¢²©ÁôÑÔ¡¢ÊÓƵÉÏ´«¡¢ÉÌÆ·ÂòÂô¡¢ÎïÁ÷ÔËËÍ¡£¡£¡££¬ÎÞ´¦²»ÔÚµÄÉç»á»î¶¯ºÍÉÌÒµ»î¶¯ÕýÔÚÔ´Ô´²»¶ÏµØ²úÉúן÷ÖÖ¸÷ÑùµÄÊý¾Ý£¬¶øÕâЩÊý¾ÝÕýÒÔ²»¿É˼ÒéµÄËٶȻýÀÛ×Å£¬´ÓGB¼¶Ïò×ÅTB¼¶¡¢PB¼¶·¢Õ¹¡£
        Ãæ¶ÔÈç´Ëº£Á¿µÄÊý¾Ý£¬Ò»·½ÃæÊÇÕâЩÐÅÏ¢Èçͬ¾Þ´óµÄ±¦²ØµÈ´ýÈËÃÇÈ¥ÍÚ¾ò£¬Èç¹ûÄÜÉÆÒÔÀûÓã¬ÕâЩÊý¾Ý½«Òýµ¼ÏÖÔÚÉç»áµÄ¿ÆÑкÍÉÌÒµ»î¶¯£¬½øÈëÒ»¸ö»Æ½ðʱ´ú£»ÁíÒ»·½Ã棬ÕâЩÊý¾ÝµÄѸÃÍ·¢Õ¹£¬ÌôÕ½×Å°üÀ¨Êý¾ÝÖÐÐÄ»ù´¡ÉèÊ©ºÍÊý¾Ý·ÖÎö»ù´¡¼Ü¹¹ÔÚÄÚµÄÊý¾Ý´¦ÀíµÄ¸÷¸ö»·½Ú¡£ÐÒÔ˵ÄÊÇ£¬½ü¼¸ÄêÔƼÆËã¼¼ÊõµÄ·¢Õ¹ºÍ¸÷ÖÖ¼ÆËã¿ò¼ÜµÄ³öÏÖ£¬Ê¹µÃ·ÖÎöºÍÕÆÎÕ´óÊý¾ÝÖÐÔ̲صÄÎÞ¾¡ÐÅÏ¢¡¢ÖªÊ¶¡¢Öǻ۳ÉΪ¿ÉÄÜ¡£

        ÏÂÃæÎÒÃÇ¿´¿´Á½¸öͼ£º
1.jpg


ÕâÊÇÒ»¸ögoogleµÄÑÛÇòÈÈÁ¦Í¼£¬Ê¹ÓÃרÓÃÉ豸¸ú×Ù²ÎÓëµ÷²éµÄ·ÃÎÊÕßµÄÑÛÇòÔÚÍøÒ³ÉϵÄÍ£Áô¹ì¼£¡£ÕâÖÖͼֱ½ÓÏÔʾÁËÓû§µÄÊÓ¾õÌåÑ顪¡ªËûÃÇÔÚÒ³ÃæµÄÄÄЩÇøÓòÍ£ÁôµÄʱ¼ä¸ü³¤¡£×¥×¡ÁËÕâÖÖ¹æÂÉ£¬¶ÔÓÚÆóÒµµÄ¹ã¸æͶ·ÅÓкÜÇ¿µÄÖ¸µ¼ÒâÒå¡£
2.jpg

ÁíÒ»¸öÊÇ΢²©µÄ´«²¥Í¼£¬¿ÉÒÔ¿´³ö΢²©µÄ´«²¥Í¾¾¶µÄ¹æÂÉ¡£

        ºÜÃ÷ÏÔ£¬Í¨¹ýÕâЩÊý¾ÝµÄ·ÖÎö£¬µÃµ½ÆäÖеĹæÂɺÍDZÔÚµÄÐÅÏ¢£¬ÎÒÃÇ¿ÉÒÔ¸üºÃµÄ½«ÓÐÏÞµÄ×ÊÔ´ÀûÓõ½¸üÓÐЧ¹ûµÄµØ·½¡£
        ÄÇôÈçºÎÈ¥ÍÚ¾òÕâЩÐÅÏ¢ÄØ£¿ÈÃÎÒÃÇ¿´¿´´óÊý¾Ý·ÖÎöƽ̨һÀÀͼ
3.jpg


        Ãæ¶ÔÁÕÀÅÂúÄ¿¡¢ÁîÈËÓÐЩÑÛ»¨çÔÂҵĸ÷ÖÖ²úÆ·£¬¸Ã×öºÎÖÖÑ¡Ôñ£¿ÎÒÃÇÑ¡ÔñÁËSpark£¬ÎªÊ²Ã´£¿

1£ºAll-In-OneµÄ½â¾ö·½°¸
        Ì¸µ½Spark£¬´ó¶àÊýµÄÈËÊ×ÏÈÏëµ½µÄÊÇÄÚ´æ¼ÆËã¿ò¼Ü£¬¼ÆËãËٶȺܿìµÈ¸ÅÄî¡£µ«¶ÔÓÚϵͳ¼Ü¹¹Ê¦»òITÐÅÏ¢²¿ÃÅÖ÷¹ÜÀ´Ëµ£¬¸üÎüÒýÆäÑÛ¹âµÄÓ¦¸ÃÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸¡£ÎÒÃÇÀ´¿´¿´×îеÄSpark Stack£º
4.jpg


³ýÁ˺ËÐĵÄSpark Core EngineÍ⣬SparkÌṩÁËÓ¦ÓÃÔÚ²»Í¬³¡¾°ÉϵĴ¦Àí¹¤¾ß£º
Ó¦ÓÃÓÚÁ÷ʽ¼ÆËãµÄSpark Streaming
Ó¦ÓÃÓÚ¼´Ï¯²éѯ£¨Ad-hoc£©µÄSpark SQL
Ó¦ÓÃÓÚ»úÆ÷ѧϰ£¨Êý¾ÝÍÚ¾ò£©µÄMLlib
Ó¦ÓÃÓÚͼ´¦ÀíµÄGraphX
½«RÀ©Õ¹³É²¢ÐмÆËãµÄSparkR
»¹ÓÐȨºâ¾«¶ÈºÍËٶȵIJéѯÒýÇæBlinkDB
Spark1.0.0ÒѾ­ÔÚŬÁ¦Í³Ò»¹æ»®ÉÏÃæµÄ¸÷¸ö×é¼þ£¬Æä»ù´¡¾ÍÊÇRDD¡£Ëæ×ÅSparkÉú̬µÄÍêÉƺÍÀ©Õ¹£¬Spark½«ÄÜÓ¦¸¶¸÷ÖÖ´óÊý¾Ý´¦Àí³¡¾°¡£ÕâÒâζ×ŲÉÓÃSpark½«¼õÉÙÈËÁ¦ºÍ×ʽðµÄͶÈ룬½µµÍµÄϵͳµÄ¸´ÔÓÐÔ£¬¼õÇáά»¤µÄ¹¤×÷Á¿¡£
5.jpg


2£ºÌìÏÂÎ书£¬Î¨¿ì²»ÆÆ
ÔËÐÐËٶȿ죬¿ª·¢ËٶȿìÊÇSpark×îÒ«ÑÛµÄÌص㣺
SparkºÅ³ÆÔÚ´ÅÅÌÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ10±¶ÒÔÉÏ£¬ÔÚÄÚ´æÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ100ÒÔÉÏ£»Õâ²»½ö½öÊÇSparkÊÇ»ùÓÚÄÚ´æ¼ÆË㣬¸üÒòΪÊÇSpark²ÉÓÃÁËDAGËã·¨¼õÉÙÁË´óÁ¿µÄIO¿ªÏú¡£
6.jpg

SparkÓ¦ÓóÌÐòµÄ¿ª·¢Á¿±ÈMapReduceÉÙ2-5±¶


3£ºÑ¸ÃÍ·¢Õ¹µÄÇ÷ÊÆ
7.jpg

2009ÄêÓÉBerkeley¡¯s AMPLab¿ªÊ¼±àд×î³õµÄÔ´´úÂë
2010Ä꿪·ÅÔ´´úÂë
2013Äê6Ô½øÈëApache·õ»¯Æ÷ÏîÄ¿
2014Äê³ÉΪApacheµÄ¶¥¼¶ÏîÄ¿Ö®Ò»
Ä¿Ç°ÒѾ­ÓÐ30+¹«Ë¾100+¿ª·¢ÕßÔÚÌá½»´úÂë
Hadoop×î´óµÄ³§ÉÌClouderaÐû³Æ¼Ó´óSpark¿ò¼ÜµÄͶÈëÀ´È¡´úMapreduce
Hadoop³§ÉÌMapRͶÈëSparkÕóÓª
Apache mahout·ÅÆúMapReduce£¬½«Ê¹ÓÃSpark×÷ΪºóÐøËã×ӵļÆËãƽ̨
Spark1.0.0·¢²¼¡£¡£¡£







ÒÑÓÐ(10)ÈËÆÀÂÛ

Ìøתµ½Ö¸¶¨Â¥²ã
nanalxp ·¢±íÓÚ 2014-7-10 09:52:17
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

quenlang ·¢±íÓÚ 2014-9-29 16:26:39
Å£²æ£¬ºöÈ»¸Ð¾õºÜÎÞÁ¦°¡£¬Ñ§ÁËÒ»ÖÖÓÖ³öÀ´Ò»ÖÖ
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

zhujun182104906 ·¢±íÓÚ 2014-12-16 17:42:04
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

8023K ·¢±íÓÚ 2014-12-27 14:23:19
ºÜϲ»¶¶ÁÕâÖֿƼ¼¿ÆÆÕÎÄ£¬¸øÂ¥Ö÷¶¥Ò»¸ö~
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

xalu ·¢±íÓÚ 2015-9-30 16:07:00
ûÓÐÐÂÒ»µãµÄ×ÊÁÏÂð
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

Ò»Õ½³ÉÃû ·¢±íÓÚ 2016-1-14 10:50:15
¸øÂ¥Ö÷¶¥Ò»¸ö
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

liuqingup ·¢±íÓÚ 2016-1-14 13:23:58
×î½üÔÚѧϰ´óÊý¾ÝÏà¹ØµÄ֪ʶ£¬¶ÔÎÒÓÐÒ»¶¨µÄ°ïÖú£»
»Ø¸´

ʹÓõÀ¾ß ¾Ù±¨

12ÏÂÒ»Ò³
ÄúÐèÒªµÇ¼ºó²Å¿ÉÒÔ»ØÌû µÇ¼ | Á¢¼´×¢²á

±¾°æ»ý·Ö¹æÔò

¹Ø±Õ

ÍƼöÉÏÒ»Ìõ /2 ÏÂÒ»Ìõ