ΪʲôҪѧϰSpark£¿
±¾Ìû×îºóÓÉ pig2 ÓÚ 2014-7-10 00:58 ±à¼ÎÊÌâµ¼¶Á£º
1¡¢Ê²Ã´ÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸£¿
2¡¢ÓÐÕâô¶à´óÊý¾Ýƽ̨£¬ÎÒÃÇΪʲôҪѡÔñSpark£¿
3¡¢Spark±Èmapreduce¿ìµÄÔÒòÊÇʲô£¿
static/image/hrline/4.gif
Ç°ÑÔ
½²µ½Spark£¬ÎÒÃÇÒªÏȽ²½«´óÊý¾Ý£¬ÒòΪSparkÊÇÒ»¸ö´¦Àí´óÊý¾ÝµÄƽ̨¡£ÄÇʲôÊÇ´óÊý¾ÝÄØ£¿´óÊý¾ÝÒ²³ÆΪº£Á¿Êý¾Ý£¬Í¨³£¶¼ÊÇÖ¸TG¼¶¡¢PB¼¶µÄÊý¾Ý£¬µ«ÊÇËæ×Åʱ¼äµÄÁ÷ÊźÍÑéÖ¤£¬Ò»Ð©ÈËÃǶԴóÊý¾ÝÒ²·¢ÉúÁ˹ÛÄîÉϵÄת±ä£¬¶øÊǰѶÔÆóÒµÓмÛÖµµÄÊý¾Ý³ÆΪ´óÊý¾Ý£¬Ëü²»Ò»¶¨´ó£¬µ«ÒªÓмÛÖµ¡£
½ü¶þÊ®ÄêÀ´£¬Ëæ׿ÆËã»ú¼¼ÊõºÍ»¥ÁªÍø¼¼ÊõµÄ¸ßËÙ·¢Õ¹£¬¼ÆËã»úÔڼǼ×ÅÈËÀàµÄÈÕ³£»î¶¯£¬ÈçÊÖ»úͨѶ¡¢ÍøÕ¾·ÃÎÊ¡¢Î¢²©ÁôÑÔ¡¢ÊÓƵÉÏ´«¡¢ÉÌÆ·ÂòÂô¡¢ÎïÁ÷ÔËËÍ¡£¡£¡££¬ÎÞ´¦²»ÔÚµÄÉç»á»î¶¯ºÍÉÌÒµ»î¶¯ÕýÔÚÔ´Ô´²»¶ÏµØ²úÉúן÷ÖÖ¸÷ÑùµÄÊý¾Ý£¬¶øÕâЩÊý¾ÝÕýÒÔ²»¿É˼ÒéµÄËٶȻýÀÛ×Å£¬´ÓGB¼¶Ïò×ÅTB¼¶¡¢PB¼¶·¢Õ¹¡£
Ãæ¶ÔÈç´Ëº£Á¿µÄÊý¾Ý£¬Ò»·½ÃæÊÇÕâЩÐÅÏ¢Èçͬ¾Þ´óµÄ±¦²ØµÈ´ýÈËÃÇÈ¥ÍÚ¾ò£¬Èç¹ûÄÜÉÆÒÔÀûÓã¬ÕâЩÊý¾Ý½«Òýµ¼ÏÖÔÚÉç»áµÄ¿ÆÑкÍÉÌÒµ»î¶¯£¬½øÈëÒ»¸ö»Æ½ðʱ´ú£»ÁíÒ»·½Ã棬ÕâЩÊý¾ÝµÄѸÃÍ·¢Õ¹£¬ÌôÕ½×Å°üÀ¨Êý¾ÝÖÐÐÄ»ù´¡ÉèÊ©ºÍÊý¾Ý·ÖÎö»ù´¡¼Ü¹¹ÔÚÄÚµÄÊý¾Ý´¦ÀíµÄ¸÷¸ö»·½Ú¡£ÐÒÔ˵ÄÊÇ£¬½ü¼¸ÄêÔƼÆËã¼¼ÊõµÄ·¢Õ¹ºÍ¸÷ÖÖ¼ÆËã¿ò¼ÜµÄ³öÏÖ£¬Ê¹µÃ·ÖÎöºÍÕÆÎÕ´óÊý¾ÝÖÐÔ̲صÄÎÞ¾¡ÐÅÏ¢¡¢ÖªÊ¶¡¢Öǻ۳ÉΪ¿ÉÄÜ¡£
ÏÂÃæÎÒÃÇ¿´¿´Á½¸öͼ£º
ÕâÊÇÒ»¸ögoogleµÄÑÛÇòÈÈÁ¦Í¼£¬Ê¹ÓÃרÓÃÉ豸¸ú×Ù²ÎÓëµ÷²éµÄ·ÃÎÊÕßµÄÑÛÇòÔÚÍøÒ³ÉϵÄÍ£Áô¹ì¼£¡£ÕâÖÖͼֱ½ÓÏÔʾÁËÓû§µÄÊÓ¾õÌåÑ顪¡ªËûÃÇÔÚÒ³ÃæµÄÄÄЩÇøÓòÍ£ÁôµÄʱ¼ä¸ü³¤¡£×¥×¡ÁËÕâÖÖ¹æÂÉ£¬¶ÔÓÚÆóÒµµÄ¹ã¸æͶ·ÅÓкÜÇ¿µÄÖ¸µ¼ÒâÒå¡£
ÁíÒ»¸öÊÇ΢²©µÄ´«²¥Í¼£¬¿ÉÒÔ¿´³ö΢²©µÄ´«²¥Í¾¾¶µÄ¹æÂÉ¡£
ºÜÃ÷ÏÔ£¬Í¨¹ýÕâЩÊý¾ÝµÄ·ÖÎö£¬µÃµ½ÆäÖеĹæÂɺÍDZÔÚµÄÐÅÏ¢£¬ÎÒÃÇ¿ÉÒÔ¸üºÃµÄ½«ÓÐÏÞµÄ×ÊÔ´ÀûÓõ½¸üÓÐЧ¹ûµÄµØ·½¡£
ÄÇôÈçºÎÈ¥ÍÚ¾òÕâЩÐÅÏ¢ÄØ£¿ÈÃÎÒÃÇ¿´¿´´óÊý¾Ý·ÖÎöƽ̨һÀÀͼ
Ãæ¶ÔÁÕÀÅÂúÄ¿¡¢ÁîÈËÓÐЩÑÛ»¨çÔÂҵĸ÷ÖÖ²úÆ·£¬¸Ã×öºÎÖÖÑ¡Ôñ£¿ÎÒÃÇÑ¡ÔñÁËSpark£¬ÎªÊ²Ã´£¿
1£ºAll-In-OneµÄ½â¾ö·½°¸
̸µ½Spark£¬´ó¶àÊýµÄÈËÊ×ÏÈÏëµ½µÄÊÇÄÚ´æ¼ÆËã¿ò¼Ü£¬¼ÆËãËٶȺܿìµÈ¸ÅÄî¡£µ«¶ÔÓÚϵͳ¼Ü¹¹Ê¦»òITÐÅÏ¢²¿ÃÅÖ÷¹ÜÀ´Ëµ£¬¸üÎüÒýÆäÑÛ¹âµÄÓ¦¸ÃÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸¡£ÎÒÃÇÀ´¿´¿´×îеÄSpark Stack£º
³ýÁ˺ËÐĵÄSpark Core EngineÍ⣬SparkÌṩÁËÓ¦ÓÃÔÚ²»Í¬³¡¾°ÉϵĴ¦Àí¹¤¾ß£º
Ó¦ÓÃÓÚÁ÷ʽ¼ÆËãµÄSpark Streaming
Ó¦ÓÃÓÚ¼´Ï¯²éѯ£¨Ad-hoc£©µÄSpark SQL
Ó¦ÓÃÓÚ»úÆ÷ѧϰ£¨Êý¾ÝÍÚ¾ò£©µÄMLlib
Ó¦ÓÃÓÚͼ´¦ÀíµÄGraphX
½«RÀ©Õ¹³É²¢ÐмÆËãµÄSparkR
»¹ÓÐȨºâ¾«¶ÈºÍËٶȵIJéѯÒýÇæBlinkDB
Spark1.0.0ÒѾÔÚŬÁ¦Í³Ò»¹æ»®ÉÏÃæµÄ¸÷¸ö×é¼þ£¬Æä»ù´¡¾ÍÊÇRDD¡£Ëæ×ÅSparkÉú̬µÄÍêÉƺÍÀ©Õ¹£¬Spark½«ÄÜÓ¦¸¶¸÷ÖÖ´óÊý¾Ý´¦Àí³¡¾°¡£ÕâÒâζ×ŲÉÓÃSpark½«¼õÉÙÈËÁ¦ºÍ×ʽðµÄͶÈ룬½µµÍµÄϵͳµÄ¸´ÔÓÐÔ£¬¼õÇáά»¤µÄ¹¤×÷Á¿¡£
2£ºÌìÏÂÎ书£¬Î¨¿ì²»ÆÆ
ÔËÐÐËٶȿ죬¿ª·¢ËٶȿìÊÇSpark×îÒ«ÑÛµÄÌص㣺
SparkºÅ³ÆÔÚ´ÅÅÌÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ10±¶ÒÔÉÏ£¬ÔÚÄÚ´æÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ100ÒÔÉÏ£»Õâ²»½ö½öÊÇSparkÊÇ»ùÓÚÄÚ´æ¼ÆË㣬¸üÒòΪÊÇSpark²ÉÓÃÁËDAGËã·¨¼õÉÙÁË´óÁ¿µÄIO¿ªÏú¡£
SparkÓ¦ÓóÌÐòµÄ¿ª·¢Á¿±ÈMapReduceÉÙ2-5±¶
3£ºÑ¸ÃÍ·¢Õ¹µÄÇ÷ÊÆ
2009ÄêÓÉBerkeley¡¯s AMPLab¿ªÊ¼±àд×î³õµÄÔ´´úÂë
2010Ä꿪·ÅÔ´´úÂë
2013Äê6Ô½øÈëApache·õ»¯Æ÷ÏîÄ¿
2014Äê³ÉΪApacheµÄ¶¥¼¶ÏîÄ¿Ö®Ò»
Ä¿Ç°ÒѾÓÐ30+¹«Ë¾100+¿ª·¢ÕßÔÚÌá½»´úÂë
Hadoop×î´óµÄ³§ÉÌClouderaÐû³Æ¼Ó´óSpark¿ò¼ÜµÄͶÈëÀ´È¡´úMapreduce
Hadoop³§ÉÌMapRͶÈëSparkÕóÓª
Apache mahout·ÅÆúMapReduce£¬½«Ê¹ÓÃSpark×÷ΪºóÐøËã×ӵļÆËãƽ̨
Spark1.0.0·¢²¼¡£¡£¡£
¶¥Ëû¶¥¶¥¶¥¡£{:soso_e179:} Å£²æ£¬ºöÈ»¸Ð¾õºÜÎÞÁ¦°¡£¬Ñ§ÁËÒ»ÖÖÓÖ³öÀ´Ò»ÖÖ Ñ§ÎÞÖ¹¾³{:soso_e187:} ¶¥¶¥¶¥............. ºÜϲ»¶¶ÁÕâÖֿƼ¼¿ÆÆÕÎÄ£¬¸øÂ¥Ö÷¶¥Ò»¸ö~ ûÓÐÐÂÒ»µãµÄ×ÊÁÏÂð ¸øÂ¥Ö÷¶¥Ò»¸ö markmark ×î½üÔÚѧϰ´óÊý¾ÝÏà¹ØµÄ֪ʶ£¬¶ÔÎÒÓÐÒ»¶¨µÄ°ïÖú£»
Ò³:
[1]
2