xioaxu790 ·¢±íÓÚ 2014-7-9 09:13:47

ΪʲôҪѧϰSpark£¿

±¾Ìû×îºóÓÉ pig2 ÓÚ 2014-7-10 00:58 ±à¼­

ÎÊÌâµ¼¶Á£º
1¡¢Ê²Ã´ÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸£¿
2¡¢ÓÐÕâô¶à´óÊý¾Ýƽ̨£¬ÎÒÃÇΪʲôҪѡÔñSpark£¿
3¡¢Spark±Èmapreduce¿ìµÄÔ­ÒòÊÇʲô£¿

static/image/hrline/4.gif


Ç°ÑÔ
½²µ½Spark£¬ÎÒÃÇÒªÏȽ²½«´óÊý¾Ý£¬ÒòΪSparkÊÇÒ»¸ö´¦Àí´óÊý¾ÝµÄƽ̨¡£ÄÇʲôÊÇ´óÊý¾ÝÄØ£¿´óÊý¾ÝÒ²³ÆΪº£Á¿Êý¾Ý£¬Í¨³£¶¼ÊÇÖ¸TG¼¶¡¢PB¼¶µÄÊý¾Ý£¬µ«ÊÇËæ×Åʱ¼äµÄÁ÷ÊźÍÑéÖ¤£¬Ò»Ð©ÈËÃǶԴóÊý¾ÝÒ²·¢ÉúÁ˹ÛÄîÉϵÄת±ä£¬¶øÊǰѶÔÆóÒµÓмÛÖµµÄÊý¾Ý³ÆΪ´óÊý¾Ý£¬Ëü²»Ò»¶¨´ó£¬µ«ÒªÓмÛÖµ¡£
      ½ü¶þÊ®ÄêÀ´£¬Ëæ׿ÆËã»ú¼¼ÊõºÍ»¥ÁªÍø¼¼ÊõµÄ¸ßËÙ·¢Õ¹£¬¼ÆËã»úÔڼǼ×ÅÈËÀàµÄÈÕ³£»î¶¯£¬ÈçÊÖ»úͨѶ¡¢ÍøÕ¾·ÃÎÊ¡¢Î¢²©ÁôÑÔ¡¢ÊÓƵÉÏ´«¡¢ÉÌÆ·ÂòÂô¡¢ÎïÁ÷ÔËËÍ¡£¡£¡££¬ÎÞ´¦²»ÔÚµÄÉç»á»î¶¯ºÍÉÌÒµ»î¶¯ÕýÔÚÔ´Ô´²»¶ÏµØ²úÉúן÷ÖÖ¸÷ÑùµÄÊý¾Ý£¬¶øÕâЩÊý¾ÝÕýÒÔ²»¿É˼ÒéµÄËٶȻýÀÛ×Å£¬´ÓGB¼¶Ïò×ÅTB¼¶¡¢PB¼¶·¢Õ¹¡£
      Ãæ¶ÔÈç´Ëº£Á¿µÄÊý¾Ý£¬Ò»·½ÃæÊÇÕâЩÐÅÏ¢Èçͬ¾Þ´óµÄ±¦²ØµÈ´ýÈËÃÇÈ¥ÍÚ¾ò£¬Èç¹ûÄÜÉÆÒÔÀûÓã¬ÕâЩÊý¾Ý½«Òýµ¼ÏÖÔÚÉç»áµÄ¿ÆÑкÍÉÌÒµ»î¶¯£¬½øÈëÒ»¸ö»Æ½ðʱ´ú£»ÁíÒ»·½Ã棬ÕâЩÊý¾ÝµÄѸÃÍ·¢Õ¹£¬ÌôÕ½×Å°üÀ¨Êý¾ÝÖÐÐÄ»ù´¡ÉèÊ©ºÍÊý¾Ý·ÖÎö»ù´¡¼Ü¹¹ÔÚÄÚµÄÊý¾Ý´¦ÀíµÄ¸÷¸ö»·½Ú¡£ÐÒÔ˵ÄÊÇ£¬½ü¼¸ÄêÔƼÆËã¼¼ÊõµÄ·¢Õ¹ºÍ¸÷ÖÖ¼ÆËã¿ò¼ÜµÄ³öÏÖ£¬Ê¹µÃ·ÖÎöºÍÕÆÎÕ´óÊý¾ÝÖÐÔ̲صÄÎÞ¾¡ÐÅÏ¢¡¢ÖªÊ¶¡¢Öǻ۳ÉΪ¿ÉÄÜ¡£

      ÏÂÃæÎÒÃÇ¿´¿´Á½¸öͼ£º



ÕâÊÇÒ»¸ögoogleµÄÑÛÇòÈÈÁ¦Í¼£¬Ê¹ÓÃרÓÃÉ豸¸ú×Ù²ÎÓëµ÷²éµÄ·ÃÎÊÕßµÄÑÛÇòÔÚÍøÒ³ÉϵÄÍ£Áô¹ì¼£¡£ÕâÖÖͼֱ½ÓÏÔʾÁËÓû§µÄÊÓ¾õÌåÑ顪¡ªËûÃÇÔÚÒ³ÃæµÄÄÄЩÇøÓòÍ£ÁôµÄʱ¼ä¸ü³¤¡£×¥×¡ÁËÕâÖÖ¹æÂÉ£¬¶ÔÓÚÆóÒµµÄ¹ã¸æͶ·ÅÓкÜÇ¿µÄÖ¸µ¼ÒâÒå¡£


ÁíÒ»¸öÊÇ΢²©µÄ´«²¥Í¼£¬¿ÉÒÔ¿´³ö΢²©µÄ´«²¥Í¾¾¶µÄ¹æÂÉ¡£

      ºÜÃ÷ÏÔ£¬Í¨¹ýÕâЩÊý¾ÝµÄ·ÖÎö£¬µÃµ½ÆäÖеĹæÂɺÍDZÔÚµÄÐÅÏ¢£¬ÎÒÃÇ¿ÉÒÔ¸üºÃµÄ½«ÓÐÏÞµÄ×ÊÔ´ÀûÓõ½¸üÓÐЧ¹ûµÄµØ·½¡£
      ÄÇôÈçºÎÈ¥ÍÚ¾òÕâЩÐÅÏ¢ÄØ£¿ÈÃÎÒÃÇ¿´¿´´óÊý¾Ý·ÖÎöƽ̨һÀÀͼ



      Ãæ¶ÔÁÕÀÅÂúÄ¿¡¢ÁîÈËÓÐЩÑÛ»¨çÔÂҵĸ÷ÖÖ²úÆ·£¬¸Ã×öºÎÖÖÑ¡Ôñ£¿ÎÒÃÇÑ¡ÔñÁËSpark£¬ÎªÊ²Ã´£¿

1£ºAll-In-OneµÄ½â¾ö·½°¸
      Ì¸µ½Spark£¬´ó¶àÊýµÄÈËÊ×ÏÈÏëµ½µÄÊÇÄÚ´æ¼ÆËã¿ò¼Ü£¬¼ÆËãËٶȺܿìµÈ¸ÅÄî¡£µ«¶ÔÓÚϵͳ¼Ü¹¹Ê¦»òITÐÅÏ¢²¿ÃÅÖ÷¹ÜÀ´Ëµ£¬¸üÎüÒýÆäÑÛ¹âµÄÓ¦¸ÃÊÇSparkµÄAll-In-OneµÄ½â¾ö·½°¸¡£ÎÒÃÇÀ´¿´¿´×îеÄSpark Stack£º



³ýÁ˺ËÐĵÄSpark Core EngineÍ⣬SparkÌṩÁËÓ¦ÓÃÔÚ²»Í¬³¡¾°ÉϵĴ¦Àí¹¤¾ß£º
Ó¦ÓÃÓÚÁ÷ʽ¼ÆËãµÄSpark Streaming
Ó¦ÓÃÓÚ¼´Ï¯²éѯ£¨Ad-hoc£©µÄSpark SQL
Ó¦ÓÃÓÚ»úÆ÷ѧϰ£¨Êý¾ÝÍÚ¾ò£©µÄMLlib
Ó¦ÓÃÓÚͼ´¦ÀíµÄGraphX
½«RÀ©Õ¹³É²¢ÐмÆËãµÄSparkR
»¹ÓÐȨºâ¾«¶ÈºÍËٶȵIJéѯÒýÇæBlinkDB
Spark1.0.0ÒѾ­ÔÚŬÁ¦Í³Ò»¹æ»®ÉÏÃæµÄ¸÷¸ö×é¼þ£¬Æä»ù´¡¾ÍÊÇRDD¡£Ëæ×ÅSparkÉú̬µÄÍêÉƺÍÀ©Õ¹£¬Spark½«ÄÜÓ¦¸¶¸÷ÖÖ´óÊý¾Ý´¦Àí³¡¾°¡£ÕâÒâζ×ŲÉÓÃSpark½«¼õÉÙÈËÁ¦ºÍ×ʽðµÄͶÈ룬½µµÍµÄϵͳµÄ¸´ÔÓÐÔ£¬¼õÇáά»¤µÄ¹¤×÷Á¿¡£



2£ºÌìÏÂÎ书£¬Î¨¿ì²»ÆÆ
ÔËÐÐËٶȿ죬¿ª·¢ËٶȿìÊÇSpark×îÒ«ÑÛµÄÌص㣺
SparkºÅ³ÆÔÚ´ÅÅÌÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ10±¶ÒÔÉÏ£¬ÔÚÄÚ´æÉϵÄÔËÐÐËÙ¶ÈÊÇMapReduceµÄ100ÒÔÉÏ£»Õâ²»½ö½öÊÇSparkÊÇ»ùÓÚÄÚ´æ¼ÆË㣬¸üÒòΪÊÇSpark²ÉÓÃÁËDAGËã·¨¼õÉÙÁË´óÁ¿µÄIO¿ªÏú¡£


SparkÓ¦ÓóÌÐòµÄ¿ª·¢Á¿±ÈMapReduceÉÙ2-5±¶


3£ºÑ¸ÃÍ·¢Õ¹µÄÇ÷ÊÆ


2009ÄêÓÉBerkeley¡¯s AMPLab¿ªÊ¼±àд×î³õµÄÔ´´úÂë
2010Ä꿪·ÅÔ´´úÂë
2013Äê6Ô½øÈëApache·õ»¯Æ÷ÏîÄ¿
2014Äê³ÉΪApacheµÄ¶¥¼¶ÏîÄ¿Ö®Ò»
Ä¿Ç°ÒѾ­ÓÐ30+¹«Ë¾100+¿ª·¢ÕßÔÚÌá½»´úÂë
Hadoop×î´óµÄ³§ÉÌClouderaÐû³Æ¼Ó´óSpark¿ò¼ÜµÄͶÈëÀ´È¡´úMapreduce
Hadoop³§ÉÌMapRͶÈëSparkÕóÓª
Apache mahout·ÅÆúMapReduce£¬½«Ê¹ÓÃSpark×÷ΪºóÐøËã×ӵļÆËãƽ̨
Spark1.0.0·¢²¼¡£¡£¡£







nanalxp ·¢±íÓÚ 2014-7-10 09:52:17

¶¥Ëû¶¥¶¥¶¥¡£{:soso_e179:}

quenlang ·¢±íÓÚ 2014-9-29 16:26:39

Å£²æ£¬ºöÈ»¸Ð¾õºÜÎÞÁ¦°¡£¬Ñ§ÁËÒ»ÖÖÓÖ³öÀ´Ò»ÖÖ

zhujun182104906 ·¢±íÓÚ 2014-12-16 17:42:04

ѧÎÞÖ¹¾³{:soso_e187:}

stone_nono ·¢±íÓÚ 2014-12-17 09:51:06

¶¥¶¥¶¥.............

8023K ·¢±íÓÚ 2014-12-27 14:23:19

ºÜϲ»¶¶ÁÕâÖֿƼ¼¿ÆÆÕÎÄ£¬¸øÂ¥Ö÷¶¥Ò»¸ö~

xalu ·¢±íÓÚ 2015-9-30 16:07:00

ûÓÐÐÂÒ»µãµÄ×ÊÁÏÂð

Ò»Õ½³ÉÃû ·¢±íÓÚ 2016-1-14 10:50:15

¸øÂ¥Ö÷¶¥Ò»¸ö

peterzor ·¢±íÓÚ 2016-1-14 11:55:29

markmark

liuqingup ·¢±íÓÚ 2016-1-14 13:23:58

×î½üÔÚѧϰ´óÊý¾ÝÏà¹ØµÄ֪ʶ£¬¶ÔÎÒÓÐÒ»¶¨µÄ°ïÖú£»
Ò³: [1] 2
²é¿´ÍêÕû°æ±¾: ΪʲôҪѧϰSpark£¿