¹«Ë¾ÔÚ»úÆ÷Ñ§Ï°ÒµÎñ·½ÃæÇãÏòÊ¹ÓÃ R + Hadoop ·½°¸²¢Ã»ÓÐÏëÏóÄÇÃ´ºÃ-´óÊý¾ÝÑ§Ï°-AboutÔÆ-ËóÂ×¿Æ¼¼

sstutu ·¢±íÓÚ 2015-5-3 14:03:11

¹«Ë¾ÔÚ»úÆ÷Ñ§Ï°ÒµÎñ·½ÃæÇãÏòÊ¹ÓÃ R + Hadoop ·½°¸²¢Ã»ÓÐÏëÏóÄÇÃ´ºÃ

ÎÊÌâµ¼¶Á

1.±¾ÎÄÈÏÎªRµÄÓ¦ÓÃ³¡¾°ÊÇÊ²Ã´£¿ÄãÊÇÈçºÎÈÏÎªµÄ£¿
2.×÷ÕßÈÏÎªR+Hadoop¿´ÆðÀ´ºÜÃÀ£¬ÊµÔòÀ§ÄÑÖØÖØ£¬ÄãÊÇÔõÃ´ÈÏÎªµÄ£¿
3.´óÊý¾Ý·ÖÎöµÄÆ¿¾±ÔÚÄÄ£¿

static/image/hrline/4.gif

ÖÚËùÖÜÖª,R ÔÚ½â¾öÍ³¼ÆÑ§ÎÊÌâ·½ÃæÎÞÓëÂ×±È¡£µ«ÊÇ R ÔÚÊý¾ÝÁ¿´ïµ½ 2G ÒÔÉÏËÙ¶È¾ÍºÜÂýÁË£¬ÓÚÊÇ¾Í´ßÉú³öÁËÓë Hadoop Ïà½áºÏÅÜ·Ö²¼Ê½Ëã·¨ÕâÖÖ½â¾ö·½°¸£¬µ«ÊÇ£¬python+Hadoop ÕâÑùµÄ½â¾ö·½°¸ÓÐÃ»ÓÐÍÅ¶ÓÔÚÊ¹ÓÃ£¿R ÕâÑùÆðÔ´ÓÚÍ³¼ÆÑ§µÄ¼ÆËã»ú°üÓë Hadoop Ïà½áºÏ»á²»»á³öÎÊÌâ£¿

RµÄÓ¦ÓÃ³¡¾°²»ÔÚÓÚÎÞÓëÂ×±ÈµÄÍ³¼ÆÑ§Ï°ÄÜÁ¦£¬¶øÔÚÓÚ½á¹¹»¯Êý¾ÝÏÂÎÞÓëÂ×±ÈµÄµ¥Î»´úÂë²ú³öÁ¿¡£Éñ¾ÍøÂç£¬¾ö²ßÊ÷µÈ»ùÓÚ½á¹¹»¯Êý¾ÝµÄËã·¨Ò»ÐÐ´úÂë¸ã¶¨£¬Ô¤²âÓÖÖ»ÊÇÒ»ÐÐ´úÂë¡£ÕâÑù£¬ÉÌÒµÊý¾Ý¿â£¨Èç°üÀ¨Oracle£¬Netezza£¬Teradata£¬SAP HANAµÈ£©Ìá¹©ÁËR½Ó¿Ú¹©Í³¼Æ·ÖÎöÈËÔ±½øÐÐ¸ßÐ§ÊµÊ©¡£ Í¬ÑùµÄ£¬SASºÍIBM SPSSÒ²×öµ½ÁËÒ»²¿·Ö¸ßÐ§ÊµÊ©ÄÜÁ¦£¬ËûÃÇÃ»ÓÐµÄÊÇR¶ÀÓÐµÄÅÓ´ócran packagesÈº¡£µ«ÏàËÆµÄÒ»µãÊÇ£¬RµÄpackageÈºÒ²°ÑËüµÄÓÃ»§¹ß»µÁË£¬¹ß»µµ½ÕâÐ©ÈËÖ»ÊÇ¾õµÃÕâÊÇÒ»¸öSAS»òÕßSPSSµÄÃâ·Ñ°æ£¬¶ø²»ÊÇÈ¥Í¨¹ý´úÂëÑ§Ï°ÈçºÎ×ö»úÆ÷Ñ§Ï°ÄÄÅÂÒ»µãµãºËÐÄÔÀí¡£ÄãÒª×öµÄ£¬¾ÍÊÇ¸ßÐ§µÄ×îÐÂ½á¹¹»¯Êý¾ÝËã·¨µÄÊµÊ©¡£

×îÖØÒªµÄÊÇ£¬´ÓHadoopÉÏµÄÊý¾Ý¼ÓÔØµ½ÕâÐ©¿â£¬²»½ö±£Ö¤ÁËÊý¾Ý±¾ÉíµÄÕýÈ·ÐÔºÍ½á¹¹»¯£¬Ò²ÒÑ¾±£Ö¤ÁËÊý¾ÝÄ£ÐÍµÄµÚ¶þ¡¢µÚÈý·¶Ê½»¯£¨CAErwinµÄµÚÒ»¿Î£©£¬Ïë×öÈÎºÎÒ»¸ö·ÖÎö£¬ÄãÊÖ±ßµÄÊý¾Ý¿â¼òµ¥µÄjoin¾ÍÐÎ³ÉÁËÄãÐèÒªµÄ·ÖÎö¿í±í¡£ÏëÏëSQLÀïsum overµÄÉè¼Æº¬Òå£ºÎªÊ²Ã´ËüÒªÖÆÔìÊý¾ÝµÄÈßÓà£¿ÄÇÒ»¶¨ÊÇÎªÁËBI»òÕß·ÖÎö´æÔÚµÄ¡£

Hadoop£º

HadoopµÄÓ¦ÓÃ³¡¾°²»ÔÚÓÚ¸øÍ³¼Æ·ÖÎöÈí¼þÌá¹©Ç¿Á¦µÄÖ§³Ö£¬¶øÖ»ÊÇÌá¹©ÁËÒ»¸ö·Ö²¼Ê½Êý¾ÝµÄ·ºÓÃÃâ·Ñ¿ò¼Ü£¬»ùÓÚ¼üÖµ¶Ô£¨key value pair£©¸ßÐ§µÄ¶ÔÔÊ¼·Ç½á¹¹»¯Êý¾Ý½øÐÐ´æ´¢¡£
´«Í³·½Ê½ÏÂÄ¿²â¿ÉÒÔ×öµ½¶ÔÁ¬ÐøÐÍÊýÖµ¡¢ÀëÉ¢ÐÍÊýÖµ¡¢×Ö·û´®¡¢´óÐÍ×Ö·û´®BLOB¡¢µØÀíÐÅÏ¢£¨¶þÎ¬µã£¬¶à±ßÐÎ£©µÄ´æ´¢£¬HadoopÏàµ±ÓÚÖ±½Ó°ÑºÜ¶à¹¦ÄÜÀ©Õ¹£º±ÈÈçHive×÷ÎªÒ»¸ö»ù±¾¹¤¾ß£¬Ö±½ÓÌá¹©ÁË¸ü¹ã·ºµÄÊý¾ÝÀàÐÍ´æ´¢·½°¸£ºÊý×é(array)£¬½á¹¹Ìå(struct)£¬¼üÖµ¶Ô(map)µÈ¡£
ÒµÎñ³¡¾°£ºÎÒ´æ´¢Ò»ÆªÎÄÕÂ²»ÔÙÐèÒªÒ»ÛçÎÄ×Ö¹à½øÈ¥£¬ÏÈ×öNLP½âÎö£¬È»ºóÐÎ³É (´Ê,´ÊÐÔ)µÄÔª×é£¬ÔÙ×é³É³¤Êý×é(Array)¼´¿É·½±ãµÄ´æ´¢¡¢·ÖÎö£¬ÒÔ¼°ÀûÓÃÄÚÖÃUDF¡¢×ÔÐ´UDF¶Ô¸´ÔÓ½á¹¹ÐÐ×ªÁÐ£¬ÌáÈ¡ÐÅÏ¢¡££¨µ±È»£¬½«NLP½âÎö±¾ÉíÕûºÏÔÚUDFÉõÖÁËã·¨ÖÐ¶¼ÊÇ¿ÉÐÐµÄ£¬ÈçPySpark£©

------------------------
*2014.8¸Ä½øËµÃ÷£º
Èç¹ûÄãÖÁ½ñ¾õµÃ·Ç½á¹¹»¯Êý¾Ý£¬¼üÖµ¶ÔÊÇÒ»ÖÖÂôÅª¸ÅÄî£¬ÎÒ¾Í»»Ò»¸öÖÁ¼òµÄËµ·¨£ºÒ»¸öÖ»ÓÐÁ½ÁÐµÄÊý¾Ý±í¡£Á½ÁÐµÄmn*2ºÍ¶àÁÐm*nÊý¾Ý±íÊÇ¿ÉÒÔÔÚÒ»¶¨¼Ó¹¤´ú¼ÛÏÂ»¥×ªµÄ¡£ÕâÖÖÊý¾Ý½á¹¹±»´óÁ¿Ó¦ÓÃÓÚJava£¬C++£¬PythonÉõÖÁJavaScriptÖÐ£¬µ±Äã¿´¼ûÀàËÆHashmap£¬Hashtable£¬dict£¬mapµÈ×ÖÑÛ£¬ÄÇ¾ÍÊÇÕâ»õÃ»ÅÜÁË£º¾¹ýÉè¼Æ£¬ÓÃÓÚ´æ´¢µÄ¼ü(key)±»É¢ÁÐºó¾ö¶¨ÁËËüÄÜ¹»±»¾ùÔÈµØ·Ö²¼Ê½´æ´¢£¬Öµ(value)ÊÇ¼üµÄ¸ú°à£¬Ëæ×Å¼ü±»´æ´¢¡£

¶ÔÓÚ·Ç½á¹¹»¯Êý¾Ý¶øÑÔ£¬ÔªÊý¾ÝºÍÊý¾Ý²»Ïñ·½±í£¬¼«ÆäÈÝÒ×³éÏó³öÀ´£¨ÎÞ·Ç¾ÍÊÇÁÐÃûºÍ·½±íµÄÄÚÈÝ£©¡£³õ¿´Ò»¸ö°ë½á¹¹»¯µÄJson/XML£¬ÔªÊý¾Ý³öÏÖÔÚ¼ü(key)ÖÐ£¬Êý¾Ý³öÏÖÔÚÖµ(value)ÖÐ£¬ÈÝÒ×Àí½â¡£µ«ÔÚ½âÎöÆäËûÀàÐÍÊý¾Ý£¬(ÈçÍøÂçÈÕÖ¾Url)£¬¼üÀïµÄËùÎ½ÔªÊý¾Ý²ÅÊÇÒª·ÖÎöµÄ¶ÔÏó(Ò»¸öÓÃ»§·´¸´µÄÊ¹ÓÃprice=xxx×ö²éÑ¯Ìõ¼þ£¬ËµÃ÷¼Û¸ñÃô¸Ð£¬ÓÐ¿ÉÄÜxxxÈ¡ÁËºÃ¶àÖµÉõÖÁËùÓÐ¿ÉÄÜÖµ£¬keyÈ´ºÜÉÙ£¬¿ÉÄÜÖ»ÓÐpriceºÍbrand£»´ËÊ±ÓÃ»§ÐÐÎªÄ£Ê½³öÏÖÔÚkeyÀïÁË¡£)
------------------------

½á¹¹»¯ºÍ·Ç½á¹¹»¯Êý¾Ý¿â½áºÏµÄR+Hadoop¿´ÆðÀ´ºÜÃÀ£¬ÊµÔòÀ§ÄÑÖØÖØ¡£ÎÒµÄ¿´·¨ÊÇ£¬ÈÎºÎÒ»¼ÒÔÚÊý¾Ý·ÖÎöÁìÓò£¨ÎÄ±¾ÍÚ¾òÔÝÊ±³ýÍâ£¬ÀíÓÉÔÚÒµÎñ³¡¾°ÀïÃèÊö¹ý£©¾ö¶¨ÒÔÒ»¸öÎÈ½¡µÄÌ¬¶ÈÉæ×ãµÄÆóÒµ£¬¶¼ÎÞÒ»ÀýÍâµÄ»ùÓÚÊý¾ÝÇ¿Ò»ÖÂÐÔµÄ¿¼ÂÇ£¬Ñ¡Ôñ´«Í³µÄ½á¹¹»¯Êý¾Ý¿â×÷ÎªºóÐø½á¹¹»¯·ÖÎöµÄÒÀÍÐ¡ª¡ª ÄÄÅÂËûÃÇÊÇÊÕ·ÑµÄ¡£Èç¹ûÏ°¹ß´úÂë¿ª·¢£¬Hadoop+python×Ô¼º×ö³õ²½µÄÊý¾Ý´¦Àí£¬¶øºóÊ¹ÓÃ»ùÓÚjavaµÄMahoutÊÇÒ»¸öºÜ×ÔÈ»µÄÑ¡Ôñ£ºÆäÌá¹©µÄ¾ØÕó¼ÆËã£¨SVD£©£¬µü´úÊ½¾ÛÀàËã·¨(ÈçKmeans)£¬»ùÓÚÍ¼µÄµü´úÄ£ÐÍ£¨Ò»¸öÀý×ÓÊÇPageRankËã·¨£¬ÖµÖÐ´æµÄÒ²ÊÇKey£©£¬ÒÔ¼°¼¯³É¾ö²ßÊ÷µÈÄ£ÐÍ£¬ÔÚ·Ö²¼Ê½³¡¾°ÏÂÊÇË³Àí³ÉÕÂÍê³ÉµÄ£¬¶øRÔò»áÏñÒ»¸ö¸ú°à£¬ºÜÄÑÕÒµ½ËüµÄÓ¦ÓÃ³¡¾°¡£Ò»Ñù¾ßÓÐ½Ï¸ß±àÂëÐ§ÂÊµÄPython¿ÉÒÔ¸ü¼ÓÁé»î¡¢ÓÅÃÀ£¨Ëõ½øµÄÒâÒåÉÏ£©µÄ¼Ì³ÐmrjobÀàÍê³ÉÏàÓ¦¹¦ÄÜ£¬ÔÚÊý¾Ý³¢ÊÔÐÔÌ½Ë÷ÕâÒ»²½£¬matplotlib²ú³ö±¨¸æ¿ÖÅÂÊÇ²»ÈçR+knitr+ggplot2¸üÄÜÈ¡ÔÃÀÏ°å£¬µ«Ò»µ©ÐèÒª½×¶ÎÐÔµÄ²âÊÔ£¬PythonÕâÖÖ½ºË®ÓïÑÔ»òÕßÒ»²½µ½Î»µÄÊ¹ÓÃJava¿ª·¢ÏÔµÃ¸ü½ÓµØÆø£¬¸üÈÝÒ×ÂäµØ¡£

£¨¹ØÓÚÂäµØÐÔ£¬ÔÙÐ¡Ð¡ÍÂ²ÛÒ»ÏÂRÔÚWindowsºÍLinuxÁ½¸öÆ½Ì¨ÏÂÄÜ¹»Ê¹ÓÃµÄ°ü·¶Î§ÊÇ²»Í¬µÄ£¬ÓÈÆäÊÇÊ¹ÓÃRcpp»òÕß²¢ÐÐ°üµÄÊ±ºò¡£PythonºÍJavaÔò²»³£¼ûµ½ÕâÖÖÎÊÌâ£©

R+HadoopµÄ»Ã¾õ£º

²»¹ÜÊ²Ã´ºÍHadoop½áºÏ£¬¶¼Ï²»¶ÒÔword countÕâÖÖµäÐÍµÄ¼üÖµ¶Ô¿ªÊ¼¡£ÊÂÊµÉÏR¿ÉÒÔ×öÕâ¼þÊÂ£¬µ«ÊÇ¾õµÃR×öµÄÎÞÓëÂ×±È£¬¾ÍÓÐµã½øÈëÎóÇø¡£»¹ÊÇÄÇ¾äRµÄÃÀÔÚÓÚ½á¹¹»¯Êý¾ÝÏÂÎÞÓëÂ×±ÈµÄµ¥Î»´úÂë²ú³öÁ¿¡£Ò»µ©Äã·¢ÏÖÄã×÷Îª×¨×¢ÓÚÊý¾ÝµÄ·ÖÎöÊ¦£¬Í¬Ê±Ò²ÊÇÒ»¸ö²¢²»¹Ç»ÒµÄ´úÂë¿ª·¢Õß£¬¿ªÊ¼ÓÃR²Ù×÷ÁÐ±íºÍÊý¾Ý½á¹¹£¬¿ªÊ¼ÓÃRÖØÐ´MapperºÍReducer£¬Äã¾Í»á²úÉúÒ»¸öÒÉÎÊ£º

ÎªÂï²»Ñ§Java¡¢Python£¿ÕâÖÖ·ÖÎö¡°²»´«Í³¡±£¬¾ÍËãÄã²»ÏëÑ§°É£¬ÎªÂï²»ÕÒ¶®ËüÃÇµÄÈËÀ´¸É£¿

Python»ùÓÚ¼üÖµ¶Ô´æ´¢£¬Ò²¾ßÓÐÏàµ±¸ßµÄµ¥Î»´úÂë²ú³öÁ¿£¬Ò²ÓÐºÜ¶à¿ÆÑ§¼ÆËã°ü¡£´ÓÕâ¸öÒâÒåÉÏÄã¿ÉÒÔ×ö³öÒ»¸ö°×Ïä£¬µ¥»úËõË®°æµÄmahout£¬¶øÇÒÊÊºÏ´¦ÀíÓÐÔöÁ¿Ëã·¨µÄ´óÊý¾ÝÑ§Ï°£¨¿´¿´NumPy,SciPy,£©¡£Ò»ÑùÃâ·Ñ¡£

Êý¾ÝÍÚ¾òµÄ»Ã¾õ£º

Êý¾ÝÍÚ¾òÊÇÊ²Ã´£¬ºÜÄÑÂð£¿
¹ãÒåµÄÊý¾ÝÍÚ¾ò£¬°üÀ¨Êý¾Ý·ÖÎöºÍ»úÆ÷Ñ§Ï°£¬Ö»Ëµ×îºËÐÄµÄÊýÑ§¸ÅÄîµÄ»°£¬¹À¼Æ¾Í¼¸¾ä»°£»Ç¡ºÃRµÄ¼ò½àÐÔÒ²ÊÇÄÜÓÃ¼¸¾ä»°×öÍêÕâ¼¸¾ä»°µÄ£º

0 Êý¾ÝÇåÏ´£¬±ê×¼»¯¡£ºÍ1-4£¬Àí½âÕæÊµÊÀ½çÊÇÏà¸¨Ïà³ÉµÄ

1 ×îÏÈÑ§µÄÊýÑ§¼¼ÇÉÊÇ¿Õ¼ä·Ö½â£ºLL'£¬PCA£¬SVD£¬Ò»°ã»Ø¹éÒÔ¼°L2/L0³Í·£±äÖÖ£»´ÓÐÅÏ¢ÂÛ½Ç¶È½²ÐÅÏ¢Á÷Ñ¹Ëõ£¨ÓÐÃûÈçLZ¼°±äÖÖLZO£©£»SVMÓÃµ½µÄRBFÒ²Ëã»ùÌáÈ¡¼¼ÇÉ¡£

2 ÔÙÑ§×îÓÅ»¯Ëã·¨£ºL1³Í·£»Ø¹é£¬SVM£¨Ê¹ÓÃµÄNewton-Raphson/Gauss-Newton/Levenberg-Marquadt£¨»¹ÊÇ1µÄÄÚÈÝ£¡£©£»MonteCarlo Markov Chain

3 Êý¾Ý½á¹¹£º¾ö²ßÊ÷£¨ÁÐ±íÀà£©£¬´ÊÆµÍ³¼Æ£¨¼üÖµ¶Ô»òÕß×ÖµäÀà£©£¬FP-growth£¨Ò»¸öÊ÷µÄ¼ÓÇ¿°æ£©¡£Ñ§µ½Õâ£¬ËùÎ½¡°±´Ò¶Ë¹¡±¸ù±¾¾Í²»ÄÜ½ÐËã·¨£¬Ö»ÄÜ½ÐÒ»¸öÎÞ´¦²»ÔÚµÄÖ¸µ¼Ë¼Ïë¡£

4 Ä£ÐÍ¼¯³É£ºAdaboost£¬Éñ¾ÍøÂç£¬bootstrap¡£¼¯³ÉÊ±£¬È¨ÖØ¼¼ÇÉºÍ³Í·£¼¼ÇÉÎÒµÄÀí½âÊÇ²»¿É¸îÁÑ¡£µ«Õâ¸öË¼Ïë¶Ô·½·¨£¬¶ÔÄ£ÐÍ²ÎÊý¶¼ÄÜ¼¯³É£¬´óÔÓ»â¡£1¸ö³¬¼¶¾«ÃîµÄÄ£ÐÍ²»Èç200¸öÁ¼ºÃÀí½âÁËÎÊÌâÐÔÖÊµÄÍÁ±îÄ£ÐÍ¸üÊµÓÃ¡£

ÈÎºÎÒ»¸öÌýÆðÀ´ºÜ×°±ÆµÄËã·¨£¬ÌÓ²»¹ý±»½âÎö³ÉÕâ4Àà·½·¨×éºÏµÄÃüÔË¡£²ÎÊýµ÷ÓÅÕâÖÖ²»Ìá¸ÙêüÁìµÄÎÊÌâ£¬È·ÊµÐèÒª½áºÏÊ±¼ä³É±¾ÈËÁ¦³É±¾¿´£¨ÑÐ¾¿Õß£¬Ñ§Éú£¬ÂëÅ©µÄ³É±¾ºÍÍ¶ÈëÁ¿ÍêÈ«²»Ò»Ñù£©

¿ÉÒÔ¿´µ½£¬´óÊý¾Ý·ÖÎöµÄÆ¿¾±ÔÚÄÄ£¿
µÚ0²½£¬ºÍÔø¾µÄ´óBossÌÖÂÛ¹ý£¬´«Í³ÐÐÒµÊý¾Ý²Ö¿âÊµÊ©ÆðÂë»¹ÄÜ´ò10Äê£¬¶ø"ÊµÌå-¹ØÏµ"¸ÅÄîºÍ"¼ü-Öµ"¸ÅÄîÕâÁ½ÖÖ³éÏóÆðÂë»¹ÄÜ´ò30Äê£¬Êý¾ÝµÄ×éÖ¯£¬¹ýÂË£¬ÔªÊý¾ÝÎ¬»¤¶¼ÊÇÊý¾Ý²úÉú¼ÛÖµµÄ±Ø¾Ö®Â·£¬Õâ·½ÃæµÄ¹¤×÷ºÜ¿ÝÔïµ«ÊÇºÜ»ù´¡£¬´óÊý¾ÝºÍ´«Í³Êý¾Ý¶¼ÐèÒª£»

µÚ1²½ÊÇ×î»ù±¾×îÖØÒªµÄ·ÖÎöÊÖ¶Î£¬Ò²×îÈÝÒ×ÔÚ´óÊý¾ÝÓï¾³ÏÂµ¼ÖÂµ¥»úÎÞ·¨·ÖÎöµÄÒÚ½×Ï¡Êè´ó¾ØÕó²úÉú£ºÀý1£¬ÓÃ»§User¶ÔÉÌÆ·SKUµÄ¹ºÂò¼ÇÂ¼£»Àý2£¬ÔÚÌØ¶¨µÄ¾Î³¶È£¬ÌØ¶¨µÄÊ±¼ä£¬ÌØ¶¨µÄÓÃ»§·¢ÉúÁË¶¯×÷£»ÕâÁ½¸öÀý×ÓÊÇµäÐÍµÄ¡°²éÑ¯¼òµ¥·ÖÎöÄÑ£¬»ã×Ü»¹²»Èç²»»ã×Ü¡±µÄÇé¿ö£¬±ØÐëÒªÓÐ·Ö²¼Ê½Ï¡Êè¾ØÕó´¦Àí¼¼Êõ£»

µÚ2²½£¬Ðò¹áMCMCµÄ´®ÐÐÐÔ¿ÉÒÔÍ¨¹ý²¢ÐÐ¼¯³É·½·¨Ä£Äâ£¬µ«ÊÇÊÕÁ²ÐÔ»¹ÈÔÈ»½ÏµÍ£¬ÐèÒª±©Á¦²¢ÐÐ¶ÑFLOPS£»¶ÔÓ¦µÄ£¬ÒòÎªSVM/Lasso¶¼ÓÐÔöÁ¿Ëã·¨¡¢·Ö²¼Ê½Ëã·¨·½°¸£¬ºËÐÄË¼ÏëÔÚÓÚ¡°ÊÀ½çµÄÕæÊµ£¬Ä£ÐÍµÄ±¾ÖÊ£¬¶¼ÊÇÏ¡ÊèµÄ¡±£¬ËøÉÙÁ¿×ÊÔ´£¬·Ö²¼Ê½µØ¸üÐÂÄ£ÐÍÏµÊý»òÕßÊÇÌÝ¶È£¬ÕâÐ©Ëã·¨ÔÚÀíÂÛÉÏµÃµ½Í»ÆÆºó£¬ÍùÍùÒÀÀµ·ÖÎöÐÍÊý¾Ý¿â»òÕß´óÊý¾ÝÆ½Ì¨Áé»îµÄ²¢·¢µ÷¶È£¬Áé»îµÄÐÐÁÐ»ìºÏ´æ´¢Ä£Ê½£¬ÕâÒ»µãÊÇµ¥»ú¡¢Ð¡¼¯Èº¡¢´«Í³Êý¾Ý¿âÄÑÒÔÆó¼°µÄ£»

µÚ3¡¢4²½£¬ÕâÀïËäÈ»¾ÙÁËºÜ¼òµ¥µÄÀý×Ó£¬µ«ÕâÐ©ÊÇÔÚÊýÑ§Ä£ÐÍºÍÊý¾ÝÄ£ÐÍÉÏÊÇ×îÃ»ÓÐ¿ª·¢Ñ¹Á¦µÄ£¬ÐèÒª¹ØÐÄµÄÖ»ÊÇ×ÊÉî³ÌÐòÔ±µÄ¹¦µ×ÁË¡£¾ÙÀýËµÃ÷£¬ÎÄ±¾ÍÚ¾ò£¨NLP£©Í³¼ÆÍê´ÊÆµÄã»¹ÊÇµÃ»á¿Õ¼äÀï×öPCA£¨»òÕßÆäËûÐÎÊ½µÄ´ó¾ØÕó¼Ó¹¤£©£»Èç¹û²»È»£¬Ö»ÒýÈëHMMÄ£ÐÍºÍ»ù´¡×ÖµäÊ÷µÄ»°£¬Ñ§Ï°³É±¾¾ÍÖ»ÓÐÑ§Ï°±´Ò¶Ë¹ÀíÂÛÁË£¬²¢ÇÒÈÔÈ»¿ÉÒÔ¸ßÐ§²¢ÐÐµÄ½â¾öNLPÎÊÌâ£¬ÓÐÐËÈ¤µÄ¿ÉÒÔ²Î¿¼ViterbiËã·¨ºÍCRFËã·¨¡£

´óÊý¾ÝµÄ»Ã¾õ£º´æ´¢ºÍ¼ÆËãµÄ³åÍ»

´óÊý¾Ý´¦Àí£¬¶à´óËã´ó£¿ÏñÎÒËµµÄ£¬ÔÚ3,4²½³öÀ´µÄÊý¾Ý£¬ÔÊ¼Êý¾ÝºÜ´ó£¬¼Ó¹¤»ã×ÜÍêÁËºÜÐ¡£¬»òÕß´¦ÀíÆðÀ´ÊÇ¸ß¶È¶ÀÁ¢µÄ¡£·Ö²¼Ê½´æ´¢²»Ó°Ïì·ÖÎö£¬ËµÊÇ´óÊý¾Ý£¬ÆäÊµºÍÐ¡Êý¾Ý´¦ÀíÃ»²î±ð¡£

ÐèÒªËæÊ±½»»»×ÊÔ´µÄ¾ÛÀà£¬»Ø¹é£¬SVD£¬PCA£¬QR£¬LUµÈ¹ØÏµµ½¾ØÕó·Ö½âµÄ¼ÆËãÉõÖÁÊÇ¸ßÐ§·ÃÎÊ£¬¸ü½øÒ»²½»¹ÓÐÈÈÊý¾ÝÔÚÄÚ´æÉÏ¶ø²»ÊÇÎïÀí´æ´¢ÉÏµÄ¶à´Îµü´ú£¬Õâ²ÅÊÇ´óÊý¾ÝÕæÕýµÄÌôÕ½¡£
ÄÇÐ©ÓÐ¼à¶½µÄ·ÖÀàÊ÷£¬°ÑÊý¾Ý¼¯ÇÐ³É1000·Ý²¢ÇÒÓÐÈßÓàµÄ¸ø500Ì¨»úÆ÷Ã¿Ì¨3-5·ÝÊý¾Ý×îºóµÃµ½¼¯³ÉµÄ·ÖÀà½á¹û£¬ÎÒºÜÄÑ³ÆÆäÎª¡°´óÊý¾Ý¼ÆËã¼¼Êõ¡±£¬ËüµÄ±¾ÖÊºÍÍÚ¿ó»úÃ¿ÃëÄÜ×öÎÞÊý¸ö¸ß¶ÈÍ¬ÖÊ»¯µÄhash¼ÆËãÒ»Ñù£¬²»ÐèÒª×ÊÔ´½»»»£¬²»ÐèÒª´óÁ¿Í¨ÐÅ£¬ËüÖ»ÊÇ¡°Ð¡Êý¾Ý+¶ÀÁ¢ÔËËãºóÖ±½ÓÄÜ¹»ÕûºÏ½á¹û¡±µÄ·¶Î§ÄÚ´ò×ª¡£

------------------------
*2014.8¸Ä½øËµÃ÷£º
Êý¾ÝÔÚÎïÀí´æ´¢¡¢ÄÚ´æ¡¢ÉõÖÁÏÔ´æµÄÔµØµü´ú»á´øÀ´Êý¾ÝÖØ·Ö²¼£»ÔÚ´«Í³Êý²ÖÁìÓòÊý¾Ý£¬ÖØ·Ö²¼ÆäÊµÊÇ¶ÔÎ´À´Ð§ÂÊÌá¸ßÔ¤ÆÚµÄÍ×Ð£¬ÇÒÀïÃæº¬ÓÐ±È½Ï¶à¶Ô´«Í³ÒµÎñÎÈ¶¨Êý¾Ý¼Ü¹¹µÄÀí½â¡£

´óÊý¾ÝÊ±´úÃ÷ÏÔ²»´æÔÚÊ²Ã´Êý¾Ý²Ö¿âERÄ£ÐÍÎÈ¶¨ÐÔ£¬²»ÖªµÀ´ó¼ÒÓÐÃ»ÓÐÕâÖÖÌåÑé£ºÒ»¸öÐÂÐèÇó£¬Ò»¸öÈ«ÐÂµÄ²»×Å±ß¼ÊµÄÑÐ¾¿ÐÔÎÊÌâµÄ³¡¾°ÏÂ£¬¾ÍÄÜ½¨¸öÐÂ¿âÀ´½øÐÐÌ½Ë÷ÓëÊý¾Ý¼Ó¹¤ÕûÀí£¬Êý¾ÝÍÚ¾ò¡£¸÷×ÔÎªÕþ£¬ÊµÑéÈÝÒ×£¬ÂäµØÓëÕûºÏÀ§ÄÑ¡£¡ª¡ª Õâ¸öÇé¿öÏÂÈç¹ûÒªÆµ·±×ßÎïÀí´æ´¢µÄ»°£¬»ùÓÚkeyµÄÖØÐÂ·Ö²¼»áÈÃÊý¾ÝÏñÖó·ÐµÄÒ»¹øÖà´óÁ¿Õ¼ÓÃÍøÂçÓëIOÐ´Èë´ø¿í£¬Óë´«Í³Êý¾Ý¿âÐÔÄÜµÄ¾Þ´óºè¹µÊÇÎÞ·¨»Ø±ÜµÄÎÊÌâ¡£Òò´ËÔÚÕâ¸ö³¡¾°ÏÂ£¬Spark¡¢Storm¡¢GPU¼ÆËã»ðÆðÀ´£¬ÈçScala¡¢Clojure¡¢PythonµÈº¬ÓÐFP¸ÅÄîµÄÓïÑÔ×ßµÃÔ½À´Ô½¿¿½ü¿ª·¢¹¤³ÌÊ¦µÄÊÓÏß£¬½Ï¸ß¼¶µÄ·â×°¹¤¾ßÈçÍ¼Ä£ÐÍ¼ÆËãµÄGraphSQLµÈ×é¼þÒ²¸¡³öË®Ãæ¡£¶øÇÒËµ¾äÊµ»°£¬Map£¨Ó³Éä£©ºÍReduce£¨¹æÔ¼£©ÔÚÕâÐ©ÓïÑÔÖÐ£¬ÒÑ¾ÊÇÀÏµÄµôÁËºÃ¶àÄêÑÀµÄ¸ÅÄîÁË¡£
£¨FP£ºFunctional ProgrammingÎÒ·´¶Ô·Òë³Éº¯ÊýÊ½±à³Ì£¬ÕâÃ÷Ã÷ÊÇ·ºº¯±à³Ì£©
------------------------

´óÊý¾Ý¸ÅÄîÒýÈëÕâ¼þÊÂ¶ùÊÇ´óÅÚ´òÎÃ×Ó¡ª¡ªÄÚ´æÄÚµÄ·ÖÎöºÍÊý¾ÝÌ½Ë÷£¬Õ¹ÏÖ£¨µ¥½Úµã£©£º

*´ÓÊý¾Ý¼ÇÂ¼ÌõÊý½²£º
°ÙÍò¼¶£¬RµÄÉÏÏÞ£»
Ç§Íò¼¶-ÒÚ¼¶£¬SASµÄÉÏÏÞ£»
Ç§Íò¼¶£¬PythonµÄÉÏÏÞ£»

*ÎÒµÄÊ¹ÓÃ¾Ñé£¬´ÓÊý¾ÝÕ¼ÓÃÄÚ´æµÄÐ§ÂÊ½²£º¼ÓÔØ400MÊý¾Ý»áÊ¹µÃ
Python£¨NumpyÁÐ´æ£©Õ¼ÓÃÄÚ´æ500M
R£¨ÎÒ½÷É÷²Â²âÊÇÐÐ´æÁÐ´æºÍ¶þÎ¬±íÈýÑù¶¼´æÒ»·Ý£©¼ÓÔØÕ¼ÄÚ´æ2G
SAS£¨ÐÐ´æ£©Õ¼ÓÃ600M£¬¾¹ý±í¼¶Ñ¹Ëõ£¨ÒÀÈ»ÊÇÐÐ´æ£©150M

*ºóÐøµÄÔÊ¼´¦Àí
ÓÈÆäÊÇ×Ö·û´®²Ù×÷ÕâÖÖÊý¾ÝÇåÏ´£¬R¼¸ºõ²»ÄÜ×ö£¬¾«Í¨shell¼°regexpµÄÈËÓÖ×öµÄÌ«ÈÝÒ×¡£
ÈôÏëÓÃR£¬Õâ¾ÍÐèÒªÄãÊäÈëµ½RµÄÊý¾Ý¼¸ºõ¾ÍÄÜÖ±½Ó¿ªÊ¼ÅÜ·ÖÎöÁË¡£Èô²»ÐÅÐ°£¬ÎÒÍÆ¼öÄãÓÃreadLines¼ÓÉÏstrsplitÀ´²Ù×÷¶ÁÈëRµÄÎÄ¼þ£¬¿´¿´ËûÊý¾ÝÇåÏ´µÄÐ§ÂÊºÍread.delim£¬ºÍSAS proc import ÒÔ¼° PythonµÄwith asÓï·¨Ïà²î¶àÉÙ¡£

*Õ¹ÏÖ·½°¸£º
Ö»ÒªÊý¾ÝÁ¿µÍÓÚ¸Õ²ÅÌáµ½µÄÏÞ¶È£¬RÓÖÌá¹©ÁË×îºÃµÄÕ¹ÏÖ·½°¸£¬ÒòÎª¡°Õ¹ÏÖ·½°¸ÊÇ×¨ÓÃ¶ø·Ç·ºÓÃ¡±µÄ£º
a. Hadley×îÖøÃûµÄR°üÖ®Ò»ggplot2Î´À´»áÒýÈëSVGµÈ¿É½»»¥ÔªËØ¡£Ò»¸ö¾ßÓÐd3.js¿ÉÊÓ»¯ÌØÐÔµÄ»æÍ¼°ü»¹²»ÈÃÄãÕð¾ªÂð£¿
b. °Ù¶ÈechartsÍÅ¶ÓÏîÄ¿±»taiyun°ü×°³Érecharts·ÅÔÚÁËgithubÉÏ
c. ÒÑ¾¼ÓÈëRStudioµÄRÍ³¼Æ´ïÈËYihui XieµÄ×÷Æ·knitr£¬ÄÜ¹»Ê¹ÓÃmarkdownÓï·¨¶¯Ì¬½«Êý¾ÝÍÚ¾ò½á¹û£¬Í¼Æ¬£¬ÊÓÆµÉú³É´ò°ü·Å½øhtml»òÕßpdfÎÄµµ¡£

ËµËµ¶ÔÊÖ£º
a. RÒª±ÈPythonÏÖÓÐµÄ¿ÉÊÓ»¯°ü£¨ÒÔmatplotlibºÍpygameÎªÖ÷£©¸üÓÑºÃ£¬¸üÒ×ÓÚ²Ù×÷¡£
b. ËäÈ»ÈÃ´ÓÀ´Ã»½Ó´¥¹ýÇ°¶ËµÄÈË³Á½þÔÚÓÃChrome¼´¿Éµ÷ÊÔµÄJavaScriptÀïÃæ²»Ì«¿ÆÑ§£¬µ«ÎÒ°®²»ÊÍÊÖ£¬¶øÇÒÆäºËÐÄµÄÕ¹ÏÖ·½Ê½È·ÊµÎ´À´»á¼ÓÈëR¡£
c. Java·ç¸ñµÄProcessing£¬ÎÞ·ìµ÷ÓÃjava¿â£¬·â×°´óÁ¿javaÍ¼ÐÎº¯Êý¡¢ÊÓÆµÏà¹ØAPI¡¢Êó±êÏìÓ¦API£¬¿ÉÒÔµ¼³öjava applet»òport³Éjs´úÂë£»¸ã´óÊý¾ÝµÄÈË±ØÈ»ÊìÏ¤java¿ª·¢£¬¿ÉÒÔ¼¸ºõ0³É±¾ÓÖ¸ßÐ§¿ìËÙµÄÊ¹ÓÃËü¡£

Õâ¼¸ÖÖ¹¤¾ßÈ·Êµ¸÷ÓÐËù³¤£¬ÎÒ¸öÈËÎÞ·¨È¡Éá£¬µ«Æ½ÐÄ¶øÂÛ£¬RÊÇÑ§Ï°ÃÅ¼÷¡¢±àÂëÐ§ÂÊºÍ²ú³öÐ§¹ûÍ¬Ê±×î³öÉ«µÄ£¨¸öÈË¾ÀúÔÒòÎÞ·¨¶ÔSAS VA£¬Tableau£¬Flex»ò¸üÒ»°ãµÄBIÕ¹ÏÖ¹¤¾ßÖÃÆÀ£¬ÆäÊÜÖÚÒòÎªÈí¼þ³É±¾£¬ÂäµØÐÔ²»¹»µÈÔÒò£¬ÎÒÈ±·¦Ê¹ÓÃËüÃÇµÄ¾Ñé£¬ËüÃÇÒ²È±·¦¶ÔÎÒµÄÎüÒýÁ¦£©

¹éÄÉÏÂÎÒµÄÀí½â£¬RµÄ²ú³ö±¨¸æÀàËÆhtml+javascript+CSSÒ»Ñù£¬ÊÇÊÊºÏÇáÁ¿·ÖÎö£¬ÇáÁ¿Õ¹ÏÖµÄ¡£

´óÊý¾Ý¸ÉÕâ¼þÊÂ¶ùÊÇÕýµÀ¡ª¡ª·Ç½á¹¹»¯´óÊý¾ÝÅúÁ¿»òÕßµü´ú´¦Àí£º

ÄãµÄËã·¨ÒÑ¾×ßµ½ÁË¡°ÍòÊÂ¾ã±¸£¬Ö»²îÅÜÈ«Á¿¡± ÕâÑùÒ»¸ö¶ÔÊÖÖÐµÄÊý¾ÝºÜÁË½âµÄµØ²½ÁË¡£Wiki ¶ÔRevolution AnalyticsµÄ½éÉÜ½²£ºR didn't natively handle datasets larger than main memory£¬ÕâÃ´Áé»îÐ¡ÇÉµÄ¹¤¾ß×ö¸ö³éÑùÊý¾Ý·ÖÎöÃ÷Ã÷ÊÇºÜºÃµÄ¡£

·Ç½á¹¹»¯´óÊý¾ÝÓ¦ÓÃµÄ³¡¾°Ö»ÄÜÊÇ£º

-ÄãºÜ¶®Êý¾Ý·Ö²¼µÄÏ¸½Ú£¨Ò²ÐíÊÇÏîÄ¿¾Ñé£¬Ò²ÐíÊÇRÉÏÒÑ¾×ö¹ý³éÑùÌ½Ë÷£©
-ÎÊÌâÊÊºÏµÄËã·¨ÄãÁËÈ»ÓÚÐØ£»ÔöÁ¿Ëã·¨´æÔÚ£»±©Á¦²¢ÐÐ¼ÆËã£¨¾ØÕó¼ÆËã£¬Í¼µü´ú£©Ã»ÎÊÌâ
-Äã¾õµÃ°ÑÀàËÆMahout¼ÆËãµÄ²½Öè¾¹ý´úÂë°ü×°½»¸¶¸øRÀ´×öÃ»ÎÊÌâ
-ÄãÍêÈ«²»care½»»¥Ê½Ì½Ë÷

ÕâÊÇÄãÐèÒªµÄRÓ¦ÓÃ³¡¾°Ã´£¿»òÕß»»Ò»ÖÖËµ·¨£¬ÕâÖÖÓ¦ÓÃ³¡¾°RÓÐÊ²Ã´ÓÅÊÆ£¿µ÷ÓÃ±àÒëºÃµÄcpp¿â£¬fortran¿âÊÇR·¢»ÓÓÅÊÆµÄµØ·½Âð£¿ÒªÖªµÀËã·¨Ð§ÂÊÅÅÃûÉÏR<java<C++¡£Ëã·¨ÔÂÄÚÒªÉÏÏß£¬×Ô¼º¿´×Å°ì¡£

ËµÏÂÇ°±Éteam£¨Ò»¸ö²»ÊÇ×¨Òµ×öÊý¾ÝÍÚ¾òµÄÊý¾Ý²¿ÃÅ£©µÄ¾Ñé£º

½²ÁË°ëÌìR+Hadoop£¬²»ÉÏMahout£¬Ëæ±ã¸ã¸ãRSnow£¬×¼±¸ÂòSAS¡£
ÒòÎªÎÒ»áSAS£¨ÉÙÁ¿ÓÃMacro£¬Ã»ÓÃ¹ý¾ØÕó£¬ÒòÎªÃ»±ØÒª£©ºÍR£¨Ã»ÓÐÑ§Ï°³É±¾£©£¬PythonµÄ²¢ÐÐ°üppÊ¹ÓÃÖÐ£¬¿¼ÂÇmahout¡£
¸üÐÂ£ºµ±´óÊý¾ÝÆ½Ì¨ÓÃ»§²»Âú×ãÓÚ´æ´¢£¬¼òµ¥¼Ó¹¤ÒÔ¼°³ÉÐÍËã·¨ÊµÊ©£¬Ò²¿ªÊ¼¹Ø×¢×îÐ¡²éÑ¯¡¢½»»¥Ê½Ì½Ë÷Ð§ÂÊÁË£¬ÖîÈçSparkµÄÄÚ´æ½â¾ö·½°¸½«»á¸üºÏÊÊ¡£

ÏÖteamÊÇÒ»¸öÍ¬ÊÂÖÁÉÙÊÇË¶Ê¿£¨Í³¼Æ/½ðÈÚ/¼ÆËã»ú£©£¬×¨×ö½ðÈÚÐÐÒµÊý¾ÝÍÚ¾òµÄÐ¡ÍÅ¶Ó¡£ÄÜÁ¦ºÍÒµÎñ³¡¾°¿ÉÒÔ¹©²Î¿¼¡£
* SASÄÜÁ¦¸²¸ÇÃæ95%£¨¾ß±¸ºËÐÄ¼ÛÖµµÄÊý¾ÝÔÚ·þÎñÆ÷ÉÏÄÜ¹»´¦ÀíµÄÁ¿ºÜÉÙ³¬¹ýÉÏÒÚ£¬Ö÷ÍÆSAS£©
* PythonºÍR¸²¸ÇÃæ¶¼ÔÚ70%+
* Hadoop/´óÊý¾Ý¸ÅÄîµ£º¿Í»§ÓÐ×ã¹»µÄTeradata¡¢Oracle¡¢SAS·þÎñÆ÷
* Hive/Spark£ºHive×ö¸¨Öú¡¢Áé»î²Ö´¢£¬PySpark×÷ÎªÒ»¸ö¿ÉÒÔÔ¤ÆÚ¡¢ÎÈ¶¨µÄÊý¾ÝÍÚ¾òÆ½Ì¨µÄ½Óµã

½áÊøÓï£º

Ë³±ãÒ²¸øÊýÑ§Ïµ¡¢Í³¼ÆÏµµÄÊý¾Ý·ÖÎöÊ¦£¬ÒÔ¼°ËûÃÇµÄÁìµ¼ÃÇÌáÐÑÒ»¾ä£ºÈç¹ûÔ±¹¤AÓÐÔ±¹¤BÃ»ÓÐµÄ´úÂë¿ª·¢ÄÜÁ¦£¬RÓÖÍêÈ«ÌæÔ±¹¤B°ÑÊýÑ§µÄÊÂÇé×öÍêÁË£¬ÐÎ³ÉÁËÒÀÀµ£¬ÄÇÔ±¹¤B´æÔÚµÄÒâÒåÊÇÊ²Ã´£¿Ç¿µ÷ÊýÑ§ÀíÂÛÕâÃ´Ò»µãµãÓÅÊÆÒ²¶¼²»¸´´æÔÚÁË¡£

»úÆ÷Ñ§Ï°Ëã·¨ÔÚ²»Í¬µÄ½×¶ÎÊÊºÏÊ¹ÓÃ²»Í¬µÄ¹¤¾ß£¬ÑÐ¾¿ºÍÊ¹ÓÃ½Ó²»ÉÏÒ²¾ÍËãÁË£¬Ç§Íò±ðÁ¬¹¤¾ßÊÊºÏµÄ»·¾³¶¼²»¶®£¬×÷Îª»¥ÁªÍø´ÓÒµÕß£¬Õâ¾ÍÌ«Ã¤´ÓÁË¡£

¾«Ó¢µÄÑÐ¾¿ÕßÊÇ×Ô¼º×ö¿ª·¢µÄ¡ª¡ªÕâ»°Ò²¿ÉÒÔÕâÃ´Ëµ£¬¾«Ó¢µÄ¿ª·¢ÕßÃÇ×Ô¼º×öÑÐ¾¿¡£Ã¿Ò»¸öÄ£ÐÍ¶¼²»ÍêÃÀ£¬ºÎ¿öÐÂÎÊÌâÓ¿ÏÖµÄÔ½À´Ô½¿ì£¬ÏÖ´æµÄÄ£ÐÍºÜ¿ÉÄÜ²»Âú×ãÄãµÄ·ÖÎöÐèÒª¡£ËùÒÔ²ÅÒªÒ»±ßÔúÊµÀíÂÛ£¬ÒÔ×îÉÙµÄ³¢ÊÔÐáµ½×îÊÊºÏÎÊÌâµÄËã·¨£¬Ò»±ßÒÔ¿ª·ÅµÄÐÄÌ¬½ÓÄÉºÍÀí½âÐÂ¼¼ÊõµÄÓ¦ÓÃ³¡¾°£¬ÉîÈë·¢Õ¹Êý¾ÝÍÚ¾òÑÐ¾¿£¬´Ó´úÂëÓÅ»¯¸ÄÔì£¨É½Õ¯£©×ßÏò¼¼ÊõÔ´´¡£

------------------------
*2014.8¸Ä½øËµÃ÷£º
Ò»¸ö²»ºÃµÄÏûÏ¢ÊÇ£¬²»¹ÜÊÇ´Óindeed.comÖ°Î»Post¡¢ËÑË÷»¹ÊÇÐÐÒµÉúÃüÖÜÆÚÑÐ¾¿¿´£¬´óÊý¾ÝÕâ¼¸¸ö×ÖÕýÔÚÑ¸ËÙÍËµô½ðÉ«£¬ÆäÃû×ÖµÄ¼ÛÖµÅÝÄÕýÔÚÖð²½±»¼·³ö¡£×¥×¡¼¼ÊõµÄÖØµãÓë¼¼ÊõÊÊºÏµÄ³¡¾°£¬¶Ô¸öÈËÒÔ¼°¶ÔÐÐÒµ¶¼ÊÇÄ¥µ¶²»Îó¿³²ñ¹¤µÄÊÂÇé¡£
------------------------

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

¹«Ë¾ÔÚ»úÆ÷Ñ§Ï°ÒµÎñ·½ÃæÇãÏòÊ¹ÓÃ R + Hadoop ·½°¸²¢Ã»ÓÐÏëÏóÄÇÃ´ºÃ