Æû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨µÄ¼Ü¹¹ÓëÊµ¼ù-»úÆ÷Ñ§Ï°-AboutÔÆ-ËóÂ×¿Æ¼¼

hyj ·¢±íÓÚ 2020-7-2 16:11:40

Æû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨µÄ¼Ü¹¹ÓëÊµ¼ù

ÎÊÌâµ¼¶Á

1.Æû³µÖ®¼ÒÎªºÎ¹¹½¨×Ô¼ºµÄ»úÆ÷Ñ§Ï°Æ½Ì¨£¿
2.»úÆ÷Ñ§Ï°ÕûÌå¼Ü¹¹°üº¬ÄÄÐ©ÄÚÈÝ£¿
3.»úÆ÷Ñ§Ï°½¨Ä£Á÷³Ì°üº¬ÄÄÐ©£¿

µ¼¶Á£ºÆû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨ÊÇÎªËã·¨¹¤³ÌÊ¦´òÔìµÄÒ»Õ¾Ê½»úÆ÷Ñ§Ï°·þÎñÆ½Ì¨£¬¼¯Êý¾Ýµ¼Èë¡¢Êý¾Ý´¦Àí¡¢Ä£ÐÍ¿ª·¢¡¢Ä£ÐÍÑµÁ·¡¢Ä£ÐÍÆÀ¹À¡¢·þÎñÉÏÏßµÈ¹¦ÄÜÓÚÒ»Ìå£¬Ìá¹©Ò»Õ¾Ê½È«·½Î»µÄ»úÆ÷Ñ§Ï°½¨Ä£Á÷³Ì£¬¿ìËÙ´òÔìÖÇÄÜÒµÎñ¡£±¾ÎÄÖ÷Òª½éÉÜÆû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨µÄ¼Ü¹¹ºÍÊµÏÖÏ¸½Ú£¬ÒÔ¼°ÒµÎñÔÚÆ½Ì¨ÉÏµÄÓ¦ÓÃ£¬Ï£ÍûÄÜÎª´ó¼ÒÌá¹©Ò»Ð©²Î¿¼¡£

Ö÷ÒªÄÚÈÝ°üÀ¨£º

[*]±³¾°½éÉÜ
[*]»úÆ÷Ñ§Ï°Æ½Ì¨
[*]Æ½Ì¨³ÉÐ§ÓëÓ¦ÓÃ
[*]Æ½Ì¨Õ¹Íû

±³¾°½éÉÜ

Æû³µÖ®¼ÒÊÇ¹úÄÚ×îÔçµÄ½«»¥ÁªÍøÓëÆû³µ²úÒµÉîÈëÀ¦°óµÄÆû³µ·þÎñÆ½Ì¨£¬ÔÚ2005Äê³ÉÁ¢³õÆÚÒÔ´¹Ö±»¥ÁªÍø½éÈëÆû³µÐÐÒµ£¬Ñ¸ËÙ×ö³É¹úÄÚ¹æÄ£×î´óµÄÆû³µ´¹Ö±ÍøÂçÃ½Ìå£¬²¢Öð½¥·¢Õ¹Îª"³µÃ½Ìå+³µµçÉÌ"µÄ1.0Ä£Ê½¡£2016ÄêÒÔ"Êý¾Ý+¼¼Êõ"´òÔì³µ½ðÈÚ¡¢³µÄÚÈÝ¡¢³µÉú»îÒÔ¼°³µ½»Ò×µÄÊý¾ÝÆ½Ì¨2.0Ä£Ê½£¬ÒÔ±ãÎªÓÃ»§ºÍ¿Í»§Ö®¼ä´´Ôì¸üÓÐÐ§µÄÁ¬½Ó¡£Ä¿Ç°£¬Æû³µÖ®¼ÒÀûÓÃ AI¡¢´óÊý¾Ý¼°ÔÆ£¬ÒÔÁ÷Á¿¡¢ÏúÊÛÏßË÷¡¢ÄÚÈÝ¼°Êý¾ÝµÈ¸³ÄÜÆû³µÉúÌ¬ÏµÍ³ÖÐ¸÷¸ö²ÎÓë·½£¬¼ÓËÙÂõÏòÖÇÄÜÆ½Ì¨3.0Ê±´ú¡£Æû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨ÔÚÖÇÄÜÆ½Ì¨3.0µÄ±³¾°ÏÂÓ¦ÓÃ¶øÉú£¬Í¨¹ý¹ã·ºÖ§³Ö×ÔÈ»ÓïÑÔ´¦Àí¡¢Í¼Ïñ·ÖÎö¡¢ÓïÒôÊ¶±ð¡¢ÊÓÆµ·ÖÎö¡¢ÍÆ¼ö¡¢ËÑË÷¡¢¹ã¸æµÈ³¡¾°µÄ AI ·þÎñ£¬ÓÐÐ§ÌáÉýÁËÆû³µÖ®¼Ò AI µÄÓ¦ÓÃÐ§¹û£¬À©Õ¹ÁË AI µÄÓ¦ÓÃ·¶Î§£¬Ìá¸ßÁËÓÃ»§¿´³µ£¬Âò³µ£¬ÓÃ³µµÄÌåÑé¡£

»úÆ÷Ñ§Ï°ÁìÓò£¬×îÖØÒªµÄÈý¸ö»·½ÚÈçÏÂÍ¼£¬°üÀ¨Êý¾Ý´¦Àí£¬Ä£ÐÍÑµÁ·ºÍ·þÎñ²¿Êð£¬Ã¿Ò»»·½Ú°üº¬µÄÄÚÈÝºÜ¶à£¬¶¼¿ÉÒÔµ¥¶ÀÄÃ³öÀ´×öÒ»¸öÆ½Ì¨¡£

ÔÚÔçÆÚ£¬Ö®¼ÒÄÚ²¿Ëã·¨ÍÅ¶ÓÔÚ¸÷×ÔµÄ·þÎñÆ÷ÉÏ½øÐÐ»úÆ÷Ñ§Ï°µÄÑµÁ·ºÍ·þÎñ²¿Êð£¬Ôì³ÉÁËÐ¡×÷·»Ê½µÄ¹¤×÷¾ÖÃæ£¬¸÷×ÔÖØ¸´×ÅÕâÈý¸ö»·½ÚÀ´Ö§³ÖÒµÎñ¡£ÔÚ¿ªÊ¼ËãÁ¦¹æÄ£Ð¡µÄÊ±ºò£¬ÕâÖÖÐ¡×÷·»·½Ê½±£Ö¤ÁË¹¤×÷µÄÁé»îÓë´´ÐÂÍ»ÆÆ£¬µ«ÊÇËæ×ÅÒµÎñµÄÔö¼ÓºÍËãÁ¦µÄÔö³¤£¬Öð½¥ÏÔÊ¾ÁËÕâÖÖ·½Ê½µÄ¾ÖÏÞÐÔ¡£Ö÷ÒªÌåÏÖÔÚÁ½¸ö·½Ãæ£º

°º¹óµÄ¼ÆËã×ÊÔ´²»ÄÜµÃµ½ÓÐÐ§µÄµ÷¶È£¬¹«Ë¾µÄÍ¶Èë²ú³öÐ§ÒæÔ½À´Ô½µÍ¡£Òò´Ë»ùÓÚÕâÖÖ¾ÖÃæ£¬¹«Ë¾¼±ÐèÒ»ÖÖÆ½Ì¨»¯µÄ·½Ê½À´Í³Ò»µ÷¶È¼ÆËã×ÊÔ´¡£

¸÷¸öÒµÎñÏß°üÀ¨ÍÅ¶ÓÄÚ²¿£¬ÒµÎñ²»Í¬£¬ÓÃµÄÊý¾Ý²»¾¡ÏàÍ¬£¬´ó²¿·ÖµÄ¹¤³Ì¼¼ÊõÈËÔ±ºÍÒµÎñÈËÔ±¶¼¾Û½¹ÔÚÒµÎñÁìÓòµÄÌØÕ÷ÌáÈ¡£¬Ëã·¨Ñ¡Ôñ£¬²ÎÊýµ÷ÓÅºÍÄ£ÐÍÑéÖ¤ÉÏ£¬Òò´ËÒ»¸ö·½±ã¸ßÐ§µÄ¿ÉÊÓ»¯½¨Ä£Æ½Ì¨£¬¶ÔÓÚ½µµÍÓÃ»§µÄ»úÆ÷Ñ§Ï°Ñ§Ï°ÇúÏß¡¢ÌáÉý¹¤×÷Ð§ÂÊÏÔµÃÓÈÎªÖØÒª¡£ÓÉ´ËÆû³µÖ®¼Ò¹¹½¨ÁË×Ô¼ºµÄ»úÆ÷Ñ§Ï°Æ½Ì¨£¬¸ÃÆ½Ì¨Í¬Ê±Ö§³ÖÉî¶ÈÑ§Ï°ºÍ´«Í³»úÆ÷Ñ§Ï°½¨Ä£¡¢¿ÉÊÓ»¯½¨Ä£¡¢Í³Ò»µÄ¼ÆËã×ÊÔ´ºÍ´æ´¢×ÊÔ´¹ÜÀí¡¢Í³Ò»µÄ²¿ÊðÆ½Ì¨£¬Á¦Çó´ïµ½ÒÔÏÂÄ¿±ê£º

¿ª·¢Í¨ÓÃ»¯£ºÒ»´Î¿ª·¢ÖØ¸´Ê¹ÓÃ£¬±ÜÃâÖØ¸´ÔìÂÖ×Ó£¬Ìá¸ß¹¤×÷Ð§ÂÊ¡£½«Ëã·¨¹¤³ÌÊ¦ÃÇ´Ó·±ÖØµÄ½Å±¾¿ª·¢¹¤×÷ÖÐ½â·Å³öÀ´×¨×¢ÓÚËã·¨Ð§¹ûµÄÌáÉý¡£

½¨Ä£¼«¼ò»¯£ºÓÃ»§½öÐè¸ù¾Ý×Ô¼ºµÄÐèÇóÔÚÒ³ÃæÉÏÍ¨¹ýÍÏ×§µÄÐÎÊ½Íê³ÉÊý¾ÝµÄµ¼Èë£¬Ô¤´¦Àí£¬Ä£ÐÍ½¨Ä£ÓëÆÀ¹ÀµÈÁ÷³Ì¡£ÕâÑù¼´Ê¹ÊÇ¶ÔÄ£ÐÍËã·¨²»ÉõÁË½âµÄ²úÆ·ÔËÓªÍ¬ÊÂÔÚ¾¹ý¼òµ¥µÄÁË½âºóÒ²¿ÉÇáËÉÉÏÊÖ£¬ÒÀ¾Ý×ÔÉíÐèÇóÍê³É¼òµ¥Êý¾Ý´¦Àí»òÕß½¨Ä£ÈÎÎñ¡£

Êý¾Ý¿ÉÊÓ»¯£º¿ÉÒÔÖ§³ÖÊäÈëÊý¾Ý¿ÉÊÓ»¯£¬Êý¾Ý·ÖÎö¿ÉÊÓ»¯¡¢¼ÆËãÍ¼¿ÉÊÓ»¯¡¢ÑµÁ·¹ý³Ì¿ÉÊÓ»¯¡¢Ä£ÐÍÐ§¹û¿ÉÊÓ»¯¡£

»úÆ÷Ñ§Ï°Æ½Ì¨

1. ÕûÌå¼Ü¹¹

¼ÆËã×ÊÔ´°üÀ¨¸ßÐÔÄÜ CPU ¼¯ÈººÍÔÆ GPU ¼¯Èº£¬¸ßÐÔÄÜ CPU ¼¯ÈºÓÃÓÚÑµÁ·ºÍ²¿Êð´«Í³»úÆ÷Ñ§Ï°Ä£ÐÍ£¬ÔÆ GPU ¼¯ÈºÓÃÓÚÑµÁ·ºÍ²¿ÊðÉî¶ÈÑ§Ï°Ä£ÐÍ¡£

»ùÓÚ×ÊÔ´µÄ²»Í¬£¬»úÆ÷Ñ§Ï°ºÍÉî¶ÈÑ§Ï°µ×²ã²ÉÓÃÁËÁ½ÖÖ²»Í¬ÀàÐÍµÄ¼Ü¹¹·½Ê½£¬»úÆ÷Ñ§Ï°ÑµÁ·Ê¹ÓÃ Spark ×ö¼ÆËã£¬Í¨¹ý Yarn À´µ÷¶È¼ÆËã×ÊÔ´£»Éî¶ÈÑ§Ï°ÑµÁ·Ê¹ÓÃ K8s ×öµ÷¶È£¬Ö§³ÖÖ÷Á÷µÄ Tensorflow¡¢PaddlePaddle¡¢MxNet¡¢Caffe µÈÉî¶ÈÑ§Ï°¿ò¼Ü£¬²¢ÇÒÖ§³Öµ¥»úºÍ·Ö²¼Ê½ÑµÁ·¡£

´æ´¢²ã°üÀ¨ÒµÎñ¶ËÍ¨ÓÃµÄÑù±¾¿â¡¢ÌØÕ÷¿âºÍÄ£ÐÍ¿â£¬Ö÷Òª´æ·ÅÔÚ Hive ²Ö¿âºÍ HDFS ÉÏ¡£

Æ½Ì¨³éÏóÁËËã·¨×é¼þ°üÀ¨»úÆ÷Ñ§Ï°µÄÊý¾ÝÔ¤´¦Àí¡¢ÌØÕ÷¹¤³Ì¡¢Í³¼Æ·ÖÎö¡¢·ÖÀà¡¢¾ÛÀà¡¢»Ø¹é¡¢ÆÀ¹À¡¢Ô¤²âµÈ100+¸ö×é¼þ¡£

Ä£¿é¶ÔÍâÌá¹©ÁËÄ£ÐÍÑµÁ·¡¢Ä£ÐÍÆÀ¹À¡¢Ä£ÐÍÔ¤²â¡¢Ä£ÐÍ¹ÜÀíºÍÄ£ÐÍ²¿Êð¹¦ÄÜ£¬Âú×ãÁËËã·¨ÈËÔ±µÄÄ£ÐÍÑµÁ·ºÍ²¿ÊðÄ£ÐÍ·þÎñµÄÐèÇó£¬Í¬Ê±»¹Ìá¹©ÁË½»»¥Ê½±à³Ì Notebook£¬Ìá¸ßÁË¿ª·¢ÈËÔ±µÄ¿ª·¢Ð§ÂÊ¡£

2. »úÆ÷Ñ§Ï°½¨Ä£Á÷³Ì

Ëã·¨¿ò¼Ü£º
ÓÉÓÚ Spark Ñ¡ÔñÄÚ´æ´æ´¢ÊäÈëÊý¾Ý¡¢´¦ÀíÖÐ¼ä½á¹û¡¢ºÍ´æ´¢×îÖÕ½á¹û£¬ÔÚ´óÊý¾ÝµÄ³¡¾°ÖÐ£¬ºÜ¶à¼ÆËã¶¼ÓÐÑ»·Íù¸´µÄÌØµã£¬Ïñ Spark ÕâÑùÔÊÐíÔÚÄÚ´æÖÐ»º´æÊäÈëÊä³ö£¬ÉÏÒ»¸ö job µÄ½á¹ûÂíÉÏ¿ÉÒÔ±»ÏÂÒ»¸öÊ¹ÓÃ¡£Òò´Ë Spark ÓÐ×Å¸ßÐ§µÄ·Ö²¼Ê½¼ÆËãÄÜÁ¦¡£

´ËÍâ Spark Ìá¹©ÁË¸ü¶àÁé»î¿ÉÓÃµÄÊý¾Ý²Ù×÷£¬±ÈÈç filter¡¢union¡¢join ÒÔ¼°¸÷ÖÖ¶Ô key value pair µÄ·½±ã²Ù×÷£¬ÉõÖÁÌá¹©ÁËÒ»¸öÍ¨ÓÃ½Ó¿Ú£¬ÈÃÓÃ»§¸ù¾ÝÐèÒª¿ª·¢¶¨ÖÆµÄÊý¾Ý²Ù×÷¡£Spark ±¾Éí×÷ÎªÆ½Ì¨Ò²¿ª·¢ÁË streaming ´¦Àí¿ò¼Ü Spark streaming£¬SQL ´¦Àí¿ò¼Ü Dataframe£¬»úÆ÷Ñ§Ï°¿â MLlib ºÍÍ¼´¦Àí¿â GraphX¡£¸üÖØÒªµÄÊÇ Spark ¿ÉÒÔÌá¹©ÃæÏò python µÄ¿ª·¢½Ó¿Ú£¬Ìá¸ßÁË¿ª·¢Ð§ÂÊ¡£Òò´ËÎÒÃÇÑ¡Ôñ Spark ×÷ÎªÎÒÃÇÆ½Ì¨µÄËã·¨¿ò¼Ü¡£

Ëã·¨¶ËÁ÷³Ì£º

[*]ºó¶Ë½«ÓÃ»§¹¹½¨µÄ½¨Ä£Á÷³Ì¼°ÅäÖÃµÄÄ£ÐÍ²ÎÊý°ü×°ÖÁ json µ÷ÓÃËã·¨¶Ë½Ó¿Ú
[*]Ëã·¨¶ËÍ¨¹ý spark-submit Ìá½»Ò»¸ö Spark ÈÎÎñ
[*]ML Engine ¸ºÔðÕâ¸öÈÎÎñµÄÖ´ÐÐ£¬ÔÚ Driver ¶Ë»á´Ó json ÖÐ»ñÈ¡µ±Ç°ÊÔÑéµÄÁ÷³Ì¹ØÏµ¼°¶ÔÓ¦µÄ²ÎÊý¡£ÕâÐ©×é¼þ½«ÒÀ´ÎÔËÐÐ£¬Éæ¼° RDD Ïà¹ØµÄ²Ù×÷Ê±»áÌá½»µ½ Spark Executor ½øÐÐ²¢ÐÐ¼ÆËã

3. Éî¶ÈÑ§Ï°ÑµÁ·

ÒÔÉÏÎª»úÆ÷Ñ§Ï°Æ½Ì¨-Éî¶ÈÑ§Ï°²¿·ÖµÄÂß¼¼Ü¹¹Í¼£¬Æ½Ì¨Ö§³ÖÁËÉî¶ÈÄ£ÐÍµÄÑµÁ·ºÍ·þÎñ²¿Êð¹¦ÄÜ¡£ÎªÁË¸üºÃµÄ¹ÜÀí¼ÆËã×ÊÔ´£¬ÐèÒª½«ËùÓÐµÄ¼ÆËã×ÊÔ´¼¯ÖÐÆðÀ´£¬ÓÈÆäÊÇ GPU »úÆ÷£¬×öµ½°´Ðè·ÖÅä£¬Ê¹×ÊÔ´µÄÊ¹ÓÃÂÊ¾¡Á¿½Ó½ü100%£¬ÕâÑù²ÅÄÜÌá¸ßÎÒÃÇµÄÉú²úÁ¦£¬½ÚÔ¼¹«Ë¾³É±¾¡£Õâ¾ÍÐèÒªÒ»¸öÈÝÆ÷¹ÜÀíÏµÍ³À´¹ÜÀíÎÒÃÇµÄ GPU ¼¯Èº¡£

¢Ù ¼¼ÊõÑ¡ÐÍ
ÎÒÃÇµ÷ÑÐÁË K8s ºÍ Yarn¡£Yarn ×÷Îª´óÊý¾ÝÆ½Ì¨±êÅäµÄ×ÊÔ´µ÷¶ÈÆ÷£¬È·ÊµÓÐºÜ¶àÓÅµã²¢ÇÒ±È½Ï³ÉÊì£¬µ«ÊÇ¼øÓÚ Yarn ¶ÔÔÚÏß·þÎñµÄÖ§³Ö½ÏÈõ£¬ÐÂ°æµÄ Yarn ²ÅÖ§³Ö GPU µ÷¶È£¬´æÔÚÎÈ¶¨ÐÔ·çÏÕ¡£Ïà¶ÔÓÚ Yarn£¬K8s ÏÖÔÚÉçÇø±È½ÏÇ¿´ó£¬¶Ô GPU ¿¨µÄµ÷¶ÈÓÐºÜºÃµÄÖ§³Ö£¬Ö§³Ö·þÎñµÄ×Ô¶¯»¯²¿Êð£¬·þÎñµÄÔËÎ¬³É±¾µÍ£¬ÎÒÃÇÑ¡ÔñÓÃ K8s ×öÎªÆ½Ì¨µÄÈÝÆ÷¹ÜÀíÏµÍ³¡£

´æ´¢£º
Ä£ÐÍÑµÁ·µÄÑµÁ·Ñù±¾Êý¾Ý´ó¶à´æ´¢ÔÚ HDFS ºÍ Hive ±íÖÐ£¬Æ½Ì¨ÊµÏÖÁËÓë Hadoop ¼¯ÈºµÄ»¥Í¨¡£ÈÎÎñÔÚÔËÐÐÇ°ÐèÒªÀÈ¡Êý¾Ýµ½ÈÝÆ÷ÄÚ²¿£¬ÎªÁË±£Ö¤Êý¾ÝµÄ³Ö¾Ã»¯´æ´¢ºÍ¿ÉÀ©Õ¹ÐÔ£¬ÐèÒªÍâ²¿´æ´¢ÏµÍ³À´Ö§³Ö£¬ÎÒÃÇÑ¡ÔñÁË Ceph¡£Ê¹ÓÃ Ceph Ö÷ÒªÓÐÒÔÏÂ¼¸¸öºÃ´¦£º

¿ÉÒÔÖ§³Ö½Ï´óµÄÊý¾Ý¹æÄ££¬½Ï´óµÄÑù±¾Êý¾Ý¿ÉÒÔ´ïµ½¼¸°Ù G ÉõÖÁµ½¼¸ T£¬µ±Óöµ½¼¯Èº½Úµã¹ÊÕÏ£¬ÈÎÎñµÄ Pod ÖØÆô£¬»¹ÄÜ¼ÌÐø·ÃÎÊÊý¾Ý½øÐÐÑµÁ·¡£

Ceph ÊÇÒ»¸öÍ³Ò»µÄ·Ö²¼Ê½´æ´¢ÏµÍ³£¬¸ÃÏµÍ³ÓµÓÐºÜºÃµÄÐÔÄÜ¡¢¿É¿¿ÐÔºÍ¿ÉÀ©Õ¹ÐÔ¡£ÔÚµ¥»úÑµÁ·ÖÐÖ÷ÒªÓÃµ½µÄÊÇ Ceph µÄ¿é´æ´¢ RBD£¬ÔÚ¶à»ú·Ö²¼Ê½ÑµÁ·ÖÐÐèÒª¹²ÏíÑµÁ·Êý¾ÝÓÃµ½µÄÊÇ CephFS£¬ÈÎÎñÔËÐÐ½áÊø£¬´æ´¢×ÊÔ´¸ù¾ÝÓÃ»§Ñ¡Ôñ¾ö¶¨ÊÇ·ñÊÍ·Å¡£

µ÷¶È£º
Í¨¹ý¹¹½¨ K8s µÄ GPU ¼¯Èº£¬À´Í³Ò»µ÷¶È GPU£¬CPU ºÍÄÚ´æ×ÊÔ´£¬Í¨¹ý Docker ±£Ö¤»·¾³ÍêÈ«¸ôÀë£¬ÈÎÎñÖ®¼ä²»ÊÜÓ°Ïì£¬ÈÎÎñ½áÊø£¬Õ¼ÓÃµÄ×ÊÔ´Ëæ¼´µÃµ½ÊÍ·Å¡£Í¬Ê±»ùÓÚ K8s ¿ÉÒÔ×öÁé»îµÄµ÷¶È²ßÂÔ¡£ÈçÏÖÔÚ¼¯ÈºÓÐ¶àÖÖÀàÐÍµÄ GPU ¿¨£¬ÓÃ»§¿ÉÒÔ¸ù¾ÝÊµ¼ÊÇé¿öÑ¡Ôñ¿¨µÄÀàÐÍ£¬¾ßÌå×ö·¨Í¨¹ý¶Ô GPU ½Úµã´ò label µÄ·½Ê½ÊµÏÖ£¬¸ù¾Ý½ÚµãÀàÐÍ±ê¼Ç¶ÔÓ¦µÄ label£¬Æô¶¯ÈÎÎñÅäÖÃ nodeSelector ÊµÏÖ¿¨ÀàÐÍµÄ¾«È··ÖÅä£»ÓÉÓÚ k8s ·ÖÅä×î´ó×ÊÔ´ÊÇÕû¸öÎïÀí»úµÄ×ÊÔ´£¬ÓÐÐ©¸´ÔÓµÄÑµÁ·ÈÎÎñÔÚµ¥»ú¶à¿¨·½Ê½ÏÂ£¬ÎªÁËÄÜ·Öµ½¸ü¶àµÄ GPU ¿¨½øÐÐÑµÁ·£¬ÔÚÑµÁ·¼¯ÈºÊ¹ÓÃ K8s µÄ½ÚµãÇ×ºÍÐÔµ÷¶È nodeAffinity£¬¿ÉÒÔÊ¹ÑµÁ·ÈÎÎñ¼¯ÖÐµ÷¶È¡£K8s Ö§³ÖÍ¨¹ý²å¼þµÄ·½Ê½½øÐÐ×Ô¶¨Òåµ÷¶È£¬Èç¹ûÏÖÓÐµÄµ÷¶È·½Ê½²»Âú×ãÐèÇó£¬¿ÉÒÔÍ¨¹ý×Ô¶¨Òåµ÷¶ÈÊµÏÖ¸üÁé»îµÄµ÷¶È²ßÂÔ¡£

¢Ú ½¨Ä£ÑµÁ·

Éî¶ÈÑ§Ï°ÑµÁ·µÄÏ¸½ÚÈçÉÏÍ¼£¬ÓÃ»§Í¨¹ý WEB ¿Í»§¶Ë»ò Shell ¿Í»§¶ËÌá½»ÑµÁ·ÈÎÎñ£¬·þÎñ¶ËÄÃµ½ÓÃ»§Ìá½»²ÎÊý£¬×é×°ºÃ K8s ×ÊÔ´ºÍÅäÖÃ yaml ÎÄ¼þ£¬Ìá½»µ½ K8s ¼¯Èº¡£ÔÚÆô¶¯ÈÎÎñÖ®Ç°£¬»áÍ¨¹ý¼¯ÈºÀïµÄ StorageClass ´´½¨ºÃ pvc ¶ÔÏó£¬×÷ÎªÑµÁ·ÈÎÎñ¹ÒÅÌ¶ÔÏó£¬Èç¹ûÓÃ»§Ê¹ÓÃµÄ Tensorflow ¿ò¼ÜÑµÁ·£¬Æ½Ì¨Ö§³ÖÆô¶¯ Tensorboard£¬·½±ã²é¿´ÑµÁ·µÄÐ§¹ûºÍ½ø¶È£¬´ËÊ±Ò²»á´´½¨ Tensorboard µÄ¸ºÔØ¶ÔÏó Ingress ºÍ Service¡£Ç°Ãæ×¼±¸¹¤×÷×öÍê£¬K8s »á¸ù¾ÝÓÃ»§Ö¸¶¨µÄ GPU¡¢CPU¡¢ÄÚ´æ¼°¿¨ÀàÐÍ²ÎÊýÔÚ¼¯ÈºÀïÍ¨¹ýµ÷¶È·ÖÅäÑµÁ·ÈÎÎñµ½ºÏÊÊµÄ½Úµã£¬Ã»ÓÐ×ÊÔ´»á´¦ÓÚµÈ´ý×´Ì¬£¬Ö±µ½ÓÐ×ÊÔ´¿ÉÒÔµ÷¶ÈÆô¶¯ÈÎÎñ¡£Æô¶¯ÈÎÎñºó£¬ÏÈ½øÐÐÈÝÆ÷»·¾³µÄ³õÊ¼»¯¹ý³Ì£¬Ö÷Òª°üÀ¨ÅäÖÃ Hadoop Ïà¹ØÈ¨ÏÞ£¬ÑµÁ·Êý¾ÝºÍÑµÁ·½Å±¾µÄÀÈ¡£¬³õÊ¼»¯¹¤×÷Íê³ÉºóÑµÁ·ÈÎÎñ¿ªÊ¼ÔËÐÐ£¬ÑµÁ·¹ý³ÌÖÐ£¬Æ½Ì¨Ö§³Öµ¼³öÖÐ¼äµÄÑµÁ·½á¹û£¬ÑµÁ·½áÊøºó£¬×îÖÕ½á¹û»á×Ô¶¯Êä³öµ½ÓÃ»§Ö¸¶¨µÄÊä³öÄ¿Â¼¡£

¢Û Éî¶ÈÑ§Ï°·Ö²¼Ê½ÑµÁ·
Èç¹ûÑµÁ·Ê±¼ä³¤»òÕßÑù±¾¹æÄ£´ó£¬³¬¹ýµ¥Ì¨·þÎñÆ÷ÄÜÁ¦Ê±£¬ÐèÒªÖ§³Ö·Ö²¼Ê½ÑµÁ·¡£ÒÔ Tensorflow ·Ö²¼Ê½ÎªÀý£¬Ò»¸ö TensorFlow ·Ö²¼Ê½³ÌÐò¶ÔÓ¦Ò»¸ö³éÏóµÄ¼¯Èº£¬¼¯Èº ( cluster ) ÓÉ¹¤×÷½Úµã ( worker ) ºÍ²ÎÊý·þÎñÆ÷ ( parameter server ) ×é³É¡£¹¤×÷½Úµã ( worker ) ³Ðµ£¾ØÕó³Ë¡¢ÏòÁ¿¼ÓµÈ¾ßÌå¼ÆËãÈÎÎñ£¬¼ÆËã³öÏàÓ¦²ÎÊý ( weight ºÍ bias )£¬²¢°Ñ²ÎÊý»ã×Üµ½²ÎÊý·þÎñÆ÷£»²ÎÊý·þÎñÆ÷ ( parameter server ) °Ñ´ÓÖÚ¶à¹¤×÷½ÚµãÊÕ¼¯²ÎÊý»ã×Ü²¢¼ÆËã£¬²¢´«µÝ¸øÏàÓ¦¹¤×÷½Úµã£¬ÓÉ¹¤×÷½Úµã½øÐÐÏÂÒ»ÂÖ¼ÆËã£¬Èç´ËÑ»·Íù¸´¡£

¶ÔÓ¦µ½Æ½Ì¨ÖÐ£¬Æ½Ì¨Ìá¹©ÁË Tensorflow ·Ö²¼Ê½µÄ ps ½ÚµãºÍ worker ½Úµã£¬Æ½Ì¨¸ºÔðÁË ps ½ÚµãºÍ worker ½ÚµãµÄÍøÂç»¥Í¨£¬¹¹½¨ÁË ClusterSpec£¬¶¨ÒåÁË2¸ö ps ½Úµã£¬3¸ö worker ½Úµã¡£

tf.train.ClusterSpec({"worker": ["worker0.example.com:2222",
                              "worker1.example.com:2222",
                              "worker2.example.com:2222"],
                  "ps": ["ps0.example.com:2222",
                        "ps1.example.com:2222"]})

ÕâÐ©ÄÚÈÝÓÃ»§²»ÐèÒª½øÐÐÅäÖÃ£¬Ö»ÐèÒªÔÚ Tensorflow ×é¼þ²ÎÊýÖÐÉèÖÃ ps ºÍ worker µÄ¸öÊý£¬ÔÚÆô¶¯ÃüÁîÀïÍ¨¹ý»ñÈ¡ PS_HOSTS¡¢WORKER_HOSTS¡¢JOB_NAME ºÍ TASK_INDEX »·¾³±äÁ¿³õÊ¼»¯Ïà¹Ø²ÎÊý£¬¾Í¿ÉÒÔ¿ìËÙÆô¶¯·Ö²¼Ê½ÑµÁ·ÈÎÎñ£¬ÕâÑù¼ò»¯ÁËÓÃ»§Ê¹ÓÃ·Ö²¼Ê½ÑµÁ·µÄ¹¤×÷Á¿¡£

Æ½Ì¨¹¹½¨·Ö²¼Ê½ÈÎÎñµÄ¾ßÌåÊµÏÖ·½Ê½Ê±ÕâÑùµÄ£¬Èç¶¨ÒåÁË m ¸ö ps£¬n ¸ö worker£¬ÔÚ K8s ¼¯ÈºÀï¶¨Òå n ¸ö Job ¶ÔÓ¦Îª·Ö²¼Ê½ÈÎÎñµÄ worker£¬n ¸ö Job ¹²ÏíÍ¬Ò»·ÝÊý¾Ý£¬È»ºó¶¨Òå m ¸ö Deployment ¶ÔÓ¦Îª·Ö²¼Ê½ÈÎÎñµÄ ps£¬°ÑÃ¿¸ö½ÇÉ«µÄÍøÂçÁ¬½Ó·½Ê½·ÅÖÃÔÚ ps ºÍ worker µÄ»·¾³±äÁ¿ÖÐ¹©ÓÃ»§³õÊ¼»¯²ÎÊýÊ¹ÓÃ£¬ÈÎÎñ½áÊøºó£¬ÑµÁ·½á¹û´Ó worker-0 µ¼³öµ½ HDFS ÖÐ£¬¼ÆËã×ÊÔ´ÊÍ·Å¡£

4. Ä£ÐÍ²¿Êð¹ÜÀí
Æ½Ì¨ÉÏÑµÁ·µÄ»úÆ÷Ñ§Ï°Ä£ÐÍÍ¨¹ý PMML ¸ñÊ½µ¼³ö£¬Í³Ò»´æ·ÅÔÚ HDFS ÖÐ½øÐÐÎ¬»¤£¬Í¨¹ýÆ½Ì¨Ò»¼ü²¿ÊðÔ¤²â·þÎñ¡£¶ÔÓÚÉî¶ÈÑ§Ï°Ä£ÐÍ£¬Æ½Ì¨Ìá¹©ÁË ModelZoo ¹¦ÄÜ£¬Ö§³ÖÓÃ»§ÉÏ´«Ä£ÐÍÎÄ¼þ£¬Í¨¹ýÆ½Ì¨Ìá¹©µÄ¹«¹²Éî¶ÈÑ§Ï°¿ò¼ÜµÄ Serving ¾µÏñÆô¶¯Ô¤²â·þÎñ£¬Í¬Ê±Æ½Ì¨Ò²Ö§³ÖÓÃ»§ÓÃ×Ô¼º¹¹½¨µÄ¾µÏñÀ´²¿ÊðÔ¤²â·þÎñ£¬ÕâÑù¼ò»¯ÁËËã·¨¹¤³ÌÊ¦²¿ÊðÔ¤²â·þÎñµÄÁ÷³Ì£¬Í¬Ê±Ò²²»Ê§Áé»îÐÔ¡£

½èÖúÓÚ K8s ¶Ô·þÎñ²¿ÊðµÄÖ§³Ö£¬Æ½Ì¨Ìá¹©ÁË·þÎñµÄÉìËõ£¬¸üÐÂ£¬Ê¹·þÎñÁ÷Á¿Ôö³¤Ê±ÄÜ¿ìËÙÊµÏÖ·þÎñµÄÀ©ÈÝ£¬Í¬Ê±Ìá¹©ÁË·þÎñµÄ¶¯Ì¬ÉìËõ¹¦ÄÜ£¬ÄÜ×öµ½·þÎñÁ÷Á¿Í»ÔöÊ±ÊµÏÖ·þÎñµÄ×Ô¶¯À©ÈÝ£¬·þÎñÁ÷Á¿ÏÂ½µÊ±×Ô¶¯Ëõ½øÊµÀý£¬Ê¹·þÎñ¶ËµÄ GPU µÃµ½Ò»¸öºÏÀíµÄÀûÓÃ¡£

Æ½Ì¨³ÉÐ§ÓëÓ¦ÓÃ

Õë¶ÔÖ®¼ÒËã·¨¹¤³ÌÊ¦µÄÊµ¼ÊÒµÎñ³¡¾°ÐèÒª£¬Éî¶ÈÑ§Ï°Æ½Ì¨Ö§³ÖÁËÄ¿Ç°Ö÷Á÷µÄÉî¶ÈÑ§Ï°¿ò¼Ü Tensorflow£¬Caffe£¬PaddlePaddle£¬PyTorch£¬Keras£¬Kaldi µÈ£¬Éæ¼°µ½Í¼Ïñ¡¢ÓïÒô¡¢NLP¡¢ÊÓÆµ¡¢ÍÆ¼ö¡¢¹ã¸æµÈ¶à¸öÒµÎñÁìÓò¡£ÈçÓïÒôµÄ DeepSpeech Ä£ÐÍ£¬Í¼ÏñµÄ ResNet¡¢AlexNet¡¢EfficientNet Ä£ÐÍ£¬NLP µÄ bert Ä£ÐÍ£¬ÍÆ¼ö¹ã¸æµÄ DeepFM¡¢DCN¡¢DIEN Ä£ÐÍ¡£

Æ½Ì¨ÉÏÏßºó£¬»úÆ÷µÄ¹©ÐèÃ¬¶ÜµÃµ½ºÜºÃµÄ½â¾ö£¬»úÆ÷ÀûÓÃÂÊµÃµ½ºÜ´óµÄÌáÉý¡£ÉÏÏßÇ°Ëã·¨¹¤³ÌÊ¦¿ÉÓÃµÄ»úÆ÷Ö»ÓÐÉêÇëµÄÓÐÏÞµÄ¼¸Ì¨»úÆ÷£¬ÉÏÏßºó¿ÉÓÃµÄÊÇÕû¸ö¼¯ÈºµÄ×ÊÔ´£¬¼´À´¼´ÓÃ£¬²»ÓÃÊÍ·Å£¬Æ½Ì¨¶Ô¼¯ÈºÀïµÄ»úÆ÷×ÊÔ´Ê¹ÓÃ½øÐÐÁËÈ«·½Î»µÄ¼à¿Ø£¬ÄÜÊµÊ±²é¿´¼ÆËã×ÊÔ´µÄÊ¹ÓÃÇé¿ö¡£Í¬Ê±Æ½Ì¨ºÜºÃµÄÖ§³ÖÁËÄ£ÐÍ²¿Êð£¬ÏßÉÏ»·¾³¸ôÀë£¬¶à°æ±¾²¿Êð£¬¿ìËÙÆô¶¯£¬Ê¹»úÆ÷Ñ§Ï°·þÎñÉÏÏßÐ§ÂÊµÃµ½ºÜ´óÌáÉý¡£

1. ¹º³µÒâÔ¸Ä£ÐÍÔÚ»úÆ÷Ñ§Ï°Æ½Ì¨ÉÏµÄÓ¦ÓÃ
×÷ÎªÈ«Çò·ÃÎÊÁ¿×î´óµÄÆû³µÍøÕ¾£¬ÈçºÎ´Óº£Á¿µÄÓÃ»§·ÃÎÊä¯ÀÀÐÐÎªÖÐ·¢¾òÓÃ»§¹º³µµÄÒâÏò»òÖÐÒâµÄ³µÏµ³µÐÍ£¬Ò»Ö±ÊÇÆû³µÖ®¼ÒËã·¨¹¤³ÌÈËÔ±ÑÐ¾¿µÄÖØµã¿ÎÌâ¡£

ÏÂÃæ½éÉÜÍ¨¹ý GBDT Ä£ÐÍ¶ÔÓÃ»§µÄ¹º³µÒâÔ¸½øÐÐÔ¤²â½¨Ä£¡£

¢Ù Êý¾Ý¼¯½éÉÜ
Êý¾Ý½ØÍ¼ÈçÏÂ£º

¢Ú Êý¾ÝÌ½Ë÷Á÷³Ì
ÊµÑéÁ÷³ÌÍ¼ÈçÏÂ£º

Êý¾ÝÔ´×¼±¸
ÊäÈëÊý¾Ý£º

[*]ÓÃ»§ä¯ÀÀÐÐÎªÊý¾Ý¼¯£º¹²16503613ÌõÊý¾ÝÐÍ£¬°üÀ¨ "duration"¡¢"freqs_rank" µÈÌØÕ÷£¬"label" ÎªÊÇ·ñÂò³µ¡£
[*]Êý¾ÝÀ´Ô´£ºÆû³µÖ®¼ÒÊý¾Ý²Ö¿â ( hive )

Êý¾ÝÔ¤´¦Àí
ÀûÓÃÀàÐÍ×ª»»×é½¨£¬½«Êý¾Ý¼¯ÖÐµÄ string ÀàÐÍ×ªÎª float ÀàÐÍ·½±ãºóÐøµÄ¼ÆËã£¬ÔÙÀûÓÃ²ð·Ö×é½¨½«Êý¾Ý¼¯»®·ÖÎªÑµÁ·¼¯ ( Õ¼×ÜÊý¾Ý¼¯µÄ85% ) ºÍ²âÊÔ¼¯ ( Õ¼×ÜÊý¾Ý¼¯µÄ15% )¡£

Ä£ÐÍÑµÁ·¼°Ô¤²â
Ê¹ÓÃ»úÆ÷Ñ§Ï°×é½¨ÖÐµÄ GBDT Ëã·¨¶ÔÊý¾Ý¼¯½øÐÐÑµÁ·²¢Éú³É»Ø¹éÄ£ÐÍ£¬ÔÚÔ¤²â×é¼þÖÐÀûÓÃ¶þ·ÖÀàÆÀ¹À×é½¨¶ÔÔ¤²â¼¯Êý¾Ý½øÐÐÁËÔ¤²â¡£½á¹ûÈçÏÂÍ¼ËùÊ¾¡£

ÌØÕ÷ÖØÒªÐÔÆÀ¹À
Í¨¹ýÌØÕ÷ÖØÒªÐÔÆÀ¹À×é¼þ¶ÔÄ£ÐÍÖÐµÄ¸÷¸öÌØÕ÷½øÐÐÆÀ¹À¼ÆËã³ö¸ÃÌØÕ÷µÄÖØÒªÐÔÈ¨ÖØ£¬ÆÀ¹À½á¹ûÈçÏÂÍ¼ËùÊ¾¡£

2. ÍÆ¼öÅÅÐòÄ£ÐÍÔÚ»úÆ÷Ñ§Ï°Æ½Ì¨ÉÏµÄÓ¦ÓÃ
ÏÂÃæÖ÷Òª´ÓÍÆ¼öÅÅÐòÄ£ÐÍÈçºÎ½èÖú»úÆ÷Ñ§Ï°Æ½Ì¨½øÐÐÊý¾Ý½ÓÈë¡¢Êý¾Ý´¦Àí¡¢½¨Ä£¡¢ÑµÁ·µÈËÄ¸ö·½Ãæ½øÐÐ·Ö±ð²ûÊö¡£

¢Ù Êý¾Ý½ÓÈë

»úÆ÷Ñ§Ï°Æ½Ì¨Ö§³Ö¶àÖÖÊý¾ÝÔ´½ÓÈë£¬Ä¿Ç°ÍÆ¼öÒµÎñµÄÀëÏßÊý¾Ý´æ·ÅÔÚ HDFS ÉÏ£¬ÊµÊ±Êý¾ÝÍ¨¹ý Flink ½ÓÈë¡£

¢Ú Êý¾Ý´¦Àí
»úÆ÷Ñ§Ï°Æ½Ì¨¶Ô³£¼ûµÄÊý¾Ý´¦Àí·½Ê½½øÐÐÁË·â×°£¬²»½öÖ§³Ö¶ÔÄ³Ð©ÌØÕ÷µÄÒì³£Öµ¼ì²â¡¢Êý¾Ý·ÖÎöµÈ¹¦ÄÜ£¬»¹Ö§³Ö¶ÔÌØÕ÷Êý¾Ý½øÐÐ±ê×¼»¯¡¢¹éÒ»»¯¡¢½µÎ¬¡¢·ÖÍ°µÈ³£¼ûµÄÊý¾Ý´¦Àí·½Ê½£¬Í¬Ê±»¹¿ÉÒÔÍ¨¹ý×Ô¶¨ÒåsqlµÄ·½Ê½Ìá¹©Ò»Õ¾Ê½µÄÊý¾Ý´¦ÀíÒÔ¼°Êý¾Ý¿ÉÊÓ»¯·ÖÎö¡£

¢Û ½¨Ä£
»úÆ÷Ñ§Ï°Æ½Ì¨Ä¿Ç°Ö§³ÖÉÏ°ÙÖÖ×é¼þ£¬¶ÔÍÆ¼öÅÅÐò³¡¾°Ìá¹©ÁËÈ«·½Î»µÄÖ§³Ö¡£ÆäÖÐÄ£ÐÍ²»½öÖ§³Ö LR¡¢GBDT¡¢XGB µÈ´«Í³µÄ»úÆ÷Ñ§Ï°Ä£ÐÍ£¬Í¬Ê±»¹Ö§³Ö³£¼ûµÄÉî¶ÈÑ§Ï°Ä£ÐÍ£¬Èç FM¡¢Wide&Deep¡¢DeepFM¡¢DCN µÈ£¬ÏÂÍ¼½«Õ¹Ê¾ online DeepFM ÔÚ»úÆ÷Ñ§Ï°ÉÏÓ¦ÓÃµÄÊµÀý¡£

½¨Ä£¹ý³ÌÖÐ£¬´«Í³µÄ»úÆ÷Ñ§Ï°Ä£ÐÍ¿ÉÒÔÍ¨¹ý×Ô¶¯»¯µÄµ÷²Î·½Ê½½øÐÐÖ÷Òª²ÎÊýÉèÖÃ£¬³£¼ûµÄÉî¶ÈÑ§Ï°Ä£ÐÍÌá¹©ÁË²¿·Ö²ÎÊýµÄÅäÖÃ£¬ÈçÍøÂç²ãÊý£¬dense embedding µÄÎ¬Êý£¬Ñ§Ï°ÂÊË¥¼õÏµÊýµÈ£¬ÕâÎªÄ£ÐÍµÄÑµÁ·´øÀ´ºÜ´óµÄ±ãÀû¡£

¢Ü ÑµÁ·
Ö®¼ÒµÄÍÆ¼öÅÅÐòÄ£ÐÍ¾ÀúÁË´Ó´«Í³µÄ»úÆ÷Ñ§Ï°Ä£ÐÍ LR¡¢xgb µ½ FM ¡¢Wide&Deep¡¢DeepFM¡¢DIN¡¢MMOE µÈÉî¶ÈÑ§Ï°Ä£ÐÍµÄµü´úÑÝ½ø¡£Ö®¼ÒÊ×Ò³ÍÆ¼öÃ¿Ìì»á²úÉúÉÏÒÚÌõÈÕÖ¾Êý¾Ý£¬¾¹ýÊý¾ÝÇåÀíºó£¬ÑµÁ·Ñù±¾Êý¾ÝÁ¿´ïµ½°Ù G ÉõÖÁ T ¼¶±ð£¬Ãæ¶ÔÈç´Ë´ó¹æÄ£µÄÊý¾Ý£¬ÈçºÎÓÐÐ§µÄËõ¶ÌËã·¨µÄÑµÁ·Ê±¼ä³ÉÎªÁË¹Ø¼ü¡£

´«Í³µÄ»úÆ÷Ñ§Ï°Ä£ÐÍÈç LR£¬XGB µÈ»ùÓÚ Spark ½øÐÐ·Ö²¼Ê½µÄÑµÁ·£¬ÑµÁ·Ê±¼äÔÚÐ¡Ê±¼¶±ð£¬½ÏÎª¿É¿Ø¡£µ«ÊÇÉî¶ÈÑ§Ï°Ä£ÐÍ¶ÔÓÚ´óÊý¾ÝÁ¿£¬ÑµÁ·Ê±¼äÏà¶Ô½Ï³¤£¬K80 µ¥¿¨ÑµÁ·ÐèÒª½üÒ»ÖÜµÄÊ±¼ä£¬V100 µ¥¿¨ÑµÁ·ÐèÒª4Ìì¡£ÎªÁËËõ¶ÌÑµÁ·Ê±¼ä£¬¿ìËÙµü´úÄ£ÐÍ£¬ÎÒÃÇ²ÉÓÃÁË¶à»ú¶à¿¨Ê½µÄÑµÁ··½Ê½ £¬ÒÔ Tensorflow ÎªÀý£¬²ÉÓÃ Multi Worker MirroredStrategy µÄ·½Ê½£¬Multi Worker MirroredStrategy²»ÐèÒª Parameter server£¬Ö»ÐèÒªÉèÖÃÒ»ÏµÁÐµÄ TF_CONFIG »·¾³±äÁ¿£¬ÕâÑù½µµÍÁË¶à»ú¶à¿¨µÄµ÷ÊÔÄÑ¶È£¬ÊµÀýÈçÏÂ£º

Í¬Ê±»úÆ÷Ñ§Ï°Æ½Ì¨Éî¶ÈÑ§Ï°²¿·Ö¿ÉÒÔÁé»îµÄÑ¡ÔñÑµÁ··½Ê½ÒÔ¼°²ÎÊýÉèÖÃ,ÈçÏÂÍ¼ËùÊ¾£º

²ÉÓÃ¶à»ú¶à¿¨ÑµÁ·µÄ·½Ê½½«Éî¶ÈÑ§Ï°Ä£ÐÍÈç DeepFM¡¢Wide&deep µÈÑµÁ·Ê±¼äÑ¹ËõÔÚ 24h ÄÚ£¬»ù±¾´¦ÓÚ¿É½ÓÊÜ·¶Î§ÄÚ¡£

ÎªÁËÈÃÄ£ÐÍÄÜ¹»·ÖÖÓ¼¶µü´ú£¬²¢ÄÜÊµÊ±µÄ·´À¡¸øÍÆ¼öÏµÍ³£¬»úÆ÷Ñ§Ï°Æ½Ì¨Ìá¹©ÁË·ÖÖÓ¼¶ÊµÊ±ÑµÁ·¹¦ÄÜ£¬²¢¶ÔÑµÁ·ºÃµÄÄ£ÐÍ½øÐÐÆÀ¹ÀÖ¸±êµÄÑéÖ¤ºÍ¸üÐÂÉÏÏß¡£ÊµÊ±ÑµÁ·µÄÁ÷³ÌÖ÷ÒªÊÇÍ¨¹ý Flink ½ÓÈëÊµÊ±ÈÕÖ¾Êý¾Ý£¬½«Ã¿Ê®·ÖÖÓÊÕ¼¯µÄÊý¾Ý´æ·ÅÔÚ HDFS ÉÏ£¬È»ºóÔÚ»úÆ÷Ñ§Ï°Æ½Ì¨ÉÏÖÆ¶¨¶¨Ê±ÈÎÎñ,½øÐÐÌØÕ÷¹¤³ÌºÍÄ£ÐÍÑµÁ·£¬ÑµÁ·Íê±Ïºó¾¹ýÆÀ¹ÀÖ¸±êµÄÑéÖ¤ÅÐ¶ÏÊÇ·ñ½øÐÐÄ£ÐÍ¸üÐÂ£¬¾ßÌåÁ÷³ÌÍ¼ÈçÏÂ£º

»úÆ÷Ñ§Ï°Æ½Ì¨ÎªÍÆ¼öÅÅÐòÌá¹©ÁËÒ»Õ¾Ê½µÄÈ«Á÷³ÌÖ§³Ö£¬´ÓÊý¾Ý´¦Àí¡¢½¨Ä£¡¢ÑµÁ·¡¢Ä£ÐÍÆÀ¹ÀÒÔ¼°Ä£ÐÍÉÏÏß£¬ÊµÏÖÁË·ÖÖÓ¼¶µü´úÄ£ÐÍ¡£Æ½Ì¨µÄ½¨Á¢´ó´óÌá¸ßÁËÍÆ¼öÅÅÐòÄ£ÐÍµÄµü´úËÙ¶È£¬ÌáÉýÁËËã·¨¹¤³ÌÊ¦µÄ¹¤×÷Ð§ÂÊ£¬ÎªÖ®¼ÒÍÆ¼öÅÅÐòÒµÎñµÄ·¢Õ¹Ìá¹©ÁËÓÐÁ¦±£ÕÏ¡£

Æ½Ì¨Õ¹Íû

1. Ôö¼ÓËã·¨×é¼þ
Æ½Ì¨¾¹ýÁ½¸ö°æ±¾µÄµü´ú£¬½â¾öÁË×ÊÔ´ÀûÓÃÂÊµÍºÍËã·¨¹¤×÷ÖØ¸´µÄÎÊÌâ£¬Ëæ×Å½ÓÈëÓÃ»§ºÍÒµÎñµÄÔö¼Ó£¬¶ÔÆ½Ì¨Ò²Ìá³öÁË¸ü¸ßµÄÒªÇó¡£ÈçÍÆ¼öÒµÎñÀï£¬ÔÚÏß»úÆ÷Ñ§Ï°¼¸ºõÊÇÈÆ²»¿ªµÄ»°Ìâ£¬ÎªÁË¸üºÃµÄÖ§³ÖÔÚÏß»úÆ÷Ñ§Ï°£¬ÎÒÃÇ½ÓÏÂÀ´»áÈÚÈëÔÚÏß»úÆ÷Ñ§Ï°µÄ×é¼þ¡£ÀàËÆÕâÖÖÒµÎñ³¡¾°»áÔ½À´Ô½¶à£¬ÎÒÃÇ»á¸ù¾ÝÒµÎñÐèÒª¼ÓÈë¸ü¶àµÄËã·¨×é¼þ¡£

2. GPU¿¨¹²Ïí
ÎÞÂÛÊÇÑµÁ·ÈÎÎñ»¹ÊÇ·þÎñ²¿Êð£¬ÓÃµ½µÄ GPU ¿¨¶¼ÊÇ¶ÀÏíµÄ£¬ÑµÁ·ÈÎÎñµÄ GPU ¿¨ÀûÓÃÂÊÒ»°ã¶¼±È½Ï¸ß£¬´ó²¿·ÖÔÚ50%ÒÔÉÏ£¬²¿ÊðµÄ·þÎñËæ×Å TPS µÄÔö³¤¶øÔö³¤£¬GPU ¿¨µÄÊµ¼ÊÀûÓÃÂÊ¶¼²»¸ß£¬ÎªÁËÌáÉý·þÎñÊµÀýµÄ GPU ¿¨ÀûÓÃÂÊ¾ÍÒªÌá¹© GPU ¿¨µÄ¹²Ïí¡£½â¾ö·½Ê½Ò»°ãÓÐÁ½ÖÖ£¬Ò»ÖÖÊÇ GPU ÐéÄâ»¯£¬ÏñÐéÄâ»úµÄ CPU Ò»Ñù£¬Ä¿Ç° Nvidia Ìá¹©ÕâÖÖÐéÄâ»¯·þÎñ£¬µ«ÊÇ License ·ÑÓÃ°º¹ó£»ÁíÍâÒ»ÖÖ·½Ê½Í¨¹ýÐÞ¸Ä K8s µÄµ÷¶È²ßÂÔ£¬À´Ö§³Ö·ÇÕûÊý¿¨µÄµ÷¶È·ÖÅä¡£ºóÃæ»á»ùÓÚµÚ¶þÖÖ·½Ê½³¢ÊÔÊµÏÖ GPU ¿¨µÄ¹²Ïí¡£

½ñÌìµÄ·ÖÏí¾Íµ½ÕâÀï£¬Ð»Ð»´ó¼Ò¡£

ÎÄÕÂ×÷Õß£º

Ìï¶ÌÎ£¬Æû³µÖ®¼Ò¸ß¼¶Ëã·¨¹¤³ÌÊ¦¡£2017Äê¼ÓÈëÆû³µÖ®¼Ò£¬Æû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨¸ºÔðÈË£¬Ä¿Ç°ÔÚÆû³µÖ®¼Ò¸ºÔð»úÆ÷Ñ§Ï°Æ½Ì¨µÄ¼Ü¹¹ºÍ¿ª·¢¹¤×÷¡£

ÍõÈôÓÞ£¬Æû³µÖ®¼ÒËã·¨¹¤³ÌÊ¦¡£2018Äê¼ÓÈëÆû³µÖ®¼Ò£¬Ä¿Ç°Ö÷Òª´ÓÊÂÍÆ¼öÅÅÐòºÍ»úÆ÷Ñ§Ï°Æ½Ì¨Ïà¹Ø¹¤×÷¡£

·½¾Ø£¬Æû³µÖ®¼ÒËã·¨¹¤³ÌÊ¦¡£2018Äê¼ÓÈëÆû³µÖ®¼Ò£¬Ä¿Ç°Ö÷Òª´ÓÊÂÍÆ¼öÅÅÐòËã·¨Ïà¹Ø¹¤×÷¡£

ÔÎÄÁ´½Ó£º
https://mp.weixin.qq.com/s/ZkZac2ouGHkX8DirT0tB4w

ÃÀÀöÌì¿Õ ·¢±íÓÚ 2020-7-3 16:41:17

¸ÐÐ»·ÖÏí

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

Æû³µÖ®¼Ò»úÆ÷Ñ§Ï°Æ½Ì¨µÄ¼Ü¹¹ÓëÊµ¼ù