½èÖú Flink Óë Pulsar£¬BIGO ´òÔìÊµÊ±ÏûÏ¢´¦ÀíÏµÍ³-Flink-AboutÔÆ-ËóÂ×¿Æ¼¼

hyj ·¢±íÓÚ 2021-10-28 21:38:45

½èÖú Flink Óë Pulsar£¬BIGO ´òÔìÊµÊ±ÏûÏ¢´¦ÀíÏµÍ³

ÎÊÌâµ¼¶Á

1.BIGO ÊÇÊ²Ã´£¿
2.ÎªÊ²Ã´Ñ¡Ôñ Apache Pulsar£¿
3.Pulsar ÔÚ BIGO ÖÐÊÇÊ²Ã´½ÇÉ«£¿

Ò»¡¢¹ØÓÚ BIGO
½èÖúÓÚ´óÊý¾ÝºÍÈË¹¤ÖÇÄÜ¼¼Êõ£¬BIGO »ùÓÚÊÓÆµµÄ·þÎñºÍ²úÆ·»ñµÃÁË¹ã·ºµÄ»¶Ó£¬ÔÚ 150 ¶à¸ö¹ú¼ÒºÍµØÇø»ñµÃÁË´óÁ¿µÄÓÃ»§¡£BIGO Ö÷ÒªÓÐÁ½¿î·Ç³£Á÷ÐÐµÄ²úÆ·£¬µÚÒ»¿îÊÇ BIGO Live£¬ÁíÍâÒ»¿îÊÇ Likee¡£BIGO Live ÊÇÒ»¸öÖ±²¥Æ½Ì¨£¬¶ø Likee ÊÇÒ»¸ö¶ÌÊÓÆµÆ½Ì¨¡£

¶þ¡¢ÎªÊ²Ã´Ñ¡Ôñ Apache Pulsar
ÔÚ¹ýÈ¥µÄ¼¸ÄêÀï£¬BIGO µÄÏûÏ¢Æ½Ì¨Ö÷Òª»¹ÊÇÒÔ¿ªÔ´µÄ Kafka ¼¯ÈºÎªÖ÷£¬µ«ÊÇËæ×ÅÒµÎñµÄ²»¶ÏÔö³¤¡¢ÓÃ»§²»¶ÏÀ©³ä£¬Õû¸öÏûÏ¢Á÷Æ½Ì¨Ëù³ÐÔØµÄÏûÏ¢Á¿ºÍÊý¾ÝÁ¿Ò²³öÏÖÁË³É±¶µÄÔö³¤£¬Í¬Ê±Ò²¶ÔÕû¸öÏûÏ¢Á÷ÏµÍ³Ìá³öÁË¸ü¸ßµÄÒªÇó¡£

Ö÷ÒªÌåÏÖÔÚÒÔÏÂ¼¸¸ö·½Ãæ£º

µÚÒ»£¬Ëü¶ÔÕû¸öÏµÍ³µÄÎÈ¶¨ÐÔ¡¢¿ÉÀ©Õ¹ÐÔÒÔ¼°Â³°ôÐÔÌá³öÁË¸ü¸ßµÄÒªÇó¡£

µÚ¶þ£¬ÓÉÓÚÎÒÃÇÊÇ¶ÌÊÓÆµÍÆ¼öÏà¹ØµÄ·þÎñ£¬ËùÒÔ¶ÔÕû¸öÏûÏ¢Á÷µÄµÍÑÓ³ÙÒ²Ìá³öÁË·Ç³£¸ßµÄÒªÇó¡£

Ëæ×ÅÊýÁ¿Ôö³¤£¬Õû¸ö BIGO µÄÏûÏ¢Á÷Æ½Ì¨µÄÍÅ¶ÓÔÚÎ¬»¤¶à¸ö Kafka ¼¯ÈºÉÏ¸¶³öÁË´óÁ¿µÄ¹¤×÷£¬°ÚÔÚÎÒÃÇÃæÇ°µÄÓÐºÜ¶à Kafka ¼¯ÈºÔËÎ¬Ïà¹ØµÄÎÊÌâ¡£Õâ¸öÊ±ºò£¬ÎÒÃÇ¾ÍÔÚË¼¿¼£¬ÎÒÃÇÊÇÑ¡Ôñ¿ªÔ´ Kafka µÄÒ»¸ö»ùÏß°æ±¾½øÐÐ×Ô¼ºµÄµü´ú¿ª·¢ÄØ£¿»¹ÊÇ¿´Ò»ÏÂ¿ªÔ´ÉçÇøÀïÃæÓÐÄÄÐ©¿ÉÒÔ½è¼øµÄ·½°¸£¬À´´òÔìÒ»¸ö·ûºÏÎÒÃÇÓ¦ÓÃ³¡¾°ÐèÇóµÄÏûÏ¢Á÷Æ½Ì¨¡£

ÓÚÊÇÎÒÃÇ½øÐÐÁËÒ»ÏµÁÐµ÷ÑÐ¡£ÔÚµ÷ÑÐµÄ¹ý³ÌÖÐ£¬ÎÒÃÇµÄÄ¿¹â×¢Òâµ½ÁË Apache Pulsar£¬ËüÓÐÒÔÏÂ¼¸µã feature ±È½Ï match ÎÒÃÇµÄÓ¦ÓÃ³¡¾°£º

[*]Ê×ÏÈ£¬ËüÄÜ¹»Ë®Æ½µØÀ©Õ¹¡£ÎÒÃÇÖªµÀ¶ÔÓÚ Kafka ¶øÑÔ£¬ËüÊÇÒ»¸ö·þÎñºÍ´æ´¢°ó¶¨µÄÏµÍ³¡£µ±ÎÒÃÇÐèÒªÈ¥À©ÈÝÒ»¸ö¼¯ÈºµÄÊ±ºò£¬µ¥µ¥°Ñ»úÆ÷ÉÏÏßÊÇ²»ÄÜ¹»Âú×ãÐèÇóµÄ£¬ÎÒÃÇÐèÒª¶ÔÕû¸ö topic µÄ partition ½øÐÐÏàÓ¦²Ù×÷£¬Õâ¸öÊ±ºò¾ÍÊÇºÄÈËÁ¦È¥ÔËÎ¬µÄ¡£ËùÒÔ£¬ÎÒÃÇÐèÒªÓÐÒ»¸öÄÜ¹»Ë®Æ½À©Õ¹µÄÏµÍ³¡£¶ø Apache Pulsar Ìá¹©µÄÊÇ´æ´¢ºÍ·þÎñ·ÖÀëµÄÒ»¸ö¼Ü¹¹£¬Ê¹ÓÃµÄÊÇ bookkeeper ×÷Îªµ×²ãµÄÊý¾Ý´æ´¢£¬ÉÏ²ãÓÐÒ»¸ö broker À´Ìá¹©Ïà¹ØµÄ·þÎñ¡£
[*]ÁíÍâ£¬¾ÍÊÇËüµÄ low latency »¹ÓÐ¸ßÍÌÍÂ¡¢µÍÑÓ³ÙÒÔ¼°ÔÚÑÅ»¢µÄÉú²ú»·¾³ÉÏÃæ¾ÊÜÁË´óÊý¾ÝÁ¿µÄ¿¼Ñé¡£
[*]¿ç¼¯ÈºµÄ¸´ÖÆµÈÒ»ÏµÁÐµÄ feature ¶ÔÓÚÎÒÃÇ¶øÑÔÒ²ÊÇ·Ç³£ÐèÒªµÄ¡£
[*]²¢ÇÒ£¬ÕâÑùÒ»¸ö´æ´¢ºÍ·þÎñ·ÖÀëµÄ¼Ü¹¹Ò²¼«´óµØ¼õÉÙÁËÈË¹¤ÔËÎ¬µÄ³É±¾¡£

ËùÒÔÎÒÃÇÑ¡ÔñÁË Apache Pulsar¡£

Èý¡¢Apache Pulsar ÔÚ BIGO ÖÐµÄ½ÇÉ«

1. ÒýÈë Pulsar µÄÀú³Ì
ÔÚ 2019 Äê 11 ÔÂ£¬ÎÒÃÇÖØÐÂ¿ªÊ¼Ë¼¿¼ BIGO µÄÓ¦ÓÃ³¡¾°ÏÂÃæËùÐèÒªµÄÏûÏ¢Á÷Æ½Ì¨µ½µ×ÊÇÊ²Ã´ÑùµÄ¡£ÊÇ»ùÓÚÒ»¸ö¿ªÔ´µÄ Kakfa ¿ò¼ÜÈ¥¿ª·¢£¬»¹ÊÇÑ¡ÔñÁíÍâÒ»Ì×Õû¸öÏûÏ¢Á÷ÏµÍ³£¿

ÔÚ 2019 Äê 11 ÔÂ·Ý£¬ÎÒÃÇ×öÁËÒ»´ÎÕû¸öÏûÏ¢Á÷Æ½Ì¨µÄµ÷ÑÐ¹¤×÷¡£ÔÚµ÷ÑÐ¹ý³ÌÖÐ£¬ÎÒÃÇ¶Ô±ÈÁË Kafka¡¢RocketMQ¡¢Apache Pulsar µÈÒµ½çÏà½üµÄÏà¶ÔµÄÏûÏ¢¶ÓÁÐµÄÊµÏÖ¡£È»ºóÎÒÃÇ×öÁËÒ»ÏµÁÐµÄºáÏò¶Ô±È£¬²¢ÇÒ¸úÎÒÃÇµÄÒµÎñÐèÇó½øÐÐÁËÏàÓ¦µÄ±È½Ï¡£×îÖÕ·¢ÏÖÊ¹ÓÃ Apache Pulsar ÄÜ¹»½â¾öÎÒÃÇÉú²úÉÏµÄÒ»Ð©ÎÊÌâ£¬ÄÜ¹»ÎªÎÒÃÇµÄÏûÏ¢Á÷Æ½Ì¨Ìá¹©·Ç³£ºÃµÄÔËÎ¬Ïà¹ØµÄ¸ºµ£µÄ¼õÇá£¬ÒÔ¼°Õû¸öÏµÍ³µÄÎÈ¶¨ÐÔºÍÍÌÍÂµÄÌáÉý£¬ËùÒÔÎÒÃÇ¾ÍÑ¡ÔñÁË Apache Pulsar¡£

ÔÚ 2019 Äê 12 ÔÂ·Ý£¬ÎÒÃÇ½øÐÐÁËÒ»ÏµÁÐµÄÑ¹²â¡£ÈÎºÎÒ»¸ö¿ªÔ´µÄ¿ò¼Ü£¬Èç¹ûÃ»ÓÐ¾¹ý¹«Ë¾ÄÚ²¿µÄ´óÁ÷Á¿³¡¾°ÏÂµÄÑ¹²â£¬ÊÇ²»¸ÒÉÏÏßµÄ¡£ËùÒÔ´Ó 2019 Äê 12 ÔÂ·ÝÒ»Ö±µ½ 2020 Äê 4 ÔÂ·Ý£¬¾¹ýÁËÒ»ÏµÁÐµÄ³¤Ê±¼äµÄÑ¹²â¹¤×÷¡£

ÔÚÑ¹²âµÄ¹ý³ÌÖÐ£¬ÎÒÃÇÍ¬Ê±Ò²·¢ÏÖÁË Apache Pulsar µÄÒ»Ð©ÎÊÌâ£¬²¢ÇÒ¸øÉçÇøÐÞÁËÒ»ÏµÁÐµÄ bug¡£ÔÚ 2020 Äê 4 ÔÂ·Ý£¬ÎÒÃÇ°Ñ Apache Pulsar ²¿ÊðÔÚÁËÎÒÃÇµÄÉú²ú²âÊÔ»·¾³£»ÔÚÎÈ¶¨ÔËÐÐÒ»¸öÔÂÖ®ºó£¬ÎÒÃÇ¾Í°ÑËü²¿Êðµ½ÁËÉú²ú»·¾³£»ÔÚ 2020 Äê 5 ÔÂ·Ý£¬ÕýÊ½ÉÏÏß¡£

ÏÖÓÐµÄ Apache Pulsar ¼¯Èº¹æÄ££¬Ä¿Ç°ÓÐÊ®¼¸¸ö Apache Pulsar µÄ½Úµã¡£Õû¸ö¼¯ÈºµÄÈëÁ÷Á¿ÊÇÔÚ 2~3 GB/s¡£Ëæ×ÅÊ±¼äµÄÍÆÒÆ£¬Ò²ÓÐÔ½À´Ô½¶àµÄÓ¦ÓÃ»á²»¶ÏµØÇ¨ÒÆµ½ Apache Pulsar À´Ìæ´úÏÖÓÐµÄ Kafka ¼¯Èº¡£

2. Apache Pulsar µÄ½ÇÉ«
Apache Pulsar ÔÚÕû¸öÁ÷´¦Àí¹ý³ÌÖÐÌá¹©µÄÊÇÒ»¸ö PUB-SUB µÄ½ÇÉ«¡£

Ê×ÏÈ£¬ÓÐ BIGO Õâ±ßµÄ Baina£¬Ò»¸ö C++ ÊµÏÖµÄÏûÏ¢ÊÕ¼¯·þÎñ£¬°ÑÏà¹ØµÄÊý¾ÝÐ´µ½ Apache Pulsar Ïà¹ØµÄ topic ÀïÃæÈ¥£¬ÕâÊÇµÚÒ»ÖÖ³¡¾°¡£

µÚ¶þ³¡¾°¾ÍÊÇ KMM£¬Ò²¾ÍÊÇ Kafka µÄ Mirror Maker¡£

µÚÈýÖÖ³¡¾°ÊÇ Flink¡£ÁíÍâ¾ÍÊÇÒ»Ð©¸÷ÖÖÓïÑÔµÄ¿Í»§¶ËËùÊµÏÖµÄ producer¡£ËüµÄÏÂÓÎÖ÷ÒªÓÐ Flink¡¢Flink SQL ÒÔ¼°¸÷¸öÓïÑÔËùÊµÏÖµÄ consumer£¬±ÈÈçËµ golang¡¢JAVA£¬C++ µÄµÈµÈ¡£

3. ÏÂÓÎÖ§³ÅµÄÒµÎñ³¡¾°
µÚÒ»¸öÊÇÊµÊ±Êý²Ö£¬µÚ¶þ¸öÊÇÊµÊ±µÄ ETL£¬µÚÈý¸öÊÇÊµÊ±Êý¾Ý·ÖÎö£¬ÁíÍâ¾ÍÊÇÊµÊ±ÍÆ¼ö£¬»¹ÓÐ¸ü¶àµÄÒµÎñ³¡¾°Ò²ÔÚÖð½¥µÄ½éÈë¡£ÏÂÓÎµÄÊý¾Ý»áÐ´µ½ HIVE¡¢Pulsar µÄ topic¡¢ClickHouse¡¢Hadoop¡¢redis µÈÒ»ÏµÁÐÏÂÓÎµÄÏà¹Ø´æ´¢ÏµÍ³¡£

ËÄ¡¢Apache Pulsar ºÍ Flink ¹¹ÔìÊµÊ±ÏûÏ¢Á÷´¦ÀíÏµÍ³¡£
ÕâÀïÐèÒª·ÖÎªÒÔÏÂÈý¸ö·½ÃæÀ´½²£º

µÚÒ»£¬ÊÇ¹ØÓÚ Pulsar-Flink-Connector µÄÒ»Ð©ÄÚÄ»¡£ÎÒÏàÐÅÔÚ½éÉÜ Pulsar-Flink-Connector µÄÒ»Ð©ÄÚÄ»Ö®ºó£¬´ó¼Ò»á¶ÔÕû¸ö Flink Óë Pulsar Ö®¼ä½áºÏµÄ¹ØÏµ»á¸ü¼ÓµØÇåÎúÃ÷ÁÁ£¬ÔÚÊ¹ÓÃ¹ý³ÌÖÐÒ²»á¸ü¼ÓµØÇåÎú£»

µÚ¶þ£¬ÊÇ BIGO µÄÒ»¸ö use case£¬¾ÍÊÇÊ¹ÓÃ Apache Pulsar ºÍ Flink À´´òÔì×Ô¼ºµÄÊµÊ± ETL ´¦ÀíÏµÍ³£»

µÚÈý£¬ÊÇ½èÖú Apache Pulsar ºÍ Flink ´òÔì AB-test ÏµÍ³¡£

Ê×ÏÈ¿´Ò»ÏÂ Pulsar-Flink-Connector Õû¸öÉú²úºÍÏû·ÑµÄÂß¼¡£ËüÖ÷Òª°üÀ¨Ò»¸ö source µÄ API ºÍ sink µÄ API¡£¶ÔÓÚÏû·ÑµÄÊ±ºò£¬Ò²¾ÍÊÇÊ¹ÓÃÒ»¸ö Pulsar-Flink-Connector µÄ source À´¶©ÔÄ Pulsar µÄÒ»¸ö topic¡£ÁíÍâÒ»¸ö¾ÍÊÇÎÒÃÇÐ´Ò»¸ö sink£¬»á°Ñ Flink ÀïÃæµÄÊý¾ÝÐ´³öµ½ Pulsar µÄ topic ÀïÃæ¡£ÏÂÍ¼×ó±ßµÄ´úÂëÕ¹Ê¾ÔõÃ´È¥¶©ÔÄÕâÑùÒ»¸ö topic£¬Êµ¼ÊÉÏÖ»ÐèÒª new Ò»¸ö FlinkPulsarSource µÄÒ»¸öÁ÷£¬È»ºó°ÑÕâÌõÁ÷¼ÓÈëµ½ DataStream ÀïÃæÈ¥¾Í¿ÉÒÔÁË¡£

¶ÔÓÚ Flink Êý¾ÝµÄÐ´³ö¶øÑÔ£¬Ö»ÐèÒª new Ò»¸ö FlinkPulsar µÄ Sink£¬È»ºóÎÒÃÇµ÷ÓÃµÚ¶þ¸ö DataStream µÄ sink ¾Í¿ÉÒÔ°ÑÊý¾Ý¸øÐ´³öÈ¥ÁË¡£Êµ¼ÊÉÏ£¬Õû¸öµÄÊµÏÖ¶øÑÔ£¬¸ú Kafka µÄ API ÊÇ·Ç³£ÀàËÆµÄ¡£ÕâÀïÐèÒª×¢ÒâµÄ¼¸µã¾ÍÊÇ£¬¶ÔÓÚ FlinkPulsarSource ÀïÃæÐèÒª´«ÈëµÄÊÇ serviceUrl ÒÔ¼° adminUrl¡£

serviceUrl ÀàËÆÓÚ Kafka µÄ broker_list£»
adminUrl ¾ÍÊÇÎÒÃÇÈ¥ÒÔ¹ÜÀíÔ±µÄ·½Ê½À´¿ØÖÆ Pulsar µÄÒ»Ð©Ïà¹ØµÄ²Ù×÷¡£
Pulsar Flink ÔõÃ´ÑùÀ´¶©ÔÄ Pulsar µÄ topic£¬ÔõÃ´ÑùÏû·ÑÒÔ¼°ËüµÄ offset ÊÇÔõÃ´Ñù commit »ØÈ¥µÄ£¿

ÕâÀï¾Í»áÉæ¼°µ½ Pulsar Flink µÄ exactly-once source¡£ÔÛÃÇÊ×ÏÈÀ´¿´Ò»ÏÂÍ¼×ó±ß²¿·Ö¡£Õâ¸öÍ¼ÀïÃæÓÐÒ»¸ö Pulsar µÄ topic£¬µ±ÎÒÃÇ new Ò»¸ö PulsarFlinkSource µÄÊ±ºò£¬Êµ¼ÊÉÏ»á¶ÔÃ¿Ò»¸ö Pulsar topic µÄ partition ´´½¨Ò»¸ö reader¡£Õâ¸ö reader Ê¹ÓÃµÄÊÇ Non-Durable Cursor£¬µ±Õâ¸ö reader ¶©ÔÄÁËÕâ¸ö topic Ö®ºó£¬Õâ¸ö topic µÄÊý¾ÝÁ÷¾Í»áÔ´Ô´²»¶ÏµØÁ÷µ½Õâ¸ö reader µÄÏß³ÌÀïÃæÈ¥¡£µ± reader µÄÏß³Ì´¥·¢Ò»´Î checkpoint µÄÊ±ºò£¬Õâ¸ö Flink ÈÎÎñ¾Í»á°Ñ×Ô¼ºµÄÒ»Ð©×´Ì¬ checkpoint ÆðÀ´¡£µ± checkpoint Íê³ÉµÄÊ±ºò£¬¾Í»áµ÷ÓÃÒ»´Î Notify checkpoint complete ÕâÑùµÄÒ»¸ö·½·¨¡£´¥·¢µÄÊÇÁíÍâÒ»¸ö subscription µÄÒ»¸ö commit¡£

Õâ¸ö subscription Êµ¼ÊÉÏÊÇÒ»¸ö durable cursor¡£µ±Ëü commit offset µÄÊ±ºò£¬Õâ¸ö offset »á±£´æÔÚ bookkeeper ÀïÃæ£¬ÕâÊÇÒ»¸öÓÀ¾Ã±£´æµÄ offset¡£ÕâÑù×öµÄºÃ´¦ÊÇ£¬µ± checkpoint Ê§°Ü»òÕß checkpoint ¶ªÁËµÄÊ±ºò£¬ÎÒÃÇÐèÒªÒÔÒ»¸ö subscription name ´Ó Pulsar ÀïÃæÈ¥»Ö¸´µÄÊ±ºò£¬¾Í¿ÉÒÔ´Ó bookkeeper ÀïÃæÈ¥°Ñ message id ¶Á³öÀ´£¬È»ºó´ÓÕâ±ß»Ö¸´¡£

Êµ¼ÊÉÏ¶ÔÓÚ Pulsar-Flink-Connector µÄÏû·Ñ¶øÑÔ£¬ËüÊÇÓÉÒ»ÌõÊý¾ÝÁ÷ºÍÒ»Ìõ¿ØÖÆÁ÷À´×é³ÉµÄ£º

¶ÔÓÚÊý¾ÝÁ÷£¬¾ÍÊÇ Pulsar Topic µÄÊý¾ÝÔ´Ô´²»¶ÏµÄ»áÁ÷Èëµ½ reader µÄÕâÑùÒ»¸öÏß³ÌÀïÃæ£¬ÓÉ reader Ïß³Ì½øÐÐÏàÓ¦µÄ´¦Àí¡£

¿ØÖÆÁ÷¾ÍÊÇÍ¨¹ý subscription name À´Ìá½»Ïû·ÑµÄ message id£¬Ò²¾ÍÊÇÀàËÆÓÚ Kafka µÄÒ»¸ö offset£¬»áÌá½»µ½ Pulsar µÄ¿Í»§¶ËÀ´±£Ö¤Ïû·ÑµÄÎ»ÖÃ¡£

½ÓÏÂÀ´¿´Ò»ÏÂ checkpoint ÊµÏÖµÄÁ÷³Ì¡£

Ê×ÏÈ£¬µ±ÎÒÃÇÈ¥×ö checkpoint N µÄÊ±ºò£¬µ± N ½áÊøÁËÖ®ºó£¬Ëü»á°Ñ durable cursor ½øÐÐÒ»´Î commit£»
µ±ÎÒÃÇÈ¥×ö checkpoint N+1 µÄÊ±ºò£¬N+1 Íê³ÉÖ®ºó£¬»á½Ó×ÅÈ¥ commit N+1 µÄ durable cursor¡£
ÕâÑù×öµÄºÃ´¦ÊÇ£¬µ±Õâ¸öÈÎÎñÊ§°ÜÖ®ºó£¬Èç¹ûÐèÒª´ÓÄ³Ò»¸ö checkpoint »Ö¸´£¬Ö»ÐèÒª´Ó checkpoint ÀïÃæÈ¥¶Áµ½ÉÏÒ»´Î checkpoint ³É¹¦µÄ offset µÄ durable cursor µÄ message id µÄÎ»ÖÃ£¬¾Í¿ÉÒÔ´ÓÉÏÒ»´ÎµÄÎ»ÖÃÈ¥Ïû·ÑÁË¡£ÕâÒ²ÊÇ±£Ö¤ source µÄ exactly once µÄÊµÏÖ¡£

Topic/Partition µÄ Discovery

µÚÒ»µãÊÇ£¬ÔÚ Pulsar-Flink-Connector ÊµÏÖµÄÂß¼Àï£¬»áÎªÃ¿Ò»¸ö Topic/Partition ·ÖÅäÒ»¸ö reader µÄÏß³Ì¡£

µÚ¶þµãÊÇ£¬Ã¿Ò»¸ö task manager »á°üÀ¨¶à¸ö reader µÄÏß³Ì£¬ÕâµØ·½»áÓÐÒ»¸öÊ²Ã´ÑùµÄÓ³Éä¹ØÏµ£¿

¾Ù¸öÀý×Ó£º¼ÙÉèÎÒÃÇ¶©ÔÄµÄ Topic ÀïÃæ£¬ÓÐ 10 ¸ö partition£¬Flink ÀïÃæÖ»¸øËü·ÖÅä 5 ¸ö task manager£¬ÄÇÃ´ÔõÃ´½« partition Ó³Éäµ½ 5 ¸ö task manager ÀïÃæÈ¥£¿Õâ¾Í»áÉæ¼°µ½Ò»¸ö·ÖÅäµÄÂß¼¡£Õû¸ö·ÖÅäµÄÂß¼£¬Êµ¼ÊÉÏÊÇÊ¹ÓÃÒ»¸ö¹þÏ£µÄ·½Ê½°ÑÄ³Ò»¸ö Topic/Partition hash µ½Ä¿±êµÄ task manager ÉÏÃæ¡£

Õâ¾Í»á´æÔÚÒ»Ð©Òþ»¼£ºµ±ÎÒÃÇ¶©ÔÄÁË¼¸°Ù¸öÉõÖÁÉÏÇ§¸ö topic µÄÊ±ºò£¬¿ÉÄÜ»á´æÔÚÒ»¶¨µÄ·ÖÅä²»¾ùºâ¡£³É°ÙÉÏÇ§¸ö Topic/Partition ÀïÃæ£¬²¢²»ÊÇÃ¿Ò»¸ö partition µÄÁ÷Á¿¶¼ÊÇ¾ùºâµÄ¡£¼ÙÉèÎÒÃÇ¶©ÔÄÁËÊ®¸ö Topic£¬ÆäÖÐÓÐ¾Å¸ö Topic µÄÁ÷Á¿ºÜÐ¡£¬ÁíÍâÒ»¸ö Topic µÄÁ÷Á¿ºÜ´ó£¬ÄÇÃ´¾ùÌ¯µ½Ä³Ò»¸ö partition Ê±ºòÒ²ÊÇÕâÑùµÄ¡£Õâ¸öºÜ´óµÄ topic µÄ Partition µÄÁ÷Á¿ºÜ´ó£¬ÁíÍâ Topic/Partition µÄÁ÷Á¿ºÜÐ¡¡£Èç¹ûÎÒÃÇÖ»ÊÇµ¥´¿µØ½øÐÐÒ»´Î hash µÄ»°£¬¾Í»áÔì³ÉÄ³Ð© task manager ÉÏÃæµÄÁ÷Á¿²»¾ùºâ£¬¿ÉÄÜ»áµ¼ÖÂÆµ·± GC µÄÎÊÌâ¡£Õâ¸öÎÊÌâÔÚÏÂÒ»¸ö use case Àï»áÏêÏ¸µØÌáµ½£¬ÒÔ¼°ÔõÃ´ÑùÈ¥½â¾öËü¡£

ÁíÍâ¾ÍÊÇµ±Ä³Ò»¸ö Topic/Partition ½øÐÐÒ»´Î·ÖÇøÀ©ÈÝÊ±£¬ÔõÃ´ÑùÈ¥×Ô¶¯¶©ÔÄÕâÑùÒ»¸öÐÂµÄ·ÖÇø£¿ÔÚ Pulsar-Flink-Connector ÀïÃæ»áÆô¶¯Ò»¸ö¶¨Ê± check µÄÏß³ÌµÄÂß¼¡£¼ÙÉèÎÒÃÇÃ¿Ò»·ÖÖÓ check Ò»´Î£¬ÊÇ·ñÓÐÐÂµÄ partition µÄ¼ÓÈë£¬²¢ÇÒÕâ¸öÐÂ Topic/Partition ·ÖÅäµ½ÁËÄ³Ò»¸ö task manager ÉÏÃæ£¬ÄÇÃ´Õâ¸ö task manager ¾Í»á×Ô¶¯µØÐÂ´´½¨Ò»¸ö reader µÄÏß³Ì£¬È»ºó°ÑÕâ¸ö partition ¶©ÔÄÏÂÀ´¡£

ÕâÕû¸öµÄÁ÷³Ì£¬»áÓÐÒ»¸ö discover »á²»¶ÏµÄÈ¥ check¡£µ±ÓÐÐÂµÄ partition µÄÊ±ºò¾Í»á new Ò»¸ö reader ÆðÀ´¡£Ã¿Ò»¸ö reader ¶ÀÁ¢Ïû·ÑÄ³Ò»¸ö Topic/Partition£¬°ÑÊý¾ÝÄÃ¹ýÀ´Ö®ºó»á¶¨ÆÚ½øÐÐ×Ô¼ºµÄ·´ÐòÁÐ»¯²Ù×÷ÒÔ¼°ºóÐøµÄ´¦Àí¡£

ÉÏÃæ½²µ½µÄÊÇÕû¸ö connector µÄÒ»¸öÂß¼¡£ÔÚ Pulsar-Flink-Connector ÀïÃæÌá¹©ÁË job µÄ·½Ê½£¬»¹Ìá¹©ÁË catalog µÄ·½Ê½À´Ïû·Ñ Pulsar µÄ topic¡£µ«ÊÇÄ¿Ç°ËüÊÇÃ»ÓÐÌá¹© SQL DDL µÄ·½Ê½£¬ÔÚ BIGO µÄÓ¦ÓÃ³¡¾°ÀïÃæ´ó²¿·ÖµÄ topic ¶¼ÊÇÒÔ json µÄ¸ñÊ½¡£´ó²¿·ÖµÄÊý¾Ý£¬¶¼ÊÇÒÔ json ¸ñÊ½Ð´ÈëµÄ¡£

¶ÔÓÚÕâÒ»Àà json ¸ñÊ½µÄtopic£¬Ëü¿ÉÄÜÃ»ÓÐÊÂÏÈÅäÖÃ×Ô¼ºµÄ schema ¾ÍÐ´½øÀ´ÁË£¬ÄÇÃ´ÎÒÃÇÔÚÏû·ÑµÄÊ±ºò£¬Èç¹ûÏëÓÃ SQL£¬ÔõÃ´°ìÄØ£¿ÕâÀï¾ÍÐèÒªÓÃµ½ Flink DDL µÄ¿ò¼Ü£¬ËùÒÔ BIGO µÄÏûÏ¢Á÷Æ½Ì¨ÍÅ¶ÓÔÚÎÒÃÇµÄÊ¹ÓÃ¹ý³ÌÖÐÎª Pulsar-Flink-Connector ¿ª·¢ÁË Flink SQL DDL µÄÖ§³Ö¡£½ÓÏÂÀ´¿´Ò»ÏÂ Flink SQL DDL µÄ¿ò¼Ü¡£

µÚÒ»²½£¬Í¼×ó±ß¾ÍÊÇ fetch message from Pulsar topic£¬Ê×ÏÈ»á¶¨ÒåÕâ¸ö topic µÄÀïÃæÊý¾ÝµÄÒ»¸ö×Ö¶ÎÐÅÏ¢£¬Ò²¾ÍÊÇ create table test_Flink_SQL£¬ÕâÀïÃæÓÐ rid µÈ×Ö¶Î¡£ÏÂÃæµÄÎ»ÖÃÀïÃæ°üº¬µÄÊÇÔõÑùÈ¥ºÍ Pulsar µÄ·þÎñ¶Ë½¨Á¢Á¬½ÓµÄ£¬ÕâÀï»áÖ¸¶¨ topic Ãû³Æ£¬Ö¸¶¨ service url£¬admin url ÒÔ¼° subscribe name£¬»¹ÓÐÒ»Ð©Ò»ÏµÁÐÏà¹ØµÄÅäÖÃ²Ù×÷¡£ÕâÑùÒ»¶Î SQL µÄ´úÂë¾ÍÄÜ¹»ºÜºÃµØÍê³É°ÑÊý¾Ý´Ó Pulsar topic ÀïÃæ¸øÏû·Ñ³öÀ´¡£
µÚ¶þ²½£¬¾Í¿ÉÒÔ½øÐÐÒ»ÏµÁÐÓ¦ÓÃ²ãÏà¹ØÂß¼µÄ´¦Àí¡£±ÈÈç×ö join£¬count¡¢union µÈ²Ù×÷¡£ÁíÍâ¾ÍÊÇÒ»Ð©Ó¦ÓÃ²ãÂß¼µÄ´¦Àí£¬±ÈÈçËµÈ¥×öÍ³¼ÆÏà¹ØµÄÒ»Ð©²Ù×÷¡£ÔÚµÚ¶þ²½²Ù×÷ÍêÁËÖ®ºó£¬ÎÒÃÇÐèÒª½«×îÖÕµÄ½á¹ûÐ´³öµ½µÚÈý·½´æ´¢ÀïÃæ¡£µÚÈý·½´æ´¢»á°üÀ¨ Hive ±í¡¢HDFS ºÍ Pulsar µÄ topic µÈ¡£
¶ÔÓÚ×îÖÕµÄÐ´ÈëÐ´³ö¾Í»á½øÈëµ½µÚÈý²½£¬ÎÒÃÇ»áµ÷ÓÃÒ»¸ö insert into µÄ·½·¨£¬Ö±½Ó°ÑÎÒÃÇ´¦ÀíµÄ½á¹û£¬Ð´³öµ½Ïà¹ØµÄ Hive ±íÀïÃæÈ¥£¬Õâ¾ÍÊÇÕû¸ö Flink SQL DDL µÄÒ»¸ö´¦ÀíÂß¼¡£ÎÒÃÇ½èÖú Flink SQL DDL ÄÜ¹»ºÜºÃµØÀ´ÊµÏÖÎÒÃÇµÄ AB test Ïà¹ØµÄ²Ù×÷¡£ÄÇÃ´ÔÚÇ°ÃæµÄ½²½âÀïÃæ£¬ÎÒÃÇ¿ÉÄÜ»áÊ¹ÓÃÒ»¸ö job µÄ·½Ê½À´Ìá½»£¬ÓÐÁË Flink SQL DDL µÄÖ§³Ö£¬ÎÒÃÇ¾Í¿ÉÒÔºÜ·½±ãµØÊ¹ÓÃÒ»¸ö SQL µÄ·½Ê½À´Ïû·Ñ Pulsar µÄ topic£¬»á½øÐÐÒ»ÏµÁÐÂß¼´¦Àí£¬×îÖÕ°Ñ½á¹ûÐ´³öÈ¥¡£

ÏÖÔÚÀ´¿´Ò»ÏÂ»ùÓÚ SQL ·½Ê½µÄ use case¡£

Case 1

Ê×ÏÈÀ´¿´Ò»ÏÂ BIGO reall-time ETL µÄÊµÏÖ¡£Õâ¸öÊµÊ± ETL µÄ±³¾°£¬ÊÇÎÒÃÇÔÚ Pulsar ÀïÃæ£¬»áÓÐ³É°ÙÉÏÇ§¸ö topic£¬Ã¿Ò»¸ö topic »áÓÐ×Ô¼º¶ÀÁ¢µÄ schema¡£ÎÒÃÇÏÖÔÚµÄÒ»¸öÐèÇóÊÇÏëÒª°ÑÃ¿Ò»¸ö topic Ê¹ÓÃ×Ô¼ºµÄ schema ½øÐÐÒ»´Î½âÎö£¬°Ñ×îÖÕ½âÎöµÄ½á¹ûÒÔ bucket µÄ¸ñÊ½Âäµ½ HDFS µÄ Hive ±íÉÏÃæÈ¥¡£¶ÔÓÚÕâÑùÒ»¸öÐèÇó£¬ÎÒÃÇ¿ÉÄÜ»áÓÐ¼¸ÖÖ·½°¸£º

µÚÒ»ÖÖ·½°¸£¬ÎÒÃÇ»áÖ±½ÓÊ¹ÓÃ Pulsar µÄ HDFS µÄ connector£¬»á°Ñ topic ÀïÃæµÄÊý¾Ý»áÏû·Ñ³öÀ´È»ºóÂäµ½ HDFS ÉÏÃæÈ¥£¬ÕâÑù×öµÄ»°£¬µ±ÎÒÃÇÐèÒª¶Ô topic ÀïÃæ½øÐÐÒ»ÏµÁÐµÄ´¦ÀíµÄÊ±ºò£¬¿ÉÄÜ¾Í²»´óºÃ°ìÁË¡£ÁíÍâÒ»¸ö¾ÍÊÇÎÒÃÇÓÐ³É°ÙÉÏÇ§¸ö topic£¬ÄÇÃ´Ò²»áÓÐ³É°ÙÉÏÇ§¸ö schema£¬Ò²¾ÍÊÇËµÎÒÃÇ¿ÉÄÜÒªÎ¬»¤³É°ÙÉÏÇ§¸öÏß³Ì£¬È¥½âÏàÓ¦µÄ topic ÀïÃæµÄÊý¾Ý£¬È»ºó°ÑËüÂä³öÈ¥¡£ÕâÑù¶ÔÓÚÕû¸öÈÎÎñµÄÎ¬»¤³É±¾¿ÉÄÜ»á±È½Ï¸ß¡£

µÚ¶þÖÖ·½°¸¡£ÎÒÃÇ¿ÉÒÔÓÃ Flink SQL È¥Ïû·ÑÃ¿¸ötopic£¬Ã¿Ò»¸ö SQL Ö¸Áî×Ô¼ºµÄ schema£¬È»ºó°ÑÕâ¸ö topic ¸øÏû·Ñ³öÀ´£¬Ö®ºó½øÐÐÒ»ÏµÁÐµÄ´¦Àí£¬È»ºóÐ´³öÈ¥¡£ÕâÖÖ·½Ê½£¬Êµ¼ÊÉÏÒ²»á´øÀ´¼¸°Ù¸öÉõÖÁÉÏÇ§¸ö SQL ÈÎÎñµÄÎ¬»¤¹¤×÷¡£

µÚÈý¸ö·½°¸£¬ÎÒÃÇÏëµ½ÁËÊ¹ÓÃÒ»¸ö Flink ÈÎÎñÀ´Ïû·Ñ³É°ÙÉÏÇ§¸ö Pulsar µÄ topic¡£È»ºó½øÐÐÒ»ÏµÁÐµÄ ETL ´¦Àí£¬Ê×ÏÈ½øÐÐ schema µÄ½âÎö£¬È»ºó½øÐÐÒ»ÏµÁÐÂß¼´¦Àí£¬×îÖÕ°ÑËüÐ´³öµ½ HDFS ÉÏÃæÈ¥¡£ÏÂÃæÕâÕÅÍ¼£¬¾ÍÊÇÎÒÃÇ²ÉÓÃµÄµÚÈýÖÖ·½°¸£ºÊ¹ÓÃÒ»¸ö Flink µÄ job °Ñ³É°ÙÉÏÇ§¸ö topic ¶©ÔÄÁË¡£¶©ÔÄÍêÁËÖ®ºó£¬»ñÈ¡ÏàÓ¦µÄÏß³ÌÈ¥Ïû·Ñ¡£½âÎöÍêÁËÖ®ºó»á¾¹ýÒ»ÏµÁÐÂß¼´¦Àí£¬×îÖÕÏÔÊ¾µ½ HDFS ÉÏÃæÈ¥¡£

Õâ¸ö case ¿ÉÄÜ´æÔÚÊý¾Ý·Ö²¼²»¾ùµÄÎÊÌâ¡£¼ÙÉè£¬ÎÒÃÇÓÐ 500 ¸ö topic£¬ÆäÖÐ 400 ¸ö topic µÄÁ÷Á¿ºÜÐ¡£¬ÁíÍâ 100 ¸ö topic µÄÁ÷Á¿ºÜ´ó¡£ÄÇÃ´ÎÒÃÇÔÚ¶©ÔÄµÄÊ±ºò£¬¼ÙÉèÎÒÆðÁË 100 ¸ö task manager È¥Ïû·Ñ¡£ÄÇÃ´Õâ¿ÉÄÜ¾Í»á°´Æ½¾ùÀ´Ëã£¬ÓÐ 5-10 ¸ö topic partition »áÂäµ½Í¬Ò»¸ö task manager ÉÏÃæÈ¥¡£Èç¹ûÎÒÃÇ²»¸ÉÔ¤µÄ»°£¬ÓÉÓÚÕâ¸ö partition ×ÔÉíµÄÁ÷Á¿²»¾ùºâ£¬¿ÉÄÜ»áµ¼ÖÂËü´ÓÔËÐÐÈÎÎñµÄ½ø³ÌµÄÁ÷Á¿Ò²ÊÇ²»¾ùºâµÄ£¬´øÀ´ÁËÆµ·± GC µÄÎÊÌâ¡£

ÎªÁË½â¾öÏû·Ñ¶ËÉÏÃæµÄ task manager Á÷Á¿²»¾ùºâµÄÇé¿ö¡£ÎÒÃÇÒýÈëÁËÒ»¸ö slot group µÄ¸ÅÄî¡£ÎÒÃÇ»áÊÂÏÈ¶Ô topic partition µÄÁ÷Á¿½øÐÐÒ»¸öÔ¤¹À£¬Ô¤¹ÀÍêÁËÖ®ºó£¬»áÍ¨¹ýÈË¹¤¼ÆËãµÄ·½Ê½°Ñ¼¸¸öµÍÁ÷Á¿µÄ topic ×éºÏ³ÉÍ¬Ò»¸ö group ÀïÃæ¡£Í¬Ò»¸ö group µÄ topic »á±»·ÅÔÚÍ¬Ò»¸ö slot ÀïÃæ£¬È»ºóÈ¥½øÐÐµ÷¶È£¬ÕâÑù¾ÍÄÜ¹»ºÜºÃµÄÈ¥°Ñ task manager ÉÏÃæµÄÏû·ÑÁ÷Á¿²»¾ùµÄÎÊÌâ½â¾öµôÁË£¬Õû¸ö Flink job ¾Í»áÔËÐÐµÄºÜºÃ¡£

Case 2

µÚ¶þ¸ö case ÊÇÒ»¸ö AB test µÄÓ¦ÓÃ³¡¾°£¬×öÕâ¸ö AB test ³¡¾°µÄÒ»¸ö³õÖÔÊÇÊ²Ã´ÄØ£¿ÔÚÎÒÃÇÊµÊ±µÄÊý²ÖÀïÃæ£¬ÐèÒªÈ¥²ú³öÐ¡Ê±¼¶±ðµÄÖÐ¼ä±í£¬ÒÔ¼°Ìì¼¶µÄÖÐ¼ä±í£¬¸øÍÆ¼öËã·¨µÄ¹¤³ÌÊ¦ÒÔ¼°Êý¾Ý·ÖÎöÊ¦À´Ê¹ÓÃ¡£¶ÔÓÚÐ¡Ê±¼¶±ðµÄÖÐ¼ä±íÒÔ¼°Ìì¼¶µÄÖÐ¼ä±íµÄ²úÉú£¬ÐèÒªÍ¨¹ýÊµÊ±µÄÈ¥¼ÆËãµ×²ãµÄ¸÷ÖÖÀàÐÍµÄ´òµã£¬±ÈÈçÓÃ»§¹Û¿´µÄ´òµã¡¢Ä³¸öÊÓÆµµÄÏÂ·¢´òµã£¬»¹ÓÐÓÃ»§ÆäËûÐÐÎªµÄ´òµãµÈµÈ£¬»á°´ÕÕÄ³Ò»¸öÎ¬¶È½øÐÐ¾ÛºÏ¡£¾ÛºÏÁËÖ®ºó»á½øÐÐÏà¹ØµÄÒ»Ð©Í³¼Æ£¬×îÖÕ»áÐÎ³ÉÒ»ÕÅ¿í´ø¹©ÍÆ¼öËã·¨¹¤³ÌÊ¦ÒÔ¼°Êý¾Ý·ÖÎöÊ¦À´Ê¹ÓÃ¡£

Èç¹ûÎÒÃÇ²»Ìá¹©ÕâÑùÒ»¸ö¿í±íµÄ»°£¬ÄÇÃ´¶ÔÓÚÉÏ²ãµÄÒµÎñ·½¶øÑÔ£¬¿ÉÄÜÒª²»¶ÏµÄÈ¥·ÃÎÊµ×²ãµÄ±í£¬¶Ôµ×²ã±í½øÐÐ¸÷ÖÖÏàÓ¦µÄ²Ù×÷¡£ÕâÑù²»µ«»áÀË·ÑÊý¾Ý·ÖÎöÊ¦ÒÔ¼°ÍÆ¼öËã·¨¹¤³ÌÊ¦µÄÊ±¼ä£¬Ò²»áÔì³ÉÕû¸ö¼¯Èº¼ÆËã×ÊÔ´µÄÀË·Ñ¡£ÄÇÃ´ÔÚ BIGO Õâ±ß£¬Ö®Ç°µÄ½â¾ö·½°¸ÊÇÊ¹ÓÃ Hive¡£Ê¹ÓÃ Map Reduce µÄ·½Ê½£¬À´°ÑÃ¿ÕÅµ×²ãµÄ±í½øÐÐÒ»´Î¾ÛºÏ²Ù×÷¡£¾ÛºÏÍêÁËÖ®ºó»áÌá¹©Ò»¸öÐ¡Ê±¼¶±ðÖÐ¼ä±íÒÔ¼°Ìì¼¶µÄÖÐ¼ä±í¸øÉÏ²ãÒµÎñÊ¹ÓÃ£¬ÕâÑù×öµÄ±×¶ËÊÇ£ºHive Map Reduce µÄÊ±Ð§ÐÔÊÇÃ»·¨±£Ö¤µÄ¡£ËùÒÔÎÒÃÇ¾ÍÔÚÏëÄÜ·ñÊ¹ÓÃ Flink Á÷Ê½¼ÆËãµÄ·½Ê½À´Ìá¸ßÊµÊ±Êý²ÖµÄÊý¾Ý²ú³öÐ§ÂÊ¡£

½ÓÏÂÀ´¾ÍÊÇÎÒÃÇÕâ±ßµÄÒ»¸ö½â¾ö·½°¸£ºÊ×ÏÈÎÒÃÇ»áÓÃ Flink SQL È¥Ïû·Ñ Pulsar µÄ topic¡£´ÓÏÂÍ¼µÄ×ó±ßÀ´¿´£¬ÎÒÃÇÓÐ Topic A¡¢Topic B ºÍ Topic K¡£Ã¿¸ö topic ÓÐ×Ô¼ºµÄ DDL¡£ÎÒÃÇÊ×ÏÈ»áÊ¹ÓÃ Flink SQL ¼ÓÉÏÃ¿Ò»¸ö topic µÄ scanner£¬Ò²¾ÍÊÇ DDL »á°Ñ topic µÄÊý¾Ý´Ó Pulsar ÀïÃæ¼ÓÔØ³öÀ´£¬È»ºó°ÑËü×ö³ÉÃ¿¸ö topic µÄÒ»¸öÊÓÍ¼¡£

Õâ¸öµØ·½ÎÒÃÇ¾Í»áÓÐ Table A¡¢Table B ºÍ Table K µÄÒ»¸ö±í¡£¼ÙÉèÓÐ K ÕÅ±í£¬ÄÇÃ´ÎÒÃÇÐèÒª¶Ô K ÕÅ±í½øÐÐÒ»´Î¾ÛºÏ²Ù×÷¡£¼ÙÉèÊÇ°´ÕÕ uid ½øÐÐÒ»´Î¾ÛºÏ£¬ÄÇÃ´Õâ¸ö¾ÛºÏÓÐÁ½ÖÖ·½Ê½£º

µÚÒ»ÖÖ·½Ê½ÊÇ×ö join¡£¶ÔÓÚ Flink ¶øÑÔ£¬ËüµÄÁ÷Ê½ join ¿ÉÄÜºÄÊ±»á±È½Ï³¤£¬Õû¸ö¼ÆËã×ÊÔ´µÄÏûºÄÒ²ÊÇ·Ç³£´óµÄ¡£ËùÒÔÎÒÃÇÕâ±ß×öÁËÒ»¸ö±È½ÏÇÉÃîµÄ·½°¸¾ÍÊÇÊ¹ÓÃ union ´úÌæ join¡£ÎÒÃÇ»á°Ñ Table A¡¢Table B ºÍ Table K Í¨¹ý union µÄ·½Ê½»áÉú³ÉÒ»¸ö View X¡£È»ºó°Ñ View X Ö±½ÓÐ´³öÒÔÐ¡Ê±ÎªÁ£¶È£¬µ½ ClickHouse ¹©ÓÃ»§²éÑ¯¡£ÔÚ union µÄ¹ý³Ìµ±ÖÐ£¬ÎÒÃÇ»¹»á×öÒ»Ð©Ïà¹ØµÄ¾ÛºÏµÄ²Ù×÷¡£À´°ÑÏà¹ØµÄÖ¸±ê¸ø¾ÛºÏÆðÀ´¹©ÓÃ»§Ê¹ÓÃ¡£Õâ¸ö¾ÍÊÇÐ¡Ê±¼¶±ðµÄÖÐ¼ä±í¡£

¶ÔÓÚÌì¼¶µÄÖÐ¼ä±í¶øÑÔ£¬ÎÒÃÇËùÓöµ½µÄÌôÕ½ÊÇ£ºËü²¢²»ÊÇµ¥µ¥µÄÖ»ÒÀÀµÁË Table A¡¢Table B ºÍ Table K£¬¿ÉÄÜ»¹ÒÀÀµÁËÀëÏßµÄ±í¡£¼ÙÉèÓÐ Table a1¡¢Table a2 ºÍ Table a3 ÈýÕÅ±í¡£ÎÒÃÇÔõÃ´Ñù°ÑÊµÊ±µÄ±íºÍÀëÏßµÄ±í×öÒ»¸ö¹ØÁª£¿ÕâÀïÎÒÃÇÒ²ÊÇÊ¹ÓÃµÄÒ»¸ö±È½ÏÇÉÃîµÄ·½Ê½¡£

Ê×ÏÈ¡£ÔÚ×ó±ß Table A¡¢Table B ºÍ Table K »áÊ¹ÓÃ Flink SQL °ÑÊý¾Ý´Ó Pulsar Ïû·Ñ³öÀ´£¬È»ºó×ö³ÉÒ»¸ö¶ÀÁ¢µÄ table¡£È»ºóÍ¬ÑùÒ²ÊÇÒÔ union µÄ·½Ê½°ÑÊµÊ±µÄÁ÷±í¸ø union ÆðÀ´£¬×öÒ»Ð©Í³¼ÆÏà¹ØµÄ´¦ÀíÉú³ÉÒ»¸öÊÓÍ¼£¬Ò»¸öView X¡£Õâ¸ö View X »á¸ù¾ÝÎÒÃÇ¾«ÐÄÉè¼Æ¹ýµÄÒ»¸ö row-key£¬°ÑËüÒÔÌìÎªÎ¬¶ÈÐ´³öµ½ HBase ÀïÃæÈ¥¡£

ÁíÍâ£¬¶ÔÓÚÀëÏß¶øÑÔ¡£ÒòÎªÎÒÃÇ Table A¡¢Table B ºÍ Table K Ö»ÊÇ´ú±íÁËÔÛÃÇÊµÊ±µÄÒ»Ð©Êý¾Ý£¬¶ÔÓÚÀëÏßµÄÊý¾Ý£¬Ò²ÊÇÐèÒª join ½øÀ´µÄ£¬ÄÇÃ´¾Í»áÊ¹ÓÃÒ»¸ö Spark À´°Ñ Table a1¡¢Table a2 ºÍ Table a3 Ïà¹ØµÄÊý¾Ý¸ø join ÆðÀ´£¬È»ºóÒ²ÒÔÏàÍ¬µÄ¹æÔòÉú³ÉÒ»¸ö row-key Ð´ÔÚ HBase ÀïÃæÈ¥¡£

¶ÔÓÚ HBase ¶øÑÔ£¬ËüÊµ¼ÊÉÏÌá¹©µÄ¾ÍÊÇÒ»¸ö join ²Ù×÷£¬Ð´µ½ HBase ¾ÍºÜºÃµÄ±ÜÃâÁËÎÒÃÇ½« View X ÒÔ¼° Spark ËùÉú³ÉµÄÕâÑùÒ»ÕÅ±í×ö join ÁË¡£ÒòÎªÈç¹ûÊÇÓÐÏàÍ¬µÄ key£¬ÄÇÃ´¼ÙÉè HBase ÕâÑùÒ»ÕÅ¿í±íÓÐ 100 ÁÐ£¬View X Õ¼ÁËÇ° 80 ÁÐ£¬ÄÇÃ´ºóÃæµÄ Spark ËùËã³öÀ´µÄÕâ¸ö±í»á×Ô¶¯µØÌî³äµ½ÄÇ¸öºó 20 ÁÐÀïÃæÈ¥£¬ÄÇÃ´×îÖÕ»áÉú³ÉÍ¬Ò»¸ö row-key µÄÒ»¸ö 100 Î¬µÄÒ»ÕÅ¿í±í¡£ÄÇÃ´ÎÒÃÇ½ÓÏÂÀ´»á°Ñ HBase ÀïÃæÕâÑùÒ»ÕÅ¿í±í¶Á³öÀ´£¬È»ºóÐ´µ½ ClickHouse ¹©ÉÏ²ãÓÃ»§È¥²éÑ¯¡£ÕâÑù¾ÍÄÜ¹»ºÜºÃµÄÈ¥±ÜÃâ±íÖ®¼äµÄ join ²Ù×÷£¬¼«´óµØÌá¸ß join µÄÐ§ÂÊ¡£

Îå¡¢Î´À´¹¤×÷
Ê×ÏÈ£¬ÎÒÃÇ»á½Ó×ÅÔÚ Pulsar-Flink-Connector ÉÏÃæ¼ÌÐøµÄÈ¥¿ª·¢ÐÂµÄ feature ²¢ÇÒ³ÖÐøµÄÈ¥½øÐÐÒ»ÏµÁÐµÄ bug ÐÞ¸´£»
µÚ¶þµã£¬ÎÒÃÇ»á¸ü¶àµÄ½« Flink ÈÎÎñ³ÖÐøµØ´Ó Kakfa Ç¨ÒÆµ½ Apache Pulsar ÉÏÃæÈ¥£»
µÚÈýµã£¬ÔÚÎÒÃÇÕû¸öµÄÏûÏ¢Á÷Æ½Ì¨Àï£¬Ö®Ç°Ê¹ÓÃµÄÊÇ Kakfa£¬¿ÉÄÜÓÐ³É°ÙÉÏÇ§¸ö Flink µÄÈÎÎñ»òÕßÊÇÆäËûµÄÈÎÎñ£¬Ê¹ÓÃ Kafka µÄ API À´Ïû·Ñ Kafka µÄ topic¡£Èç¹û²»Ìá¹©Ò»¸ö¼òµ¥µÄ·½Ê½ÈÃÓÃ»§À´Ïû·Ñ Pulsar µÄ topic µÄ»°£¬Õâ¸öÇ¨ÒÆ¹¤×÷ÊÇ·Ç³£ÄÑ½øÐÐµÄ¡£ËùÒÔÎÒÃÇ»á½èÖúÓÚ KOP£¬Ò²¾ÍÊÇ Kakfa on Pulsar£¬·½±ãÉÏ²ãÓ¦ÓÃµÄÇ¨ÒÆ£¬ÓÐÁËÕâÑùÒ»²ã KOP µÄÒ»¸ö proxy£¬¶ÔÓÚÉÏÃæÓ¦ÓÃ³ÌÐòÊÇ²»ÐèÒª¸ÄÈÎºÎµÄ´úÂë¾ÍÄÜ¹»×Ô¶¯µÄ´Ó Kafka ÇÐµ½ Pulsar ÉÏÃæµÄ£»
µÚËÄµã£¬ÎÒÃÇ´òËãÊµÏÖÒ»¸öÅúÁ÷Í³Ò»µÄÊý¾ÝµÄÏû·Ñ£¬´Ó Pulsar topic ÀïÃæÒÔÅú»òÕßÊÇÁ÷µÄ·½Ê½À´Ïû·Ñ topic ÀïµÄÊý¾Ý£»
µÚÎåµã£¬ÎÒÃÇ»á³ÖÐø¼ÓÇ¿ Pulsar ÒÔ¼° bookkeeper µÄÎÈ¶¨ÐÔÒÔ¼°ÍÌÍÂµÄµ÷ÓÅ£»
µÚÁùµã£¬ÎÒÃÇ»á³ÖÐøµÄÈ¥ÓÅ»¯ Bookkeeper µÄ IO ÐÒéÕ»¡£

×îÐÂ¾µäÎÄÕÂ£¬»¶Ó¹Ø×¢¹«ÖÚºÅhttp://www.aboutyun.com/data/attachment/forum/201903/18/215536lzpn7n3u7m7u90vm.jpg

ÔÎÄÁ´½Ó£º
https://flink-learning.org.cn/article/detail/39b508b7178a7f47eeb5f70db778e426?tab=suoyou&page=1

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

½èÖú Flink Óë Pulsar£¬BIGO ´òÔìÊµÊ±ÏûÏ¢´¦ÀíÏµÍ³