Í¼½âflink sqlÓ¦ÓÃÌá½»·½Ê½£¨¶þ£©-Flink-AboutÔÆ-ËóÂ×¿Æ¼¼

fc013 ·¢±íÓÚ 2021-10-15 18:18:23

Í¼½âflink sqlÓ¦ÓÃÌá½»·½Ê½£¨¶þ£©

ÉÏÒ»Æª£ºflinkÊµ¼ù£ºÍ¼½âflink sqlÓ¦ÓÃÌá½»·½Ê½£¨Ò»£©

ÎÊÌâµ¼¶Á£º

1¡¢Ê²Ã´ÊÇCalcite£¿
2¡¢Blink PlannerÔõÑùÓëCalcite½øÐÐ¶Ô½Ó£¿
3¡¢Blink SqlÌá½»Á÷³ÌÊÇÔõÑùµÄ£¿

1. Flink Sql½âÎöÆ÷
1.1¡¢ÁË½âCalcite

Îª·½±ãÓÃ»§Ê¹ÓÃ Flink Á÷¼ÆËã×é¼þ£¬Flink ÉçÇøÉè¼ÆÁËËÄÖÖ³éÏó£¬ÔÚÕâÐ©³éÏóÖÐ£¬Sql API ÊôÓÚFlinkµÄ×îÉÏ²ã³éÏó£¬ÊÇ Flink µÄÒ»µÈ¹«Ãñ£¬Õâ¾Í·½±ãÓÃ»§»òÕß¿ª·¢ÕßÖ±½ÓÍ¨¹ý Sql ±àÐ´À´Ìá½»ÈÎÎñ¡£

µ«¾¹ý°¢ÍÁµÄµ÷²éºó ·¢ÏÖ£¬Flink sql ÔÚÌá½»ÈÎÎñÊ±£¬²¢²»ÊÇÏò DataStream API ÄÇÑù£¬Ö±½Ó±»×ªÎª StreamGraph£¬¾¹ýÓÅ»¯Éú³É JobGraph Ìá½»µ½¼¯ÈºµÄ,¶øÊÇÐèÒª¶Ô±àÐ´µÄ Sql ½øÐÐ½âÎö¡¢ÑéÖ¤¡¢ÓÅ»¯µÈ²Ù×÷£¬ÔÚÕâÖÐ¼ä£¬ÉçÇøÒýÈëÁËÒ»¸öÇ¿´óµÄ½âÎöÆ÷£¬ÄÇ¾ÍÊÇCalcite¡£

°¢ÍÁºÃºÃµ÷ÑÐÁËÒ»·¬Calcite

CalciteÊôÓÚApacheÆìÏÂµÄÒ»¸ö¶¯Ì¬Êý¾Ý¹ÜÀí¿ò¼Ü£¬¾ß±¸ºÜ¶àÊý¾Ý¿â¹ÜÀíÏµÍ³µÄ¹¦ÄÜ£¬Ëü¿ÉÒÔ¶ÔSQL½øÐÐ SQL ½âÎö£¬SQL Ð£Ñé£¬SQL ²éÑ¯ÓÅ»¯£¬SQL Éú³ÉÒÔ¼°Êý¾ÝÁ¬½Ó²éÑ¯µÈ²Ù×÷£¬Ëü²»´æ´¢ÔªÊý¾ÝºÍ»ù±¾Êý¾Ý£¬²»°üº¬´¦ÀíÊý¾ÝµÄËã·¨¡£¶øÊÇ×÷ÎªÒ»¸öÖÐ½éµÄ½ÇÉ«£¬½«ÉÏ²ãSQLºÍµ×²ã´¦ÀíÒýÇæ´òÍ¨£¬½«ÆäSQL×ªÎªµ×²ã´¦ÀíÒýÇæÐèÒªµÄÊý¾Ý¸ñÊ½¡£

Ëü²»ÊÜÉÏ²ã±à³ÌÓïÑÔµÄÏÞÖÆ£¬Ç°¶Ë¿ÉÒÔÊ¹ÓÃ SQL¡¢Pig¡¢Cascading µÈÓïÑÔ£¬Ö»ÒªÍ¨¹ý Calcite Ìá¹©µÄ SQL Api ½«ËüÃÇ×ª»¯³É¹ØÏµ´úÊýµÄ³éÏóÓï·¨Ê÷¼´¿É£¬²¢¸ù¾ÝÒ»¶¨µÄ¹æÔòºÍ³É±¾¶Ô³éÏóÓï·¨Ê÷½øÐÐÓÅ»¯£¬×îºóÍÆ¸ø¸÷¸öÊý¾Ý´¦ÀíÒýÇæÀ´Ö´ÐÐ¡£

ËùÒÔ Calcite ²»Éæ¼°ÎïÀí¹æ»®²ã£¬ËüÍ¨¹ýÀ©Õ¹ÊÊÅäÆ÷À´Á¬½Ó¶àÖÖºó¶ËµÄÊý¾ÝÔ´ºÍÊý¾Ý´¦ÀíÒýÇæ£¬Èç Hive£¬Drill£¬Flink£¬PhoenixµÈ¡£

1.2¡¢CalciteÖ´ÐÐ²½Öè

Ð¡±¿Öí°¢ÍÁ¼òµ¥»ÁËÒ»ÏÂCalciteµÄÖ´ÐÐÁ÷³Ì£¬Ö÷ÒªÉæ¼°5¸ö²¿·Ö SQL½âÎö¡¢SQLÐ£Ñé¡¢SQL²éÑ¯ÓÅ»¯¡¢SQLÉú³É¡¢Ö´ÐÐµÈ¡£

ÔÚÕâ¸öÁ÷³ÌÖÐ£¬Calcite¸÷½×¶Î°çÑÝµÄ½ÇÉ«ÈçÏÂ£º

[*]SQL½âÎö¡£Í¨¹ý JavaCC ÊµÏÖ£¬Ê¹ÓÃ JavaCC ±àÐ´ SQL Óï·¨ÃèÊöÎÄ¼þ£¬½« SQL ½âÎö³ÉÎ´¾Ð£ÑéµÄ AST Óï·¨Ê÷¡£
[*]SQLÐ£Ñé¡£Í¨¹ýÓëÔªÊý¾Ý½áºÏÑéÖ¤ SQL ÖÐµÄ Schema¡¢Field¡¢ Function ÊÇ·ñ´æÔÚ£¬ÊäÈëÊä³öÀàÐÍÊÇ·ñÆ¥ÅäµÈ¡£
[*]SQLÓÅ»¯¡£¶ÔÉÏ¸ö²½ÖèµÄÊä³ö( RelNode £¬Âß¼¼Æ»®Ê÷)½øÐÐÓÅ»¯£¬Ê¹ÓÃÁ½ÖÖ¹æÔò£º»ùÓÚ¹æÔòÓÅ»¯ ºÍ »ùÓÚ´ú¼ÛÓÅ»¯£¬µÃµ½ÓÅ»¯ºóµÄÎïÀíÖ´ÐÐ¼Æ»®¡£
[*]SQLÉú³É¡£½«ÎïÀíÖ´ÐÐ¼Æ»®Éú³ÉÎªÔÚÌØ¶¨Æ½Ì¨/ÒýÇæµÄ¿ÉÖ´ÐÐ³ÌÐò£¬ÈçÉú³É·ûºÏ MySQL »ò Oracle µÈ²»Í¬Æ½Ì¨¹æÔòµÄ SQL ²éÑ¯Óï¾äµÈ¡£
[*]Ö´ÐÐ¡£Ö´ÐÐÊÇÍ¨¹ý¸÷¸öÖ´ÐÐÆ½Ì¨Ö´ÐÐ²éÑ¯£¬µÃµ½Êä³ö½á¹û¡£

ÆäÖÐ£¬CalciteÔÙÓëÆäËû´¦ÀíÒýÇæ½áºÏÊ±£¬µ½SQLÓÅ»¯½×¶Î¾ÍÒÑ¾½áÊø¡£ËùÒÔÁ÷³ÌÍ¼¼ò»¯Îª£º

2. Flink Planner ºÍ Blink Planner

°¢ÍÁ¿´ÍêCalciteµÄÔÀíºó£¬¿ªÊ¼Ïë£¬ÄÇCalciteÊÇÔõÃ´ÔÚFlinkÖÐ°çÑÝµÄ½ÇÉ«ÄØ£¿

ÕâÊ±ºï¸ç¹ýÀ´¸ø°¢ÍÁËµ£¬µ¥´¿µÄ¿´Ò»Ð©ÀíÂÛÎÄÕÂ£¬ÊÇ¸ã²»Çå³þµ×²ãÉè¼ÆÊµÏÖµÄ£¬°¢ÍÁ°¡£¬Äã¿ÉÒÔ¿´¿´Ô´Âë¡£

ÌýÁËºï¸çµÄÒ»·¬»°ºó£¬°¢ÍÁ¿ªÊ¼¿ÐÆðÁËFlink1.13.2µÄFlink SqlÔ´Âë

2.1 Flink PlannerºÍBlink Planner

ÔÚ1.9.0°æ±¾ÒÔÇ°£¬ÉçÇøÊ¹ÓÃFlink Planner×÷Îª²éÑ¯´¦ÀíÆ÷£¬Í¨¹ýÓëCalcite½øÐÐÁ¬½Ó£¬ÎªTable/SQL APIÌá¹©ÍêÕûµÄ½âÎö¡¢ÓÅ»¯ºÍÖ´ÐÐ»·¾³£¬Ê¹ÆäSQL±»×ªÎªDataStream APIµÄ Transformation£¬È»ºóÔÙ¾¹ýStreamJraph -> JobGraph -> ExecutionGraphµÈÒ»ÏµÁÐÁ÷³Ì£¬×îÖÕ±»Ìá½»µ½¼¯Èº¡£

ÔÚ1.9.0°æ±¾£¬ÉçÇøÒýÈë°¢Àï°Í°ÍµÄBlink£¬¶ÔFIink TabIe & SQLÄ£¿é×öÁËÖØ´óµÄÖØ¹¹£¬±£ÁôÁË Flink Planner µÄÍ¬Ê±£¬ÒýÈëÁË Blink PIanner£¬Ã»ÒýÈëÒÔÇ°£¬Flink Ã»¿¼ÂÇÁ÷Åú×÷ÒµÍ³Ò»£¬Õë¶ÔÁ÷Åú×÷Òµ£¬µ×²ãÊµÏÖÁ½Ì×´úÂë£¬ÒýÈëºó£¬»ùÓÚÁ÷ÅúÒ»ÌåÀíÄî£¬ÖØÐÂÉè¼ÆËã×Ó£¬ÒÔÁ÷ÎªºËÐÄ£¬Á÷×÷ÒµºÍÅú×÷Òµ×îÖÕ¶¼»á±»×ªÎªtransformation¡£

2.2 Blink PlannerÓëCalcite¹ØÏµ

ÔÚÖ®ºóµÄ°æ±¾£¬ÎªÁËÊµÏÖFlinkÁ÷ÅúÒ»ÌåµÄÔ¸¾°£¬Í¨¹ýBlink PlannerÓëCalcite½øÐÐ¶Ô½Ó,¶Ô½ÓÁ÷³ÌÈçÏÂ£º

[*]ÔÚTable/SQL ±àÐ´Íê³Éºó£¬Í¨¹ýCalcite ÖÐµÄparse¡¢validate¡¢rel½×¶Î£¬ÒÔ¼°Blink¶îÍâÌí¼ÓµÄconvert½×¶Î,½«ÆäÏÈ×ªÎªOperation£»
[*]Í¨¹ýBlink Planner µÄtranslateToRel¡¢optimize¡¢translateToExecNodeGraphºÍtranslateToPlanËÄ¸ö½×¶Î£¬½«Operation×ª»»³ÉDataStream APIµÄ Transformation£»
[*]ÔÙ¾¹ýStreamJraph -> JobGraph -> ExecutionGraphµÈÒ»ÏµÁÐÁ÷³Ì£¬SQL×îÖÕ±»Ìá½»µ½¼¯Èº¡£

Ð¡±¿Öí¸ù¾Ý²éÑ¯ºóµÄ×ÊÁÏÒÔ¼°²é¿´Flink 1.13.2°æ±¾Ô´Âëºó£¬»³öÈçÏÂSQLÖ´ÐÐÁ÷³ÌÍ¼¡£

3. Blink SqlÌá½»Á÷³Ì£¨Ô´Âë·ÖÎö£©

°¢ÍÁ¸ù¾Ý¶ÔÔ´ÂëµÄ·ÖÎöºó£¬·¢ÏÖÎÞÂÛÊÇFlink SQLÖ´ÐÐDDL²Ù×÷¡¢»¹ÊÇDQL²Ù×÷»òÕßDML²Ù×÷¡¢×îÖÕ¶¼¿ÉÒÔ½«Æä×Ü½áÎªÁ½¸ö½×¶Î£º

[*]SQL Óï¾äµ½ Operation ¹ý³Ì£¬¼´Parse½×¶Î£»
[*]Operation µ½ Transformations ¹ý³Ì£¬¼´Translate½×¶Î¡£

3.1¡¢Parse½×¶Î

ÔÚParse½×¶ÎÒ»¹²°üº¬parse¡¢validate¡¢rel¡¢convert²¿·Ö

£¨1£©parse: SqlTest =>SqlNode

CalciteµÄ parse ½âÎöÄ£¿éÊÇ»ùÓÚjavaccÊµÏÖµÄ¡£javaccÊÇÒ»¸ö´Ê·¨·ÖÎöÉú³ÉÆ÷ºÍÓï·¨·ÖÎöÉú³ÉÆ÷¡£´Ê·¨·ÖÎöÆ÷ÓÚ½«ÊäÈë×Ö·ûÁ÷½âÎö³ÉÒ»¸öÒ»¸öµÄtoken£¬ÒÔÏÂÃæÕâ¶ÎSQLÓï¾äÎªÀý:

Ê¾Àý1 £º

ÔÚ parse ²¿·Ö£¬ÉÏÃæµÄSQLÓï¾ä×îºó»á±»½âÎöÎªÈçÏÂÒ»×étoken£º

½ÓÏÂÀ´Óï·¨·ÖÎöÆ÷»áÒÔ´Ê·¨·ÖÎöÆ÷½âÎö³öÀ´µÄtokenÐòÁÐ×÷ÎªÊäÈëÀ´½øÐÐÓï·¨·ÖÎö¡£·ÖÎö¹ý³ÌÊ¹ÓÃµÝ¹éÏÂ½µÓï·¨½âÎö£¬LL(k)¡£

ÆäÖÐ£¬µÚÒ»¸öL±íÊ¾´Ó×óµ½ÓÒÉ¨ÃèÊäÈë£»µÚ¶þ¸öL±íÊ¾Ã¿´Î¶¼½øÐÐ×î×óÍÆµ¼(ÔÚÍÆµ¼Óï·¨Ê÷µÄ¹ý³ÌÖÐÃ¿´Î¶¼Ìæ»»¾äÐÍÖÐ×î×óµÄ·ÇÖÕ½á·ûÎªÖÕ½á·û¡£ÀàËÆ»¹ÓÐ×îÓÒÍÆµ¼)£»

k±íÊ¾µÄÊÇÃ¿´ÎÏòÇ°Ì½Ë÷(lookahead)k ¸öÖÕ½á·û¡£

·ÖÎöËùÒÀÀµµÄµÄ´Ê·¨·¨Ôò¶¨ÒåÔÚÒ»¸öparser.jjÎÄ¼þÖÐ¡£

ÔÚ¾¹ý´Ê·¨·ÖÎöºÍÓï·¨·ÖÎöºó£¬Ò»¶Î SQL Óï¾ä»á±»½âÎö³ÉÒ»¿Å³éÏóÓï·¨Ê÷£¨Abstract Syntax Tree£¬AST£©£¬Ê÷µÄ½ÚµãÀàÐÍÔÚ Calcite ÖÐÒÔ SqlNode À´±íÊ¾£¬²»Í¬½ÚµãÒÔ²»Í¬×ÓÀàÐÍµÄSqlNodeÀ´±íÊ¾¡£

Í¬ÑùÒÔÉÏÃæµÄSQLÎªÀý£¬ÔÚÕâ¶ÎSQLÖÐ:

id, score, T µÈÎª SqlIdentifier£¬±íÊ¾Ò»¸ö×Ö¶ÎÃû»ò±íÃûµÄ±êÊ¶·û;

selectºÍcast()ÎªSqlCall£¬±íÊ¾Ò»¸öÐÐÎª»ò¶¯×÷£¬ÆäÖÐcast()ÎªÒ»¸öSqlBasicCall£¬±íÊ¾Ò»¸öº¯Êýµ÷ÓÃ£¬¾ßÌåµ÷ÓÃµÄÊÇÊ²Ã´º¯Êý£¬ÓÉÆäÄÚ²¿µÄSqlOperator¾ö¶¨£¬±ÈÈçÕâÀïÊÇÒ»¸ö¶þÔª²Ù×÷·û¡°<¡±£¬¶ÔÓ¦SqlBinaryOperator£¬operatorµÄÃû×ÖÊÇ¡°<¡±£¬Àà±ðÊÇSqlKind.LESS_THAN;

int Îª SqlDataTypeSpec£¬±íÊ¾Ò»¸öÀàÐÍ¶¨Òå;

'hello'ºÍ 10 ÎªSqlLiteral£¬±íÊ¾Ò»¸ö³£Á¿;

ÔÚCalciteÖÐ£¬ËùÓÐµÄ²Ù×÷¶¼ÊÇÒ»¸öSqlCall, Èç²éÑ¯ÊÇÒ»¸ö SqlSelect, É¾³ýÊÇÒ»¸ö SqlDelete µÈ£¬ËüÃÇ¶¼ÊÇ SqlCall µÄ×ÓÀàÐÍ¡£selectµÄ²éÑ¯Ìõ¼þµÈÎª SqlCall ÖÐµÄ²ÎÊý¡£Ê¾Àý1 µÄ SQL Óï¾ä×îÖÕÉú³ÉµÄÓï·¨Ê÷ÐÎÊ½ÈçÏÂ£º

Èç¹û°ÑÊ¾Àý1ÖÐµÄÖ±½Ó´ÓÒ»¸ö±í²éÑ¯Êý¾Ý£¬¸ÄÎª´ÓÁ½ÕÅ±íµÄ¹ØÁª½á¹ûÖÐ²éÑ¯Êý¾Ý£¬ÀýÈç£º

Ê¾Àý2£º

ÔòÏàÓ¦µÄASTÐÎÊ½ÈçÏÂ£º

ÆäÖÐÖ»ÓÐFROM×ÓÊ÷²¿·ÖÓÉÔÀ´µÄSqlIdentifier½Úµã±ä³ÉÁËÒ»¿ÃSqlJoin×ÓÊ÷£¬ÆäËû²¿·ÖÓëÊ¾Àý1ÏàÍ¬ËùÒÔÔÚÍ¼ÖÐÊ¡ÂÔÁË¡£

£¨2£©validate: SqlNode => SqlNode

Ð£Ñé£¨validate£©½×¶Î

¶Ô¾¹ýparser½âÎö³öµÄAST½øÐÐÓÐÐ§ÐÔÑéÖ¤£¬ÑéÖ¤µÄ·½ÃæÖ÷Òª°üÀ¨ÒÔÏÂÁ½·½Ãæ£º

[*]±íÃû¡¢×Ö¶ÎÃû¡¢º¯ÊýÃûÊÇ·ñÕýÈ·£¬ÈçÔÚÄ³¸ö²éÑ¯µÄ×Ö¶ÎÔÚµ±Ç°SQLÎ»ÖÃÉÏÊÇ·ñ´æÔÚ»òÓÐÆçÒå£¨µ±Ç°¿É¼ûµÄ¶à¸öÊý¾ÝÔ´ÖÐÍ¬Ê±´æÔÚ¸ÃÃû³ÆµÄ×Ö¶Î£©
[*]ÌØ¶¨ÀàÐÍ²Ù×÷×ÔÉíµÄºÏ·¨ÐÔ£¬Èçgroup by¾ÛºÏÖÐµÄ¾ÛºÏº¯ÊýÊÇ·ñ´æÔÚÇ¶Ì×µ÷ÓÃ£¬Ê¹ÓÃASÖØÃüÃûÊ±£¬ÐÂÃû×ÖÊÇ·ñÊÇx.yµÄÐÎÊ½µÈ

Õë¶ÔÉÏÃæµÄµÚÒ»ÖÖÇé¿ö£¬ÔÚÐ£Ñé¹ý³ÌÖÐÊ×ÏÈÐèÒªÃ÷È·Á½¸ö×îÖØÒªµÄ¸ÅÄî£ºNameSpaceºÍScope¡£

NameSpace´ú±íÒ»¸öÂß¼ÉÏµÄÊý¾ÝÔ´£¬¿ÉÒÔÊÇÒ»ÕÅ±í£¬Ò²¿ÉÒÔÊÇÒ»¸ö×Ó²éÑ¯£¬¶øScopeÔò´ú±íÁËÔÚ SQL µÄÄ³¸öÎ»ÖÃ£¬±íºÍ×Ö¶ÎµÄ¿É¼û·¶Î§¡£

´Ó¸ÅÄîÖÐ¿ÉÒÔ¿´³ö£¬ÔÚÄ³¸ö SQLÎ»ÖÃÉÏ£¬Ä³¸ö×Ö¶ÎËù¶ÔÓ¦µÄ scope ¿ÉÄÜ°üº¬¶à¸ö namespace¡£ÔÚ validate ½×¶Î½âÎö³öÀ´µÄ scope ºÍ namespace ÐÅÏ¢»á±»±£´æÏÂÀ´£¬ÔÚºóÃæ×ª»»³ÉÂß¼Ö´ÐÐ¼Æ»®µÄÊ±ºò»¹»áÓÃµ½¡£

Í¨¹ýÒ»¸öÊ¾ÀýÀ´¿´Ê²Ã´ÊÇ NameSpace ºÍ scope

Ê¾Àý3

ÔÚÉÏÃæÕâÑùÒ»¶ÎSQLÓï¾äÖÐ°üº¬ËÄ¸önamespace£º

¶ÔÓÚSQLÖÐµÄ²»Í¬±í´ïÊ½£¬¸ù¾ÝËüÃÇËùÔÚµÄÎ»ÖÃ£¬ËüÃÇËù¶ÔÓ¦µÄscopeÈçÏÂ£º

ÄÇÃ´ÔÚÐ£ÑéµÚÒ»ÖÖÇé¿öµÄÊ±ºò£¬Õû¸öÐ£Ñé¹ý³ÌµÄºËÐÄ¾ÍÔÚÓÚÎª²»Í¬µÄSqlNode½ÚµãÉú³ÉÆä¶ÔÓ¦µÄnamespaceºÍscope£¬È»ºó¶Ô¸ÃSqlNodeÉæ¼°µÄ×Ö¶ÎºÍnamespaceÓëscopeµÄ¶ÔÓ¦¹ØÏµ½øÐÐÐ£Ñé¡£

¶ÔÓÚµÚ¶þÖÖÇé¿öµÄÐ£Ñé£¬ÔòÐèÒª¸ù¾Ý¾ßÌåµÄ½ÚµãÀàÐÍ·Ö±ðÊµÏÖÁË¡£

ÔÚCalciteÖÐ£¬validatorµÄ¾ßÌåÊµÏÖÀàÊÇSqlValidatorImpl£¬namespaceºÍscope·Ö±ðÓÉ½Ó¿ÚSqlValidatorNamespaceºÍSqlValidatorScope±íÊ¾£¬Í¼ÖÐÉæ¼°µ½µÄxxxNamespaceºÍxxxScope·Ö±ðÊÇÕâÁ½¸öÀàµÄ×ÓÀà¡£

ÏÂÍ¼ÊÇ´Óµ÷ÓÃvalidator.validate(sqlNode)¿ªÊ¼£¬¶ÔÒ»¶Î²éÑ¯Óï¾äµÄ±íÃûºÍ×Ö¶ÎÃû½øÐÐÐ£ÑéµÄÊ±ÐòÍ¼¡£

´óÌå¹ý³Ì¶¼ÒÑ¾ÔÚÍ¼ÖÐµÄ×¢½âÀï½øÐÐÁËËµÃ÷£¬ÐèÒª²¹³äµÄÒ»µãÊÇ£¬ÔÚÍ¨¹ý emptyScope.resolve½âÎö±íÃûÊ±£¬±íÐÅÏ¢ÊÇÍ¨¹ý¾ßÌåµÄcatalogReader´ÓcatalogµÄschemaÖÐ²éÕÒ³öÀ´µÄ¡£

¾ßÌåÊ¹ÓÃÊ²Ã´catalogºÍcatalogReader£¬ÊÇÔÚvalidator´´½¨Ö®³õ¾ö¶¨µÄ¡£

ÔÚflinkÖÐ£¬¸ù¾ÝÓÃ»§µÄÅäÖÃ£¬catalog¿ÉÄÜÊÇ GenericInMemoryCatalog£¨»ùÓÚÄÚ´æµÄcatalog£©»òHiveCatalog£¨»ùÓÚhive metastoreµÄcatalog£©¡£

£¨3£©rel: SqlNode => RelNode + RexNode

ÈçÏÂÍ¼ËùÊ¾£º

rel½×¶ÎÊÇ½«SqlNode×é³ÉµÄÒ»¿Ã³éÏóÓï·¨Ê÷×ª»¯ÎªÒ»¿ÃÓÉRelNodeºÍRexNode×é³ÉµÄ¹ØÏµ´úÊýÊ÷£¬»òÕß³ÆÎªÖ´ÐÐ¼Æ»®¡£RelNode±íÊ¾¹ØÏµ±í´ïÊ½£¬ÈçÍ¶Ó°£¨Project£©£¬¼´SELECT£¬ºÍÁ¬½Ó£¨JOIN£©µÈ£»

RexNode±íÊ¾ÐÐ±í´ïÊ½£¬ÈçÊ¾ÀýÖÐµÄ CAST(score AS INT)¡¢T1.id < 10¡£

ÒÔÊ¾Àý2µÄÓï·¨Ê÷ÎªÀý£¬ÔÚ¾¹ýrel½×¶Î×ª»»ºó»áÉú³ÉÏÂÍ¼ËùÊ¾µÄÖ´ÐÐ¼Æ»®£º

rel½×¶ÎÖ»´¦ÀíDMLºÍDQL

ÒòÎªDDLÊµ¼ÊÉÏ¿ÉÒÔÈÏÎªÊÇ¶ÔÔªÊý¾ÝµÄÐÞ¸Ä£¬²»Éæ¼°¸´ÔÓ¹ØÏµ²éÑ¯£¬Ò²¾Í²»ÓÃ½øÐÐ¹ØÏµ´úÊý×ª»»À´ÓÅ»¯Ö´ÐÐ£¬ËùÒÔÒ²ÎÞÐè×ª»»Îª±íÊ¾£¬¸ù¾Ý¶ÔÓ¦µÄSqlNodeÖÐ±£´æµÄÐÅÏ¢ÒÑ¾¿ÉÒÔÖ±½ÓÖ´ÐÐÁË¡£

ÔÚcalciteÖÐ£¬SqlToRelConverterÓÃÓÚ¶Ô¹ØÏµ±í´ïÊ½½øÐÐ×ª»»¡£FlinkÖÐÍ¨¹ýÈçÏÂ·½Ê½Ê¹ÓÃcalcite½«AST×ª»»³ÉÂß¼Ö´ÐÐ¼Æ»®£¬ÈçÏÂÍ¼Ô´ÂëËùÊ¾¡£

´ÓFlink1.13.2Ô´ÂëÖÐ¿ÉÒÔ¿´µ½×ª»»µÄÈë¿ÚÊÇconvertQuery·½·¨¡£

SqlToRelConverterÖÐµÄ¼òµ¥µÄ×ª»»Á÷³ÌÈçÏÂÍ¼ËùÊ¾:

Õë¶ÔÃ¿ÖÖ¿ÉÄÜµÄ¸ù½ÚµãÀàÐÍ¶¼ÓÐ¶ÔÓ¦µÄ×ª»»·½·¨¡£ÆäÖÐDELETE¡¢UPDATE¡¢MERGE¡¢WITHºÍVALUESÕâ¼¸ÖÖÓï·¨ÔÚflinkÁ÷Ê½SQLÖÐ»¹²»Ö§³Ö£¬²¢ÇÒÆä×ª»»¹ý³ÌÒ²±È½Ï¼òµ¥£¬ºóÎÄ²»ÔÙÏêÏ¸·ÖÎö¡£

¶ÔÓÚÒ»¿Ã×ª»»ºóµÃµ½µÄÂß¼Ö´ÐÐ¼Æ»®Ê÷ÖÐµÄ½Úµã£¬ÆäÊµÔÚASTÖÐ¶¼ÊÇ¿ÉÒÔÒ»Ò»¶ÔÓ¦µÄÕÒµ½¶ÔÓ¦µÄ½ÚµãµÄ£¬ËùÒÔ×ª»»¹ý³Ì±¾Éí²¢²»Éæ¼°ºÜ¸´ÔÓµÄËã·¨£¬´ó²¿·Ö¹ý³ÌÊÇÌáÈ¡ÒÑÓÐSqlNode½ÚµãÖÐ¼ÇÂ¼µÄÐÅÏ¢£¬È»ºóÉú³É¶ÔÓ¦µÄRelNodeºÍRexNode£¬²¢ÉèÖÃRelNode¼äµÄ¸¸×Ó¹ØÏµ¡£

´ÓÍ¼ÖÐÒ²¿ÉÒÔ¿´³öÔÚcalciteÀï×îÖÕ¶¼»áÉú³ÉÒ»¸öLogicalModify½Úµã£¬Í¨¹ý½ÚµãÄÚµÄoperationÊôÐÔÀ´±êÊ¶²»Í¬µÄº¬Òå¡£µ«ÊÇÄ¿Ç°flinkÖ§³ÖµÄDMLÖ»ÓÐinsertÓï¾ä£¬¶øÇÒ²¢²»»áÉú³ÉLogicalModify½Úµã£¬¶øÊÇÖ±½Ó×ª»»³ÉÁËModifyOperation£¬²¢ÔÚÐèÒªµÄÊ±ºò×ª»»³ÉflinkÄÚ²¿×Ô¼º¶¨ÒåµÄ½ÚµãÀàÐÍLogicalSink¡£Ò²ÒòÎªÕâ¸öÔÒò£¬¶ÔÓÚDMLµÄ×ª»»Á÷³ÌÍ¼ÖÐÊÇÂÔÓÐ¼ò»¯µÄ£¬insert¡¢delete¡¢updateºÍmerge±¾Éí¶¼¿ÉÒÔ´ø²éÑ¯Óï¾ä£¬Òò´ËÊµ¼Ê×ª»»µÄÊ±ºò¶¼»áµÝ¹éµØÏÈ¶Ô²éÑ¯²¿·Ö½øÐÐ×ª»»¡£

ÉÏÍ¼ËùÊ¾Á÷³ÌÖÐÖ»Õ¹Ê¾ÁË¶Ô¹ØÏµ±í´ïÊ½µÄ×ª»»£¬µ«ÊÇÃ¿¸ö¹ØÏµ½Úµã£¨RelNode£©ÖÐµÄÐÐ±í´ïÊ½Í¬ÑùÐèÒª¾¹ý×ª»»µÃÀ´¡£

CalciteÖÐÐÐ±í´ïÊ½µÄ×ª»»ÒÀÀµÓÚÁ½¸ö¶ÔÏó£ºBlackBoardºÍSqlNodeToRexConverter¡£

BlackBoardÊÇ¶Ôselect½øÐÐ×ª»»Ê±µÄÒ»¸öÁÙÊ±¹¤×÷¿Õ¼ä£¬Ëü¾ÍÏñÒ»¿é¡°ºÚ°å¡±Ò»Ñù£¬¿ÉÒÔÁÙÊ±¼ÇÂ¼ÏÂ×ª»»¹ý³ÌÖÐÐèÒªµÄÐÅÏ¢£¬±ÈÈçselectÒÀÀµµÄscope¡¢µ±Ç°µÄroot½Úµã¡¢µ±Ç°½ÚµãÊÇ·ñÊÇtop½ÚµãµÈ¡£

BlackBoard±¾Éí»¹ÊÇÒ»¸öshuttle£¬Õë¶Ô²»Í¬ÀàÐÍµÄSqlNode£¬ÆäÄÚ²¿¶¼ÓÐ¶ÔÓ¦µÄvisit·½·¨¡£ÆäÖÐ³ýSqlCall¡¢SqlLiteral¡¢SqlIntervalQualifierÍâ£¬¶¼¿ÉÓÉBlackBoardºÍSqlToRelConverterÖÐ¶¨ÒåµÄ¸÷ÖÖconvertXXX·½·¨½øÐÐ×ª»»£¬ÕâÈýÖÖÀàÐÍµÄSqlNodeÔòÐèÒª½èÖúSqlNodeToRexConverterÀ´½øÐÐ×ª»»¡£

SqlLiteral¡¢SqlIntervalQualifierµÄ×ª»»±È½Ï¼òµ¥£¬¾ÍÊÇ´ÓÔÀ´µÄSqlNodeÖÐÌáÈ¡ÐÅÏ¢½øÐÐ¼òµ¥µÄ´¦ÀíºÍ×ª»»£¬È»ºóÉú³É¶ÔÓ¦µÄRexNode¡£

£¨4£©convert: RelNode => Operation

ÖØµã£ºÕâÒ»²½¸ºÔð½«RelNode tree×ª»»³Éoperation

RelNode×ª»»³ÉOperationµÄ¹ý³ÌºÜ¼òµ¥£¬Õë¶ÔËÄÖÖÀàÐÍµÄ²Ù×÷£¬Æä¸÷×ÔµÄ×ª»»¹ý³ÌÈçÏÂ£º¡¤

[*]CreateTable @convertCreateTable

Èç¹ûASTµÄ¸ù½ÚµãÊÇSqlCreateTable£¬ÌáÈ¡½ÚµãÖÐ¼ÇÂ¼µÄschema¡¢properties¡¢comment¡¢primary keys¡¢if not existsÐÅÏ¢£¬´´½¨CatalogTable¶ÔÏó£¬È»ºó´´½¨CreateTableOperation

[*]DropTable @convertDropTable

Èç¹ûASTµÄ¸ù½ÚµãÊÇSqlDropTable£¬ÌáÈ¡½ÚµãÖÐ¼ÇÂ¼µÄfull table name¡¢if existsÐÅÏ¢£¬´´½¨DropTableOperation¶ÔÏó

[*]Insert @convertInsert

Èç¹ûASTµÄ¸ù½ÚµãÊÇRichSqlInsert£¬ÌáÈ¡½ÚµãÖÐ¼ÇÂ¼µÄÄ¿±ê±íµÄÍêÕûÂ·¾¶ºÍ²éÑ¯±í´ïÊ½£¬ÏÈ½«²éÑ¯±í´ïÊ½Í¨¹ýconvertSqlQuery×ª»»³ÉQueryOperation£¬È»ºóÒÔ×ª»»ºóµÄQueryOperationÎª×Ó½Úµã´´½¨ModifyOperation¶ÔÏó¡£

ÕâÀï·ÖÁ½ÖÖÇé¿ö:

(1)Ê¹ÓÃSQL APIÖ´ÐÐÁË insert into Óï¾ä£¬½«Êý¾ÝÐ´ÈëÒÑ¾Í¨¹ý TableEnvironment×¢²á¹ýµÄ±íÖÐ£¬´ËÊ±´´½¨µÄÊÇCatalogSinkModifyOperation

(2)Ê¹ÓÃTable APIµÄtoXXXStream½«table¶ÔÏó×ª»»³ÉÁËDataStream£¬´´½¨µÄÊÇOutputConversionModifyOperation

[*]Query @convertSqlQuery

Èç¹û¸ù½ÚµãµÄSqlKindÊÇSqlKind.Query£¬ÏÈÍ¨¹ýFlinkPlannerImpl.rel½«SqlNode×ª»»³ÉRelNode£¬È»ºó´´½¨PlannerQueryOperation¶ÔÏó

3.2¡¢Translate½×¶Î

ÔÚTranslate½×¶Î£¬Í¨¹ýBlink Planner µÄtranslateToRel¡¢optimize¡¢translateToExecNodeGraphºÍtranslateToPlanËÄ¸ö½×¶Î:½«Operation×ª»»³É Transformations¡£

ÖØµã£º

[*]´Óoperation¿ªÊ¼£¬ÏÈ½«ModifyOperationÍ¨¹ýtranslateToRel·½·¨×ª»»³ÉCalcite RelNodeÂß¼¼Æ»®Ê÷£¬ÔÚ¶ÔÓ¦×ª»»³ÉFlinkLogicalRel£¨RelNodeÂß¼¼Æ»®Ê÷£©£»
[*]È»ºó¾¹ý µ÷ÓÃoptimize·½·¨½«FlinkLogicalRel ÓÅ»¯³ÉFlinkPhysicalRel¡£
[*]ÔÙµ÷ÓÃtranslateToExecNodeGraph·½·¨½«FlinkPhysicalRel×ªÎªexecGraph
[*]×îºóµ÷ÓÃtranslateToPlan·½·¨½«execGraph×ªÎªtransformations

´ÓÂß¼¼Æ»®±ä³ÉÎïÀí¼Æ»®£¨RelNode£©£¬

Flink1.13.2Ô´ÂëÈçÏÂ£º

3.2.1¡¢translateToRel

Õâ¸ö¹ý³Ì¿ÉÒÔ¿´³ÉÊÇconvert: RelNode => OperationµÄÄæ¹ý³Ì¡£

Âß¼Ò²ºÜ¼òµ¥£¬ÎÞÂÛÊÇÊ¹ÓÃSQL API»¹ÊÇTable API£¬×îÖÕÉú³ÉµÄoperationµÄ¸ù½ÚµãÒ»¶¨ÊÇModifyOperation£¬ÒòÎªÖ»ÓÐinsertÓï¾ä»òÕß½«Table×ª»»³ÉDataStreamºó£¬ÔÚDataStream½á¹ûÉÏÃæÐ´Èësink²ÅÄÜ´¥·¢Ö´ÐÐ¡£

Ç°ÎÄÌáµ½¹ýModifyOperation×îÖÕ¶¼»á±»×ª»»³ÉflinkÄÚ×Ô¶¨ÒåµÄLogicalSink½Úµã£¬¸Ã½ÚµãÖ÷Òª¼ÇÂ¼Êý¾ÝÊä³öÐÅÏ¢£¬ºËÐÄÔÚÓÚÐèÒª´´½¨³ö±íÊ¾Êý¾ÝÊä³öµÄsink¡£ËùÒÔÕë¶ÔÈýÖÖModifyOperationÀàÐÍ·Ö±ð´´½¨sinkµÄ¹ý³ÌÈçÏÂ£º

[*]UnregisteredSinkModifyOperation£º

Õâ¸öoperationÖÐÖ±½Ó¼ÇÂ¼ÁËsinkÐÅÏ¢£¬Òò´ËÖ±½ÓÌáÈ¡³öÀ´´´½¨LogicalSink¼´¿É¡£

[*]CatalogSinkModifyOperation£º

¸ù¾ÝoperationÖÐ¼ÇÂ¼µÄtable pathÕÒµ½¶ÔÓ¦µÄtable£¬È»ºó¸ù¾Ýtable´´½¨³ötable sink£¬×îºóÊ¹ÓÃtable sink´´½¨³öLogicalSink½Úµã¡£

Õâ¸ö¹ý³ÌÖÐÉæ¼°µ½ÁËÔÚcatalogÖÐ½âÎötableºÍÊ¹ÓÃServiceLoader¸ù¾ÝtableÐÅÏ¢ÔÚclasspathÖÐ²éÕÒ²¢ÓÃÓÚ´´½¨table sinkµÄTableSinkFactoryµÄ¹ý³Ì£¬¾ßÌåÈçÏÂÍ¼ËùÊ¾¡£

3.2.2¡¢optimize

»áÊ¹ÓÃÁ½¸öÓÅ»¯Æ÷:RBO(»ùÓÚ¹æÔòµÄÓÅ»¯Æ÷) ºÍ CBO(»ùÓÚ´ú¼ÛµÄÓÅ»¯Æ÷)

[*]RBO(»ùÓÚ¹æÔòµÄÓÅ»¯Æ÷)»á½«ÔÓÐ±í´ïÊ½²Ã¼ôµô£¬±éÀúÒ»ÏµÁÐ¹æÔò£¨Rule£©£¬Ö»ÒªÂú×ãÌõ¼þ¾Í×ª»»£¬Éú³É×îÖÕµÄÖ´ÐÐ¼Æ»®¡£Ò»Ð©³£¼ûµÄ¹æÔò°üÀ¨·ÖÇø²Ã¼ô£¨Partition Prune£©¡¢ÁÐ²Ã¼ô¡¢Î½´ÊÏÂÍÆ£¨Predicate Pushdown£©¡¢Í¶Ó°ÏÂÍÆ£¨Projection Pushdown£©¡¢¾ÛºÏÏÂÍÆ¡¢limitÏÂÍÆ¡¢sortÏÂÍÆ¡¢³£Á¿ÕÛµþ£¨Constant Folding£©¡¢×Ó²éÑ¯ÄÚÁª×ªjoinµÈ¡£
[*]CBO(»ùÓÚ´ú¼ÛµÄÓÅ»¯Æ÷)»á½«ÔÓÐ±í´ïÊ½±£Áô£¬»ùÓÚÍ³¼ÆÐÅÏ¢ºÍ´ú¼ÛÄ£ÐÍ£¬³¢ÊÔÌ½Ë÷Éú³ÉµÈ¼Û¹ØÏµ±í´ïÊ½£¬×îÖÕÈ¡´ú¼Û×îÐ¡µÄÖ´ÐÐ¼Æ»®¡£CBOµÄÊµÏÖÓÐÁ½ÖÖÄ£ÐÍ£¬VolcanoÄ£ÐÍ£¬CascadesÄ£ÐÍ¡£ÕâÁ½ÖÖÄ£ÐÍË¼ÏëºÜÊÇÏàËÆ£¬²»Í¬µãÔÚÓÚCascadesÄ£ÐÍÒ»±ß±éÀúSQLÂß¼Ê÷£¬Ò»±ßÓÅ»¯£¬´Ó¶ø½øÒ»²½²Ã¼ôµôÒ»Ð©Ö´ÐÐ¼Æ»®¡£

Ô´ÂëÈçÏÂ£º

3.2.3¡¢translateToExecNodeGraph

µ÷ÓÃtranslateToExecNodeGraph·½·¨½«FlinkPhysicalRel×ªÎªexecGraph

3.2.4¡¢translateToExecNodeGraph

µ÷ÓÃtranslateToPlan·½·¨½«execGraph×ªÎªtransformations

Í¨¹ýÉÏÊöËÄ¸ö²½Öè£¬ÊµÏÖ½«Operation×ª»»³É Transformations¡£

Ð¡±¿ÖíÍ¨¹ýÍêÕûµÄÁ÷³Ì·ÖÎöºó£¬ÖÕÓÚ¸ã¶®ÁËFlink sqlµÄ½âÎöºÍ×ª»»¹ý³Ì£¬×îÖÕSQL±»×ªÎªTransformations,ºóÃæµÄ²½Öè¾Í±ä³ÉÁËFlink DataStreamµÄÌá½»Á÷³Ì£¬Ð¡±¿Öí»¹ÊÇ±È½ÏÁË½âµÄ¡£

×îÐÂ¾µäÎÄÕÂ£¬»¶Ó¹Ø×¢¹«ÖÚºÅhttp://www.aboutyun.com/data/attachment/forum/201903/18/215536lzpn7n3u7m7u90vm.jpg

---------------------
×÷Õß£º÷èË¼ÃîÏë
À´Ô´£ºweixin
ÔÎÄ£º33ÕÅÍ¼½âflink sqlÓ¦ÓÃÌá½»£¨½¨ÒéÊÕ²Ø£¡£©

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

Í¼½âflink sqlÓ¦ÓÃÌá½»·½Ê½£¨¶þ£©