用户组:游客
问题导读: 1.Apache Hudi和Debezium构建CDC入湖管道在什么背景下产生的? 2.在使用 Debezium 源连接器进行 CDC 摄取时,Hudi ...
问题导读: 1.模型建设需要哪些工作? 2.熟悉ETL平台吗? 3.你熟悉的非关系数据库有哪些? 好久不写数据中台了,但是我发现大 ...
问题导读: 1、写期间VS写入后小文件如何优化? 2、核心配置有哪些? 3、Spark+Hudi如何优化? 4、如何进行GC调优? ...
问题导读: 1、“客户档案” 场景如何理解? 2、在Kudu和Hudi里代码实现的差异有哪些? 3、“实时数仓”场景如何理解? 4、 ...
问题导读:1.之前了解数据湖吗?2.用过那些数据湖相关技术?3.本文中的内容是否有所借鉴? 本文是字节跳动数据平台开发套件团队 ...
问题导读: 1、现有架构有哪些改进? 2、新架构收益都有哪些? 3、Debezium 增量Binlog同步如何配置? 4、Hudi同步Metastore ...
问题导读: 1、如何解决不同引擎 SQL 语义的一致性? 2、Hudi Catalog 如何保证数据的一致性? 3、如何避免 Compact ...
问题导读: 1、数据湖和生态系统如何理解? 2、大批量摄取的限制有哪些? 3、可缩放的初始引导程序是什么? 4、管理 Postgre ...
问题导读: 1、规范标准阶段数仓有哪些特性? 2、如何理解开放自由阶段数据湖? 3、融合共享阶段湖仓一体有哪些优势? 4、为 ...
问题导读: 1、Iceberg 核心特性有哪些? 2、如何设计Flink+ Iceberg 构建近实时数仓? 3、如何进行实时集成入湖? 4、Hive ...
问题导读: 1. B站数仓的现状和痛点是什么? 2. 针对典型的四个案例,对应的优化方案和收益是什么? 3. 介绍在批流融合方面, ...
问题导读: 1、新版本性能提升的如何? 2、有哪些多样的分析场景? 3、多租户资源隔离如何实现的? 4、极致弹性与存算分离有 ...
本版积分规则 发表帖子
查看 »