用户组:游客
问题导读: 1、如何设计ODS层? 2、如何使用DWD层对ODS层数据进行判空过滤? 3、DWS层之用户行为宽表如何设计? 4、用户行为 ...
问题导读: 1、关系建模与维度建模如何理解? 2、如何配置Hadoop支持Snappy压缩? 3、业务数据如何生成? 4、如何将业务数据 ...
问题导读: 1、如何理解电商业务流程 ? 2、SPU又是干什么的呢? 3、电商表结构如何设计? 4、数据同步策略的类型包括哪些? ...
问题导读: 1、数仓分几层?每层做什么的? 2、如何分析最近七天内连续三天活跃用户数? 3、Hive和数据库有什么区别? 4、Hi ...
问题导读: 1、如何统计每日各类别下点击次数top10的商品? 2、如何使用日志数据用户行为宽表作为DWS层表? 3、如何统计点击 ...
问题导读: 1.什么是数据仓库?2.数据仓库的架构是怎样的?3.怎样设计数据仓库的模型? 1. 什么是数据仓库 ...
问题导读: 1、如何统计每个用户累计访问次数? 2、如何统计某天首次添加收藏的用户? 3、如何使用使用日志数据用户行为宽表 ...
问题导读: 1、如何统计最近7天未登录的用户? 2、如何使用周活明细表dws_uv_detail_wk输出数据? 3、如何统计最近连续三周活 ...
本帖最后由 levycui 于 2020-12-22 20:26 编辑 问题导读: 1、Maxwell与Canal相比,具有哪些特点? 2、Maxwell如何配置? 3 ...
本帖最后由 levycui 于 2020-11-18 00:10 编辑 问题导读: 1、什么是指标体系? 2、为什么搭建指标体系? 3、如何搭建指标 ...
问题导读: 1、如何分析沉默用户、本周回流用户数、流失用户? 2、如何分析最近连续3周活跃用户? 3、如何分析最近七天内连续 ...
问题导读: 1、为什么要进行数据分层? 2、数仓搭建环境需要哪些准备工作? 3、如何设计数仓ODS层? 4、Shell中单引号和双引 ...
问题导读: 1、如何设计DWD层启动表数据解析? 2、如何设计DWD层事件表数据解析? 3、如何设计DWD层事件表获取? 4、如何设 ...
问题导读: 1、业务术语有哪些? 2、如何使用collect_set函数和日期处理函数(datediff)? 3、如何使用date_add函数和next_d ...
问题导读: 1、如何设计当日(dau)、当周、当月活动的每个设备明细表? 2、如何根据日用户访问明细,获得周用户访问明细? 3、 ...
问题导读: 1、如何设计每日新增设备明细表? 2、如何使用每日新增设备表? 3、如何设计用户留存主题表? 4、如何设计留存用 ...
本帖最后由 levycui 于 2020-12-15 19:31 编辑 问题导读: 1、如何检查缺失数据? 2、如何缺失数据的计算? 3、如何填充缺 ...
问题导读 1.怎样优化亿级数据表的查询? 2.怎样优化复杂的SQL查询? 3.怎样优化使用函数的复杂SQL的查询? HiveSQ ...
问题导读: 1、数据仓库的输入数据源和输出系统分别是什么? 2、HDFS存入大量小文件,有什么影响? 3、Kafka消息数据积压,Ka ...
问题导读: 1、如何对Kafka进行压力测试? 2、FileChannel和MemoryChannel区别? 3、如何采集通道启动/停止脚本? 上一篇 ...
问题导读: 1、如何使用Flink导入数据? 2、如何使用Spark导入数据? 3、如何从MySQL中导入数据? 4、如何从Hive中导入数据 ...
问题导读: 1、硬件应该如何部署? 2、硬件清单都包含什么? 3、系统架构是如何设计的? 上一篇:数据仓库建设方案详细( ...
问题导读: 1、如何监控Hadoop集群? 2、如何进行系统负载管理? 3、如何确保Hadoop集群可靠安全? 上一篇:数据仓库建设 ...
问题导读: 1、数据分析系统可解决哪些痛点? 2、如何进行目标设计? 3、实时计算如何设计? 4、实时存储有哪些考虑点? ...
问题导读: 1、怎样搭建大数据基础平台? 2、大数据基础平台要具有哪些功能? 3、大数据基础平台有哪些优势? 上一篇:数 ...
本帖最后由 levycui 于 2020-11-10 21:54 编辑 问题导读: 1、技术选型方面主要考虑哪些方面? 2、广告场景应用有哪些要点? ...
问题导读: 1、常用的算法模型有哪些? 2、如何对数据进行监控管理? 3、大数据平台的数据服务是怎样的? 上一篇:数据仓 ...
问题导读 1.什么是数据倾斜? 2.开发人员需要注意哪些? 3.怎样优化join? 前言 实际搞过离线数据处理的同学都 ...
本帖最后由 nettman 于 2019-5-23 13:16 编辑 问题导读 1.Hive事务做了什么改进? 2.Spark与Hive集成提供了什么组件? 3. ...
问题导读: 1、对数据湖有哪些预期? 2、数据湖架构如何设计? 3、如何做好数据治理工作? 4、如何保障数据湖的安全? ...
本版积分规则 发表帖子
查看 »