第二,资源的分配和再分配。Kubernetes 是通用的容器资源调度工具,很难满足不同大数据组件的资源使用场景。大数据场景下资源使用会比较大,请求频率高,每次启动的 pod 的数又会比较多,这种情况下,目前没有什么好的方案。目前我们正在看 Fluid 这个方案,Fluid 也实现了 JuiceFS 的 runtime,这个也是我们后边要去深入调研的,Fluid 目前宣称是可以支持大数据和 AI 的,并不是只有 AI 的场景,因为大数据和 AI 的场景是比较像的,都是数据密集型的操作,Fluid 在计算效率和数据抽象管理方面是有了一些突破性的进展。
第二个是大数据平台和 AI 平台联动的场景。比方说 AI 平台的同事在日常工作中需要经常读取样本数据、特征数据等,而这些数据通常是由大数据平台上的 Spark 或者 Flink 任务产生的,并且已经存储到了 JuiceFS 里。为了不同的平台之间能够共享数据,在 AI 平台的 pod 启动时,会通过 FUSE 的方式将 JuiceFS 直接挂载到 pod 里,这样 AI 平台的同事就可以通过 Jupyter 直接访问 JuiceFS 里的数据做一些模型的训练,而不用像传统的架构那样在不同平台之间重复拷贝数据,提高了跨团队的协作效率。