而雅虎则是分享了他们将Spark和Caffe相结合的项目Caffe On Spark。Caffe On Spark充分利用到了Spark自身分布式调度,将Caffe深度学习模块集成到了Spark中,由Spark进行任务管理和调度,同时Caffe On Spark扩展了 Spark本身的资源管理使其能够支持GPU,并且修改了Spark的通信模型使得Caffe On Spark可以支持节点之间的互相直接通信。最后Caffe On Spark提供了一套类似DataFrame的API使得用户能够轻易地在分布式数据集上进行深度学习。