问题导读
1.本文将大数据分为了哪四层?
2.如何落地大数据?
3.本文中大数据在阿里的作用是什么?
大数据的能力可以分为四层: 第一层是骨骼,硬件和存储的计算能力,相当于我们如何把数据的计算、存储、服务等处理好; 第二层是血液,数据建模和管理能力,包括数据如何进行采集、如何进行建模,以及如何最快的计算和最高效的存储等等; 第三层是思想,业务理解和算法能力,很多算法工程师、科学家用大数据的时候可以作出很多关于用户的标签画像,其实这一部分正是他们对于业务的理解和算法能力的体现,但是仅仅这样还不够,大数据应用过 程中需要一个系统、体系完整的解决方案。 第四层是大脑,告诉你今天的数据表现是什么样,问题是什么,未来你可以做一些什么,做完之后的效果会是怎么样,因为这个效果可以 做什么样的改善,这本身就是一个非常复杂完整的体系,产品设计和服务能力,大脑进行产品的设计以及很好的服务能力。
这四者结合起来,分别表示着大数据的基础建设能力和数据产品能力。 大数据能力背后意味着非常巨大的挑战,大数据挑战本身也是一个非常完整的闭环。
会在基础建设方面,包括如何进行很好的数据采 集,如果你的数据只有几百个T或1PB左右,采集起来不那么难,如果面临几百个PB的数据如何采集,在无线时代已经到来的时候,无线的采集应该如何做?采 集之后非常重要的是计算,如果把数据采集、计算都做得很好,可是上面的应用根本没有很好的方法,快速和有效拿到这些数据来使用,其实前面所有的工作都是白 费的。
关于采集、计算、服务是大数据基础建设方面的挑战,所有这些工作最终都要在上面浮现出来,就是我们所理解的数据产品,我们希望数据产品给到大家真的不只是一个报表,而是希望我们真的用数据产品去理解 商业,理解它的目标,并且把数据不是枯燥的以一个表格的方式呈现给用户,而是告诉你这个数据的含义是什么,如何解读它,在这个过程中去追求数据价值的最大化。关于基础建设和数据产品价值两大块挑战的关键词就是质量、效率和价值。
关于大数据的能力看起来非常具有想象空间,挑战也是巨大的,这是非常复杂的事情,复杂的事情一定要用复杂的方法去解决,所以我们需要有简单、清晰、明确的顶层设计。过去两年,阿里巴巴大数据实战过程 中的一个顶层设计,下面我们做好数据的基础建设,包括数据采集计算以及服务,上面我们面临的客户数据方面首先是阿里自己的小二,要有能力用好数据做数据化营运,第二块是我们非常紧密的伙伴,即商家。我们在做这件事情顶层设计时,同步考虑阿里的小二和商家如何同时用好数据。数据基础建设方面做好one data和one service,数据上面一块做好对内和对外能够共享的one Platform。解决的是关于大数据本身背后的挑战,基础建设和价值两块的挑战。
大数据产品的内外兼修 大数据产品解决的不仅仅是产品自身的问题,一定要同步去解决内在的数据基础建设的问题,所以大数据产品务必做到内外兼修。 总结下来,大数据的产品之道就是要有内在的魅力:基础建设;要有外在的魅力:数据产品。
|