首先这个问题比较有深度和思考。这里回答下。
首先直接回答楼主的问题:
1.采用的是什么存储
这个相信我们都知道大数据,那么头条的数据,相信没有阿里的多,既然阿里使用大数据框架都没有问题,所以头条也没有问题。那么它用什么存储这个也只能猜测,不出意外,肯定是用的hadoop相关组件,比如hbase或则hive。这二者可能都用到了。比如数据仓库hive用来存储多维度数据。
2.快速查询,楼主可能所说的应该是为什么能快速的推荐。这个他们有自己的推荐算法。
今日头条的个性化推荐算法原理 如上图,有3篇文章,让3个用户投票(注:这3个用户是一类人,有相同属性(喜好和偏好)),那第4个用户应该被系统推荐的文章是那篇呢?第4个用户与前3个用户都是一类人,答案显而易见是第一篇文章。 没错,今日头条的个性化推荐算法原理就是基于投票的方法,其核心理念就是投票,每个用户一票,喜欢哪一篇文章就把票投给这篇文章,经过统计,最后得到结果很可能是在这个人群下最好的文章,并把这篇文章推荐给同人群用户过程就是个性化推荐,实际上个性化推荐并不是机器给用户推荐,而是用户之间在互相推荐,看起来似乎很简单,但实际上这需要基于海量的用户行为数据挖掘与分析。
那么他们的推荐具体用了哪些技术,如下图,首先需要有数据,然后各种处理
处理之后,在推荐系统中应用 为什么那么快,其实如下,这些使用hadoop离线处理,对于过去信息处理,如下图。
当然相信也有实时处理,他们使用的是storm
|