分享

求教网站实时行为采集数据架构

elvishadalcl 发表于 2014-10-12 12:46:33 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 2 7912
各位大侠可否提供一下网站实时行为采集数据架构呢? 网站规模不是特别大,类似天天网、唯品会这样规模的

已有(2)人评论

跳转到指定楼层
desehawk 发表于 2014-10-12 13:57:19
你这个不需要很多的架构,可以看看爬虫nutch。如果想实时采集,可以设置定时器

nutch的相关内容:
Nutch相关框架视频教程
回复

使用道具 举报

desehawk 发表于 2014-10-12 13:59:17
从搜索引擎到网络爬虫文档分享



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条