pig2 发表于 2014-7-20 18:15:46

about云分析discuz论坛apache日志hadoop大数据项目:数据库设计说明书V1.0.1

about云分析discuz论坛apache日志hadoop大数据项目数据库设计说明书





修改记录
版本号更改人/发布人审批人更改日期
V1.0.1About云About云20140-7-20



http://www.aboutyun.com/static/image/hrline/2.gif程序命名规则:包:统一www.aboutyun.com.包名注释中:程序开头加上个人名字
文件清洗,放入路径/usr/local/abotuyunlog
git地址:https://code.csdn.net/bj278595437/aboutyunhadoop.git

hive表设计表名称:LogTable字段:IpAddress 字符串(STRING)IpCount整型(INT)Url      字符串(STRING)UserBrowser 字符串(STRING)OS   字符串(STRING)AccressTime 时间类型(TIMESTAMP)
hbase表设计加载到hbase中hbase两个字段即可:表名称:LogTableRowKey:IpAddress+Url一个列族Info:5个列:IpAddressIpCount(暂时去掉)Url      UserBrowserOS   AccressTime
Mysql表设计一、统计ip表名称IPStatistical字段:IpAddressVARCHARVisitNum   INTTime       DATETIME
二、统计跳出率表名称:BounceRate字段:UrlVARCHARRateFLOAT

三、统计后台登陆ip表名称:BackgroundIP字段:IpAddress   VARCHARVisitNum   INTTime      DATETIME

四、统计搜索量及搜索词表名称:SearchStatistics字段:IpAddress   VARCHARSearchWodNVARCHARSearchNumINTTime      DATETIME
注释:SearchNum   搜索次数
五、统计模块点击量表名称:ModuleClicks字段:IpAddress   VARCHARVisitNum    INTTime      DATETIME

六、空间总访问量表名称:ModuleClicks字段:IpAddress   VARCHARVisitNum    INTTime      DATETIME



七、统计导航点击量:
表名称:NavigationStatistics
字段:IpAddress   VARCHARVisitNum    INTType          INTTime      DATETIME
type类型:数字与统计对相应
1.统计论坛社区2.统计图文阅读区3.统计导读4.统计博客5.统计排行榜6.统计分享7.统计群组8.统计广播9.统计微信


admln 发表于 2014-12-22 09:53:22

现在数据库更新了么?有没有SQL文件

wubaozhou 发表于 2014-12-31 08:53:59

{:soso_e181:}

若无梦何远方 发表于 2019-9-5 20:52:40

舒舒坦坦过日子,折折腾腾学技术
页: [1]
查看完整版本: about云分析discuz论坛apache日志hadoop大数据项目:数据库设计说明书V1.0.1