about云分析discuz论坛apache日志hadoop大数据项目:数据库设计说明书V1.0.1
about云分析discuz论坛apache日志hadoop大数据项目数据库设计说明书修改记录
版本号更改人/发布人审批人更改日期
V1.0.1About云About云20140-7-20
http://www.aboutyun.com/static/image/hrline/2.gif程序命名规则:包:统一www.aboutyun.com.包名注释中:程序开头加上个人名字
文件清洗,放入路径/usr/local/abotuyunlog
git地址:https://code.csdn.net/bj278595437/aboutyunhadoop.git
hive表设计表名称:LogTable字段:IpAddress 字符串(STRING)IpCount整型(INT)Url 字符串(STRING)UserBrowser 字符串(STRING)OS 字符串(STRING)AccressTime 时间类型(TIMESTAMP)
hbase表设计加载到hbase中hbase两个字段即可:表名称:LogTableRowKey:IpAddress+Url一个列族Info:5个列:IpAddressIpCount(暂时去掉)Url UserBrowserOS AccressTime
Mysql表设计一、统计ip表名称IPStatistical字段:IpAddressVARCHARVisitNum INTTime DATETIME
二、统计跳出率表名称:BounceRate字段:UrlVARCHARRateFLOAT
三、统计后台登陆ip表名称:BackgroundIP字段:IpAddress VARCHARVisitNum INTTime DATETIME
四、统计搜索量及搜索词表名称:SearchStatistics字段:IpAddress VARCHARSearchWodNVARCHARSearchNumINTTime DATETIME
注释:SearchNum 搜索次数
五、统计模块点击量表名称:ModuleClicks字段:IpAddress VARCHARVisitNum INTTime DATETIME
六、空间总访问量表名称:ModuleClicks字段:IpAddress VARCHARVisitNum INTTime DATETIME
七、统计导航点击量:
表名称:NavigationStatistics
字段:IpAddress VARCHARVisitNum INTType INTTime DATETIME
type类型:数字与统计对相应
1.统计论坛社区2.统计图文阅读区3.统计导读4.统计博客5.统计排行榜6.统计分享7.统计群组8.统计广播9.统计微信
现在数据库更新了么?有没有SQL文件 {:soso_e181:} 舒舒坦坦过日子,折折腾腾学技术
页:
[1]