我们都知道Ganglia的数据都是存储在RRDTool的数据库中的。但是,或许在有的应用中,我们想把RRD的数据转存到Mongodb或者MySQL中,是否可以呢?答案是肯定的!
我现在提供两种比较可行的方案,这两种是我亲自测试过的:
1 工具为Perl语言;RRD的驱动为RRDTool::OO,在CPAN中可以找到;Mongodb的驱动为Mongodb。
这种方案的优点在于,Perl语言的模式匹配功能强大,从RRD中fetch数据后,插入Mongodb中,比较容易理解,实现比较快速。
这种方案的缺点在于,因为要打开rrd文件,fetch这个函数会消耗大量的时间,读取30个rrd文件(约为一台机器的文件数)大约消耗3秒钟,如果你要对读取时间有要求(比如15秒内整个Cluster扫描一遍),这个方法显然不行。
2 工具为C语言;用到了RRDCached这个工具。这个还是挺麻烦的,大约花了两天时间才搞定这个方法。主要是RRDCached这个工具的资料很少。
原理是RRDCached在RRD之前建立一个管道,并且能读取这个管道的数据。这个一台机器只花费10ms时间。
3 第三种方法是我最后实验以后采用的方法,就是直接修改gmetad的代码。在源代码中使用MongoDB的c语言驱动libmongo-client。这里面的核心问题是要搞懂gmetad的软件架构,我会在以后的博客中进行分析讲解。
这三种方法都测试过,之所以采用第三种是因为大家都想在项目中直接使用Ganglia,这种方法结构更加简洁,所以我采用这个方法。其实方法二也是很不错的,我觉得一点儿都不比方法三差。因为方法三是要先读懂别人的代码的。起初以为很简单,直接修改某一个函数就好了(我会专门写一篇博文,讲解这些函数)。结果发现,远比我们想想的要复杂不少。不过,有个一周也是差不多可以搞定的。