分享

Mahout 源码位置

mahout中的机械学习的算法不太熟悉,包括kmeans,bayes,cf,connect 但是在mahout中找了半天也不知道哪个是对应算法的源码。。。
因为第一次看这些机械学习的源码,。。。。具体位置真心不知道,希望熟悉机械学习的大神们抽空帮个忙,多谢了大家
Kmeans的源码位置是:/mahout-distribution-0.10.0/examples/src/main/java/org/apache/mahout/clustering/syntheticcontrol/kmeans文件下的Job.jar
但是其他的都没找到。。。。

已有(2)人评论

跳转到指定楼层
arsenduan 发表于 2015-9-1 18:25:25
mahout项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,mahout的组成:
1、mahout-core:核心程序模块,位于/core目录下;
2、mahout-math:在核心程序中使用的一些数据通用计算模块,位于/math目录下;
3、mahout-utils:在核心程序中使用的一些通用的工具性模块,位于/utils目录下;
上述三个部分是程序的主题,存储所有mahout项目的源码。
另外,mahout提供了样例程序,分别在taste-web和examples目录下:
4、taste-web:利用mahout推荐算法而建立的基于WEB的个性化推荐系统demo;
5、examples:对mahout中各种机器学习算法的应用程序;
6、bin:bin目录下只有一个名为mahout的文件,是一个shell脚本文件,用于在hadoop平台的命令行下调用mahout中的程序;
在buildtools、eclipse和distribution目录下,有mahout相关的配置文件
7、buildtools目录下是用于核心程序构建的配置文件,以mahout-buildtools的模块名称在mahout的pom.xml文件中进行说明;
8、eclipse下的xml文件是对利用eclipse开发mahout的配置说明;
9、distribution目录下有两个配置文件:bin.xml和src.xml,进行mahou安装时的一些配置信息。
(在开发的时候一般很少对这个目录下的文件进行修改,所以不用太关注,知道大体什么意思就ok)

另 外,在mahout的下载地址下可以看到有个文件夹与mahout处于同一级别,它是mahout项目的分支项目—mahout- collections,用于实现了核心程序中使用的集合类操作,该模块独立于mahout进行开发,是对标准jdk中关于集合类的修改,使其可以适应数 据密集型项目的开发。

回复

使用道具 举报

arsenduan 发表于 2015-9-1 18:28:34
这里是文档,希望对你有用
mahout推荐系统算法分析.zip (312.88 KB, 下载次数: 24)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条