»ùÓÚMahoutµÄµçÓ°ÍÆ¼öÏµÍ³-Mahout-AboutÔÆ-ËóÂ×¿Æ¼¼

sunshine_junge ·¢±íÓÚ 2014-6-16 09:31:09

»ùÓÚMahoutµÄµçÓ°ÍÆ¼öÏµÍ³

±¾Ìû×îºóÓÉ sunshine_junge ÓÚ 2014-6-16 10:03 ±à¼

ÎÊÌâµ¼¶Á£º
1.Ê²Ã´ÊÇMahout?
2.ÍÆ¼öÒýÇæ¼ò½é.
3.¹ØÓÚÐÍ¬¹ýÂËËã·¨Taste½éÉÜ¡£
4.ÈçºÎÊµÏÖÒ»¸ö¹ØÓÚµçÓ°ÍÆ¼öÏµÍ³¡£

**************************************************************************************************************************************************

Ò»¡¢Mahout½éÉÜApache Mahout ÊÇ Apache Software Foundation£¨ASF£© ÆìÏÂµÄÒ»¸ö¿ªÔ´ÏîÄ¿£¬Ìá¹©Ò»Ð©¿ÉÀ©Õ¹µÄ»úÆ÷Ñ§Ï°ÁìÓò¾µäËã·¨µÄÊµÏÖ£¬Ö¼ÔÚ°ïÖú¿ª·¢ÈËÔ±¸ü¼Ó·½±ã¿ì½ÝµØ´´½¨ÖÇÄÜÓ¦ÓÃ³ÌÐò¡£¾µäËã·¨°üÀ¨¾ÛÀà¡¢·ÖÀà¡¢ÐÍ¬¹ýÂË¡¢½ø»¯±à³ÌµÈµÈ£¬²¢ÇÒ£¬ÔÚ Mahout ÖÐ»¹¼ÓÈëÁË¶ÔApache HadoopµÄÖ§³Ö£¬Ê¹ÕâÐ©Ëã·¨¿ÉÒÔ¸ü¸ßÐ§µÄÔËÐÐÔÚÔÆ¼ÆËã»·¾³ÖÐ¡£
¶þ¡¢ÍÆ¼öÒýÇæ¼ò½é

ÍÆ¼öÒýÇæÀûÓÃÌØÊâµÄÐÅÏ¢¹ýÂË£¨IF£¬Information Filtering£©¼¼Êõ£¬½«²»Í¬µÄÄÚÈÝ£¨ÀýÈçµçÓ°¡¢ÒôÀÖ¡¢Êé¼®¡¢ÐÂÎÅ¡¢Í¼Æ¬¡¢ÍøÒ³µÈ£©ÍÆ¼ö¸ø¿ÉÄÜ¸ÐÐËÈ¤µÄÓÃ»§¡£Í¨³£Çé¿öÏÂ£¬ÍÆ¼öÒýÇæµÄÊµÏÖÊÇÍ¨¹ý½«ÓÃ»§µÄ¸öÈËÏ²ºÃÓëÌØ¶¨µÄ²Î¿¼ÌØÕ÷½øÐÐ±È½Ï£¬²¢ÊÔÍ¼Ô¤²âÓÃ»§¶ÔÒ»Ð©Î´ÆÀ·ÖÏîÄ¿µÄÏ²ºÃ³Ì¶È¡£²Î¿¼ÌØÕ÷µÄÑ¡È¡¿ÉÄÜÊÇ´ÓÏîÄ¿±¾ÉíµÄÐÅÏ¢ÖÐÌáÈ¡µÄ£¬»òÊÇ»ùÓÚÓÃ»§ËùÔÚµÄÉç»á»òÉçÍÅ»·¾³¡£
¸ù¾ÝÈçºÎ³éÈ¡²Î¿¼ÌØÕ÷£¬ÎÒÃÇ¿ÉÒÔ½«ÍÆ¼öÒýÇæ·ÖÎªÒÔÏÂËÄ´óÀà£º

• »ùÓÚÄÚÈÝµÄÍÆ¼öÒýÇæ£ºËü½«¼ÆËãµÃµ½²¢ÍÆ¼ö¸øÓÃ»§Ò»Ð©Óë¸ÃÓÃ»§ÒÑÑ¡Ôñ¹ýµÄÏîÄ¿ÏàËÆµÄÄÚÈÝ¡£ÀýÈç£¬µ±ÄãÔÚÍøÉÏ¹ºÊéÊ±£¬Äã×ÜÊÇ¹ºÂòÓëÀúÊ·Ïà¹ØµÄÊé¼®£¬ÄÇÃ´»ùÓÚÄÚÈÝµÄÍÆ¼öÒýÇæ¾Í»á¸øÄãÍÆ¼öÒ»Ð©ÈÈÃÅµÄÀúÊ··½ÃæµÄÊé¼®¡£

• »ùÓÚÐÍ¬¹ýÂËµÄÍÆ¼öÒýÇæ£ºËü½«ÍÆ¼ö¸øÓÃ»§Ò»Ð©Óë¸ÃÓÃ»§Æ·Î¶ÏàËÆµÄÆäËûÓÃ»§Ï²»¶µÄÄÚÈÝ¡£ÀýÈç£¬µ±ÄãÔÚÍøÉÏÂòÒÂ·þÊ±£¬»ùÓÚÐÍ¬¹ýÂËµÄÍÆ¼öÒýÇæ»á¸ù¾ÝÄãµÄÀúÊ·¹ºÂò¼ÇÂ¼»òÊÇä¯ÀÀ¼ÇÂ¼£¬·ÖÎö³öÄãµÄ´©ÒÂÆ·Î»£¬²¢ÕÒµ½ÓëÄãÆ·Î¶ÏàËÆµÄÒ»Ð©ÓÃ»§£¬½«ËûÃÇä¯ÀÀºÍ¹ºÂòµÄÒÂ·þÍÆ¼ö¸øÄã¡£

• »ùÓÚ¹ØÁª¹æÔòµÄÍÆ¼öÒýÇæ£ºËü½«ÍÆ¼ö¸øÓÃ»§Ò»Ð©²ÉÓÃ¹ØÁª¹æÔò·¢ÏÖËã·¨¼ÆËã³öµÄÄÚÈÝ¡£¹ØÁª¹æÔòµÄ·¢ÏÖËã·¨ÓÐºÜ¶à£¬Èç Apriori¡¢AprioriTid¡¢DHP¡¢FP-tree µÈ¡£

• »ìºÏÍÆ¼öÒýÇæ£º½áºÏÒÔÉÏ¸÷ÖÖ£¬µÃµ½Ò»¸ö¸ü¼ÓÈ«ÃæµÄÍÆ¼öÐ§¹û¡£

Èý¡¢Taste¼ò½é

   Taste ÊÇ Apache Mahout Ìá¹©µÄÒ»¸öÐÍ¬¹ýÂËËã·¨µÄ¸ßÐ§ÊµÏÖ£¬ËüÊÇÒ»¸ö»ùÓÚ Java ÊµÏÖµÄ¿ÉÀ©Õ¹µÄ£¬¸ßÐ§µÄÍÆ¼öÒýÇæ¡£Taste ¼ÈÊµÏÖÁË×î»ù±¾µÄ»ùÓÚÓÃ»§µÄºÍ»ùÓÚÄÚÈÝµÄÍÆ¼öËã·¨£¬Í¬Ê±Ò²Ìá¹©ÁËÀ©Õ¹½Ó¿Ú£¬Ê¹ÓÃ»§¿ÉÒÔ·½±ãµÄ¶¨ÒåºÍÊµÏÖ×Ô¼ºµÄÍÆ¼öËã·¨¡£Í¬Ê±£¬Taste ²»½ö½öÖ»ÊÊÓÃÓÚ Java Ó¦ÓÃ³ÌÐò£¬Ëü¿ÉÒÔ×÷ÎªÄÚ²¿·þÎñÆ÷µÄÒ»¸ö×é¼þÒÔ HTTP ºÍ Web Service µÄÐÎÊ½ÏòÍâ½çÌá¹©ÍÆ¼öµÄÂß¼¡£

3.1 Taste¹¤×÷ÔÀí
Taste ÓÉÒÔÏÂÎå¸öÖ÷ÒªµÄ×é¼þ×é³É£º

[*]DataModel£ºDataModel ÊÇÓÃ»§Ï²ºÃÐÅÏ¢µÄ³éÏó½Ó¿Ú£¬ËüµÄ¾ßÌåÊµÏÖÖ§³Ö´ÓÈÎÒâÀàÐÍµÄÊý¾ÝÔ´³éÈ¡ÓÃ»§Ï²ºÃÐÅÏ¢¡£Taste Ä¬ÈÏÌá¹© JDBCDataModel ºÍ FileDataModel£¬·Ö±ðÖ§³Ö´ÓÊý¾Ý¿âºÍÎÄ¼þÖÐ¶ÁÈ¡ÓÃ»§µÄÏ²ºÃÐÅÏ¢¡£
[*]UserSimilarity ºÍ ItemSimilarity£ºUserSimilarity ÓÃÓÚ¶¨ÒåÁ½¸öÓÃ»§¼äµÄÏàËÆ¶È£¬ËüÊÇ»ùÓÚÐÍ¬¹ýÂËµÄÍÆ¼öÒýÇæµÄºËÐÄ²¿·Ö£¬¿ÉÒÔÓÃÀ´¼ÆËãÓÃ»§µÄ¡°ÁÚ¾Ó¡±£¬ÕâÀïÎÒÃÇ½«Óëµ±Ç°ÓÃ»§¿ÚÎ¶ÏàËÆµÄÓÃ»§³ÆÎªËûµÄÁÚ¾Ó¡£ItemSimilarity ÀàËÆµÄ£¬¼ÆËãÄÚÈÝÖ®¼äµÄÏàËÆ¶È¡£
[*]UserNeighborhood£ºÓÃÓÚ»ùÓÚÓÃ»§ÏàËÆ¶ÈµÄÍÆ¼ö·½·¨ÖÐ£¬ÍÆ¼öµÄÄÚÈÝÊÇ»ùÓÚÕÒµ½Óëµ±Ç°ÓÃ»§Ï²ºÃÏàËÆµÄ¡°ÁÚ¾ÓÓÃ»§¡±µÄ·½Ê½²úÉúµÄ¡£UserNeighborhood ¶¨ÒåÁËÈ·¶¨ÁÚ¾ÓÓÃ»§µÄ·½·¨£¬¾ßÌåÊµÏÖÒ»°ãÊÇ»ùÓÚ UserSimilarity ¼ÆËãµÃµ½µÄ¡£
[*]Recommender£ºRecommender ÊÇÍÆ¼öÒýÇæµÄ³éÏó½Ó¿Ú£¬Taste ÖÐµÄºËÐÄ×é¼þ¡£³ÌÐòÖÐ£¬ÎªËüÌá¹©Ò»¸ö DataModel£¬Ëü¿ÉÒÔ¼ÆËã³ö¶Ô²»Í¬ÓÃ»§µÄÍÆ¼öÄÚÈÝ¡£Êµ¼ÊÓ¦ÓÃÖÐ£¬Ö÷ÒªÊ¹ÓÃËüµÄÊµÏÖÀà GenericUserBasedRecommender »òÕß GenericItemBasedRecommender£¬·Ö±ðÊµÏÖ»ùÓÚÓÃ»§ÏàËÆ¶ÈµÄÍÆ¼öÒýÇæ»òÕß»ùÓÚÄÚÈÝµÄÍÆ¼öÒýÇæ¡£
http://img.my.csdn.net/uploads/201302/20/1361373945_8292.png
                                                            Í¼1 TasteµÄÖ÷Òª×é¼þÍ¼
ËÄ¡¢ »ùÓÚTaste¹¹½¨µçÓ°ÍÆ¼öÒýÇæ

4.1Êý¾ÝÏÂÔØ
±¾¹¤³ÌËùÓÃµ½µÄÊý¾ÝÀ´Ô´ÓÚ´Ë´¦£ºhttp://www.grouplens.org/node/12£¬ÏÂÔØÊý¾Ý¡°MovieLens 1M - Consists of 1 million ratings from 6000 users on 4000 movies.¡±

Õâ¸öÊý¾ÝÎÄ¼þ¼ÐÏÂÓÐÈý¸öÎÄ¼þ£ºmovies.dat£¬ratings.datºÍusers.dat£¬Êý¾ÝÐÎÊ½ÈçÏÂÈý¸öÍ¼ËùÊ¾£º
http://img.my.csdn.net/uploads/201302/20/1361374003_1574.png

http://img.my.csdn.net/uploads/201302/20/1361374013_8453.png

http://img.my.csdn.net/uploads/201302/20/1361374020_1676.png

movies.datµÄÎÄ¼þÃèÊöÊÇ µçÓ°±àºÅ::µçÓ°Ãû::µçÓ°Àà±ð
ratings.datµÄÎÄ¼þÃèÊöÊÇ ÓÃ»§±àºÅ::µçÓ°±àºÅ::µçÓ°ÆÀ·Ö::Ê±¼ä´Á
users.datµÄÎÄ¼þÃèÊöÊÇ ÓÃ»§±àºÅ::ÐÔ±ð::ÄêÁä::Ö°Òµ::Zip-code
ÕâÐ©ÎÄ¼þ°üº¬À´×Ô6040¸öMovieLensÓÃ»§ÔÚ2000Äê¶ÔÔ¼3900²¿µçÓ°µÄ1000209¸öÄäÃûÆÀ·ÖÐÅÏ¢¡£
4.2 ¹¹ÔìÊý¾Ý¿â
¹¹½¨ÍÆ¼öÒýÇæ£¬¿ÉÒÔÖ±½ÓÊ¹ÓÃmovie.datÎÄ¼þ×÷ÎªÊý¾ÝÔ´£¬Ò²¿ÉÒÔÊ¹ÓÃÊý¾Ý¿âÖÐµÄÊý¾Ý×÷ÎªÊý¾ÝÔ´£¬±¾ÊµÑéÖÐ£¬ÕâÁ½ÖÖ·½Ê½¶¼ÊµÏÖÁË£¬ËùÒÔÏÂÃæ½éÉÜÀûÓÃdatÎÄ¼þ½¨Á¢Êý¾Ý¿â¡£

¹¹½¨Êý¾Ý¿âµÄSQLÓï¾äÈçÏÂ£º

CREATE DATABASE movie;
USE movie;
CREATE TABLE movies (// ±£´æµçÓ°Ïà¹ØµÄÐÅÏ¢¡£
id INTEGER NOT NULL AUTO_INCREMENT,
name varchar(100) NOT NULL,
published_year varchar(4) default NULL,
type varchar(100) default NULL,
PRIMARY KEY (id)
);
CREATE TABLE movie_preferences (// ±£´æÓÃ»§¶ÔµçÓ°µÄÆÀ·Ö£¬¼´Ï²ºÃ³Ì¶È
userID INTEGER NOT NULL,
movieID INTEGER NOT NULL,
preference INTEGER NOT NULL DEFAULT 0,
timestamp INTEGER not null default 0,
FOREIGN KEY (movieID) REFERENCES movies(id) ON DELETE CASCADE
);

•Movie£º±íÊ¾µçÓ°£¬°üº¬µçÓ°µÄ»ù±¾ÐÅÏ¢£º±àºÅ¡¢Ãû³Æ¡¢·¢²¼Ê±¼ä¡¢ÀàÐÍµÈµÈ¡£
•Movie Reference£º±íÊ¾Ä³¸öÓÃ»§¶ÔÄ³¸öµçÓ°µÄÏ²ºÃ³Ì¶È£¬°üº¬ÓÃ»§±àºÅ¡¢µçÓ°±àºÅ¡¢ÓÃ»§µÄÆÀ·ÖÒÔ¼°ÆÀ·ÖµÄÊ±¼ä¡£

ÖÁÓÚÈçºÎ½«datÎÄ¼þÖÐµÄÄÚÈÝµ¼Èëµ½MySQLÊý¾Ý¿âÖÐ£¬·Ö±ðÓÉ±¾¹¤³ÌÄ¿Â¼ÎÄ¼þÏÂµÄImportMovies.javaºÍImportRatings.javaÎÄ¼þÊµÏÖ¡£
MySQLÊý¾Ý¿âÖÐµÄÊý¾ÝÈçÏÂÍ¼£º
file:///C:\Users\sunshine_junge\AppData\Roaming\Tencent\Users\373161871\QQ\WinTemp\RichOle\M96@6}AL@P6EIP}BXZDEJA1.jpg

Í¼¶þ movie_preferences±í¼ÇÂ¼

http://img.my.csdn.net/uploads/201302/20/1361374185_3774.png

Í¼Èý movies±í¼ÇÂ¼

4.3 ÍÆ¼öÒýÇæÊµÏÖ
ÔÚ±¾¹¤³ÌÖÐ£¬ÎÒÊµÏÖÁËÈýÖÖ·½Ê½µÄÍÆ¼öÒýÇæ£º»ùÓÚÓÃ»§ÏàËÆ¶ÈµÄÍÆ¼öÒýÇæ£¬»ùÓÚÄÚÈÝÏàËÆ¶ÈµÄÍÆ¼öÒýÇæ£¬ÒÔ¼°»ùÓÚSlope One µÄÍÆ¼öÒýÇæ¡£ÔÚÕâÐ©ÍÆ¼öÒýÇæÖÐ£¬ÎÒ·Ö±ðÊ¹ÓÃÁËÈýÖÖDataModel£¬¼´Database-based DataModel£¬File-based DataModelºÍIn-memory DataModel¡£

a) »ùÓÚÓÃ»§ÏàËÆ¶ÈµÄÍÆ¼öÒýÇæ

public class MyUserBasedRecommender {
public List<RecommendedItem> userBasedRecommender(long userID,int size) {
   // step:1 ¹¹½¨Ä£ÐÍ 2 ¼ÆËãÏàËÆ¶È 3 ²éÕÒk½ôÁÚ 4 ¹¹ÔìÍÆ¼öÒýÇæ
   List<RecommendedItem> recommendations = null;
   try {
         DataModel model = MyDataModel.myDataModel();//¹¹ÔìÊý¾ÝÄ£ÐÍ£¬Database-based
         UserSimilarity similarity = new PearsonCorrelationSimilarity(model);//ÓÃPearsonCorrelation Ëã·¨¼ÆËãÓÃ»§ÏàËÆ¶È
         UserNeighborhood neighborhood = new NearestNUserNeighborhood(3, similarity, model);//¼ÆËãÓÃ»§µÄ¡°ÁÚ¾Ó¡±£¬ÕâÀï½«Óë¸ÃÓÃ»§×î½ü¾àÀëÎª 3 µÄÓÃ»§ÉèÖÃÎª¸ÃÓÃ»§µÄ¡°ÁÚ¾Ó¡±¡£
         Recommender recommender = new CachingRecommender(new GenericUserBasedRecommender(model, neighborhood, similarity));//¹¹ÔìÍÆ¼öÒýÇæ£¬²ÉÓÃ CachingRecommender Îª RecommendationItem ½øÐÐ»º´æ
         recommendations = recommender.recommend(userID, size);//µÃµ½ÍÆ¼öµÄ½á¹û£¬sizeÊÇÍÆ¼ö½Ó¹ýµÄÊýÄ¿
   } catch (Exception e) {
         // TODO: handle exception
         e.printStackTrace();
   }
   return recommendations;
}

public static void main(String args[]) throws Exception {

}
}

ÔÚÕâ¸öÍÆ¼öÒýÇæÖÐ£¬ÓÉÓÚÊ¹ÓÃµÄÊÇMySQLJDBCDataModelºÍJNDI£¬ËùÒÔÐèÒªÔÚtomcatµÄserver.xmlÎÄ¼þÖÐÌí¼ÓÈçÏÂÐÅÏ¢£º<Context path="/MyRecommender" docBase="/home/huhui/develop/apache-tomcat-6.0.35/webapps/MyRecommender" debug="0" reloadable="true">
            <Resource name="jdbc/movie" auth="Container" type="javax.sql.DataSource"
                     username="root"
                     password="***"
                     driverClassName="com.mysql.jdbc.Driver"
                     url="jdbc:mysql://localhost:3306/movie"
                     maxActive="15"
                     maxIdle="7"
                     defaultTransactionIsolation="READ_COMMITTED"
                     validationQuery="Select 1" />
</Context>

Mahout ÖÐÌá¹©ÁË»ù±¾µÄÏàËÆ¶ÈµÄ¼ÆËã£¬ËüÃÇ¶¼ÊµÏÖÁË UserSimilarity Õâ¸ö½Ó¿Ú£¬ÒÔÊµÏÖÓÃ»§ÏàËÆ¶ÈµÄ¼ÆËã£¬°üÀ¨ÏÂÃæÕâÐ©³£ÓÃµÄ£º
•PearsonCorrelationSimilarity£º»ùÓÚÆ¤¶ûÑ·Ïà¹ØÏµÊý¼ÆËãÏàËÆ¶È £¨Ëü±íÊ¾Á½¸öÊýÁÐ¶ÔÓ¦Êý×ÖÒ»ÆðÔö´ó»òÒ»Æð¼õÐ¡µÄ¿ÉÄÜÐÔ¡£ÊÇÁ½¸öÐòÁÐÐ·½²îÓë¶þÕß·½²î³Ë»ýµÄ±ÈÖµ£©
•EuclideanDistanceSimilarity£º»ùÓÚÅ·¼¸ÀïµÂ¾àÀë¼ÆËãÏàËÆ¶È
•TanimotoCoefficientSimilarity£º»ùÓÚ Tanimoto ÏµÊý¼ÆËãÏàËÆ¶È

¸ù¾Ý½¨Á¢µÄÏàËÆ¶È¼ÆËã·½·¨£¬ÕÒµ½ÁÚ¾ÓÓÃ»§¡£ÕâÀïÕÒÁÚ¾ÓÓÃ»§µÄ·½·¨¸ù¾ÝÇ°ÃæÎÒÃÇ½éÉÜµÄ£¬Ò²°üÀ¨Á½ÖÖ£º¡°¹Ì¶¨ÊýÁ¿µÄÁÚ¾Ó¡±ºÍ¡°ÏàËÆ¶ÈÃÅ¼÷ÁÚ¾Ó¡±¼ÆËã·½·¨£¬Mahout Ìá¹©¶ÔÓ¦µÄÊµÏÖ£º
•NearestNUserNeighborhood£º¶ÔÃ¿¸öÓÃ»§È¡¹Ì¶¨ÊýÁ¿ N µÄ×î½üÁÚ¾Ó
•ThresholdUserNeighborhood£º¶ÔÃ¿¸öÓÃ»§»ùÓÚÒ»¶¨µÄÏÞÖÆ£¬È¡ÂäÔÚÏàËÆ¶ÈÃÅÏÞÄÚµÄËùÓÐÓÃ»§ÎªÁÚ¾Ó¡£

»ùÓÚ DataModel£¬UserNeighborhood ºÍ UserSimilarity ¹¹½¨ GenericUserBasedRecommender£¬´Ó¶øÊµÏÖ»ùÓÚÓÃ»§µÄÍÆ¼ö²ßÂÔ¡£

b) »ùÓÚÄÚÈÝÏàËÆ¶ÈµÄÍÆ¼öÒýÇæ
Àí½âÁË»ùÓÚÓÃ»§ÏàËÆ¶ÁµÄÍÆ¼öÒýÇæ£¬»ùÓÚÄÚÈÝÏàËÆ¶ÁµÄÍÆ¼öÒýÇæÀàËÆ£¬ÉõÖÁ¸ü¼Ó¼òµ¥¡£public class MyItemBasedRecommender {
public List<RecommendedItem> myItemBasedRecommender(long userID,int size){
   List<RecommendedItem> recommendations = null;
   try {
         DataModel model = new FileDataModel(new File("/home/huhui/movie_preferences.txt"));//¹¹ÔìÊý¾ÝÄ£ÐÍ£¬File-based
         ItemSimilarity similarity = new PearsonCorrelationSimilarity(model);//¼ÆËãÄÚÈÝÏàËÆ¶È
         Recommender recommender = new GenericItemBasedRecommender(model, similarity);//¹¹ÔìÍÆ¼öÒýÇæ
         recommendations = recommender.recommend(userID, size);//µÃµ½ÍÆ¼ö½Ó¹ý
   } catch (Exception e) {
         // TODO: handle exception
         e.printStackTrace();
   }
   return recommendations;
}
}

ÔÚÕâ¸öÍÆ¼öÒýÇæÖÐ£¬Ê¹ÓÃµÄÊÇFile-based Datamodel£¬Êý¾ÝÎÄ¼þ¸ñÊ½ÈçÏÂÍ¼ËùÊ¾£º
http://img.my.csdn.net/uploads/201302/20/1361374334_2942.png
Ã¿Ò»ÐÐ¶¼ÊÇÒ»¸ö¼òµ¥µÄÈýÔª×é< ÓÃ»§ ID, ÎïÆ· ID, ÓÃ»§Æ«ºÃ >¡£
c) »ùÓÚSlop OneµÄÍÆ¼öÒýÇæ
»ùÓÚÓÃ»§ºÍ»ùÓÚÄÚÈÝÊÇ×î³£ÓÃ×îÈÝÒ×Àí½âµÄÁ½ÖÖÍÆ¼ö²ßÂÔ£¬µ«ÔÚ´óÊý¾ÝÁ¿Ê±£¬ËüÃÇµÄ¼ÆËãÁ¿»áºÜ´ó£¬´Ó¶øµ¼ÖÂÍÆ¼öÐ§ÂÊ½Ï²î¡£Òò´Ë Mahout »¹Ìá¹©ÁËÒ»ÖÖ¸ü¼ÓÇáÁ¿¼¶µÄ CF ÍÆ¼ö²ßÂÔ£ºSlope One¡£
Slope One ÊÇÓÐ Daniel Lemire ºÍ Anna Maclachlan ÔÚ 2005 ÄêÌá³öµÄÒ»ÖÖ¶Ô»ùÓÚÆÀ·ÖµÄÐÍ¬¹ýÂËÍÆ¼öÒýÇæµÄ¸Ä½ø·½·¨£¬ÏÂÃæ¼òµ¥½éÉÜÒ»ÏÂËüµÄ»ù±¾Ë¼Ïë¡£
¼ÙÉèÏµÍ³¶ÔÓÚÎïÆ· A£¬ÎïÆ· B ºÍÎïÆ· C µÄÆ½¾ùÆÀ·Ö·Ö±ðÊÇ 3£¬4 ºÍ 4¡£»ùÓÚ Slope One µÄ·½·¨»áµÃµ½ÒÔÏÂ¹æÂÉ£º
•ÓÃ»§¶ÔÎïÆ· B µÄÆÀ·Ö = ÓÃ»§¶ÔÎïÆ· A µÄÆÀ·Ö + 1
•ÓÃ»§¶ÔÎïÆ· B µÄÆÀ·Ö = ÓÃ»§¶ÔÎïÆ· C µÄÆÀ·Ö
»ùÓÚÒÔÉÏµÄ¹æÂÉ£¬ÎÒÃÇ¿ÉÒÔ¶ÔÓÃ»§ A ºÍÓÃ»§ B µÄ´ò·Ö½øÐÐÔ¤²â£º
•¶ÔÓÃ»§ A£¬Ëû¸øÎïÆ· A ´ò·Ö 4£¬ÄÇÃ´ÎÒÃÇ¿ÉÒÔÍÆ²âËû¶ÔÎïÆ· B µÄÆÀ·ÖÊÇ 5£¬¶ÔÎïÆ· C µÄ´ò·ÖÒ²ÊÇ 5¡£
•¶ÔÓÃ»§ B£¬Ëû¸øÎïÆ· A ´ò·Ö 2£¬¸øÎïÆ· C ´ò·Ö 4£¬¸ù¾ÝµÚÒ»Ìõ¹æÂÉ£¬ÎÒÃÇ¿ÉÒÔÍÆ¶ÏËû¶ÔÎïÆ· B µÄÆÀ·ÖÊÇ 3£»¶ø¸ù¾ÝµÚ¶þÌõ¹æÂÉ£¬ÍÆ¶Ï³öÆÀ·ÖÊÇ 4¡£µ±³öÏÖ³åÍ»Ê±£¬ÎÒÃÇ¿ÉÒÔ¶Ô¸÷ÖÖ¹æÔòµÃµ½µÄÍÆ¶Ï½øÐÐ¾ÍÆ½¾ù£¬ËùÒÔ¸ø³öµÄÍÆ¶ÏÊÇ 3.5¡£
Õâ¾ÍÊÇ Slope One ÍÆ¼öµÄ»ù±¾ÔÀí£¬Ëü½«ÓÃ»§µÄÆÀ·ÖÖ®¼äµÄ¹ØÏµ¿´×÷¼òµ¥µÄÏßÐÔ¹ØÏµ£º
Y = mX + b;
µ± m = 1 Ê±¾ÍÊÇ Slope One£¬Ò²¾ÍÊÇÎÒÃÇ¸Õ¸ÕÕ¹Ê¾µÄÀý×Ó¡£
http://img.my.csdn.net/uploads/201302/20/1361374609_7700.gif
public class MySlopeOneRecommender {
public List<RecommendedItem> mySlopeOneRecommender(long userID,int size){
   List<RecommendedItem> recommendations = null;
   try {
         DataModel model = new FileDataModel(new File("/home/huhui/movie_preferences.txt"));//¹¹ÔìÊý¾ÝÄ£ÐÍ
         Recommender recommender = new CachingRecommender(new SlopeOneRecommender(model));//¹¹ÔìÍÆ¼öÒýÇæ
         recommendations = recommender.recommend(userID, size);//µÃµ½ÍÆ¼ö½á¹û
   } catch (Exception e) {
         // TODO: handle exception
         e.printStackTrace();
   }
   return recommendations;
}
}

d) ¶ÔÊý¾ÝÄ£ÐÍµÄÓÅ»¯¡ª¡ªIn-memory DataModel
ÉÏÃæËùÐðÊöµÄÈýÖÖÍÆ¼öÒýÇæ£¬ÊäÈëµÄ¶¼ÊÇÓÃ»§µÄÀúÊ·Æ«ºÃÐÅÏ¢£¬ÔÚ Mahout ÀïËü±»½¨Ä£Îª Preference£¨½Ó¿Ú£©£¬Ò»¸ö Preference ¾ÍÊÇÒ»¸ö¼òµ¥µÄÈýÔª×é < ÓÃ»§ ID, ÎïÆ· ID, ÓÃ»§Æ«ºÃ >£¬ËüµÄÊµÏÖÀàÊÇ GenericPreference£¬¿ÉÒÔÍ¨¹ýÒÔÏÂÓï¾ä´´½¨Ò»¸ö GenericPreference£º
GenericPreference preference = new GenericPreference(1, 101, 4.0f);ÕâÆäÖÐ£¬ 1ÊÇÓÃ»§ ID£¬long ÐÍ£»101ÊÇÎïÆ· ID£¬long ÐÍ£»4.0f ÊÇÓÃ»§Æ«ºÃ£¬float ÐÍ¡£´ÓÕâ¸öÀý×Ó¿ÉÒÔ¿´³ö£¬Ò»¸ö GenericPreference µÄÊý¾Ý¾ÍÕ¼ÓÃ8+8+4=20 ×Ö½Ú£¬ËùÒÔÈç¹ûÖ»¼òµ¥ÊµÓÃÊý×é Array ¼ÓÔØÓÃ»§Æ«ºÃÊý¾Ý£¬±ØÈ»Õ¼ÓÃ´óÁ¿µÄÄÚ´æ£¬Mahout ÔÚÕâ·½Ãæ×öÁËÒ»Ð©ÓÅ»¯£¬Ëü´´½¨ÁË PreferenceArray£¨½Ó¿Ú£©±£´æÒ»×éÓÃ»§Æ«ºÃÊý¾Ý£¬ÎªÁËÓÅ»¯ÐÔÄÜ£¬Mahout ¸ø³öÁËÁ½¸öÊµÏÖÀà£¬GenericUserPreferenceArray ºÍ GenericItemPreferenceArray£¬·Ö±ð°´ÕÕÓÃ»§ºÍÎïÆ·±¾Éí¶ÔÓÃ»§Æ«ºÃ½øÐÐ×é×°£¬ÕâÑù¾Í¿ÉÒÔÑ¹ËõÓÃ»§ ID »òÕßÎïÆ· ID µÄ¿Õ¼ä¡£
         FastByIDMap<PreferenceArray> preferences = new FastByIDMap<PreferenceArray>();

PreferenceArray prefsForUser1 = new GenericUserPreferenceArray(3);// ×¢ÒâÕâÀïµÄÊý×Ö
// ÕâÀïÊÇÓÃÀ´´æ´¢Ò»¸öÓÃ»§µÄÔªÊý¾Ý£¬ÕâÐ©ÔªÊý¾ÝÍ¨³£À´×ÔÈÕÖ¾ÎÄ¼þ£¬±ÈÈçä¯ÀÀÀúÊ·£¬µÈµÈ£¬²»Í¬µÄÒµÎñ³¡ºÏ£¬ËüµÄÒµÎñÓïÒåÊÇ²»Ò»Ñù

prefsForUser1.setUserID(0, 1);

prefsForUser1.setItemID(0, 101);
prefsForUser1.setValue(0, 5.0f);//<1, 101, 5.0f>       < ÓÃ»§ ID, ÎïÆ· ID, ÓÃ»§Æ«ºÃ >

prefsForUser1.setItemID(1, 102);
prefsForUser1.setValue(1, 3.0f);//<1, 102, 3.0f>

prefsForUser1.setItemID(2, 103);
prefsForUser1.setValue(2, 2.5f);//<1, 103, 2.5f>

preferences.put(1l, prefsForUser1);// ÔÚÕâÀïÌí¼ÓÊý¾Ý£¬userID×÷Îªkey
........

ÓÉÓÚ´úÂë±È½Ï³¤£¬´Ë´¦¾Í²»È«²¿Ìù³öÀ´£¬Ïê¼û¹¤³ÌÎÄ¼þÖÐµÄRecommenderIntro.javaÎÄ¼þ¡£
Îå¡¢³ÌÐòÑÝÊ¾
Õâ¸öÏîÄ¿¹¤³ÌÊÇB/SÄ£Ê½µÄ£¬»ùÓÚMVC¿ª·¢Ä£Ê½¿ª·¢µÄ£¬¿ª·¢»·¾³ÊÇUbuntu£¬IDEÊÇMyEclipse8.0£¬¹¤³ÌÎÄ¼þÄ¿Â¼ÈçÏÂÍ¼£º
http://img.my.csdn.net/uploads/201302/20/1361374748_7654.png
                     Í¼ËÄ ¹¤³ÌÎÄ¼þÄ¿Â¼

http://img.my.csdn.net/uploads/201302/20/1361374916_6566.jpg
                              Ö÷ÒªÀàÎÄ¼þÖ®¼äµÄ¹ØÏµ

ÏîÄ¿Ê×Ò³Ìá¹©Èý¸öÊäÈë£ºÓÃ»§id£¬ÍÆ¼öµçÓ°µÄÊýÄ¿£¨Ä¬ÈÏÎª25£©£¬ÍÆ¼ö²ßÂÔ¡£http://img.my.csdn.net/uploads/201302/20/1361374959_5400.png
                                                         Í¼Îå Ê×Ò³

http://img.my.csdn.net/uploads/201302/21/1361376254_9017.png

Í¼Áù ±àºÅÎª10µÄÓÃ»§£¬»ùÓÚÓÃ»§ÏàËÆ¶ÈµÄÍÆ¼ö½á¹û

http://img.my.csdn.net/uploads/201302/21/1361376265_8127.png

Í¼Æß ±àºÅÎª10µÄÓÃ»§£¬»ùÓÚÄÚÈÝÏàËÆ¶ÈµÄÍÆ¼ö½á¹û

http://img.my.csdn.net/uploads/201302/21/1361376277_9264.png
                                                                                                Í¼°Ë ±àºÅÎª10µÄÓÃ»§£¬»ùÓÚSlopOneµÄÍÆ¼ö½á¹û

ÒýÓÃ£ºhttp://blog.csdn.net/huhui_cs/article/details/8596388

sunny62520 ·¢±íÓÚ 2014-6-23 23:34:11

mark,¸ÐÐ»·ÖÏí

InSight ·¢±íÓÚ 2014-10-8 12:50:18

ºÃÇ¿´ó¡£°¡°¡°¡

anyhuayong ·¢±íÓÚ 2014-10-23 09:37:43

¸ÐÐ»·ÖÏí£¬Â¥Ö÷ÐÁ¿à

ssswift ·¢±íÓÚ 2016-6-13 18:20:51

¸ÐÐ»·ÖÏí

ansha886 ·¢±íÓÚ 2016-6-23 09:59:00

¸ÐÐ»·ÖÏí£¬Â¥Ö÷ÐÁ¿à

xukong ·¢±íÓÚ 2016-10-17 18:05:15

ÄãÕâÊÇµ¥»ú°æµÄ°É

ÀÏ¹Å¶ ·¢±íÓÚ 2016-11-23 10:02:52

ÔõÃ´ÔÚhadoopÉÏÊµÏÖ°¡

longlin ·¢±íÓÚ 2017-4-13 23:50:59

Â¥Ö÷ºÃÈË¡£Ð»Ð»¡£

Ò³: [1]

AboutÔÆ-ËóÂ×¿Æ¼¼'s Archiver

»ùÓÚMahoutµÄµçÓ°ÍÆ¼öÏµÍ³