Apache Mahout Taste-Web 설치하기 Mahout2010.08.13 17:54
이전글에서 했던 환경을 그대로 이용해서, 가상의 데이터를 넣고 추천 테스트를 해보자. 원문 참조는 https://mahout.apache.org/taste.html 에서 볼수 있다.
1. 먼저 사용할 가상의 데이터가 필요한데, 여기 http://www.grouplens.org/node/73 에서 받는다. 원하는 크기를 받아서 하면되는데, 나는 1M Ratings Data Set (.tar.gz) 를 다운 받았다.
2. 압축을 풀면, movies.dat, ratings.dat, users.dat 파일이 있다. 모두 복사해서, /trunk/examples/src/main/java/org/apache/mahout/cf/taste/example/grouplens 에붙여 넣는다. (아마, java 소스가 이미 있을 것이다.)
3. trunk 폴더로 이동후 'mvn install' 명령을 실행한다.
4. 빌드가 성공하면, cd taste-web 이동후, cp ../examples/target/grouplens.jar ./lib 으로 복사한다.
5. 설정파일인, recommender.properties에 방금 생성한 Recommender를 마지막 라인에 추가한다.(만약 지난번에 주석을 풀었다면, 그대로 둔다)
6. 현재 폴더인 /trunk/taste-web 에서 패키징 한다. 'mvn package' 빌드가 성공되면 war 파일이 생성된다.
7. 현재 디랙토리에서, war 파일을 실행한다. 'mvn jetty:run-war' 또는 'mvn tomcat:run-war' 으로 실행한다. 성공적으로 실행되었다면, 브라우저에서 http://localhost:8080/mahout-taste-webapp/RecommenderServlet?userID=1&debug=true 를 접근해 본다.
userID 값을 바꿔가며, 확인할수 있다.
9. Next?
아마도 여기까지 했으면, Mahout 환경을 설정하고, 예제를 돌리는 정도로 끝났다. 앞으로 봐야 할것은 본 예제에서 사용된 Recommender는 무엇이 있으며(User-based Recommender, Item-based Recommender, Slope-One Recommender), 사용된 알고리즘은 어떤 것이고, 또 그 알고리즘이 얼마나 우수한 것인지, 더 낳은것은 없는지, 또는 다른 알고리즘은 없는지, 어떤 환경에 어떤것이 더 적합한지, 관련 알고리즘엔 무엇이 있는지 등이 궁굼해 질것이다. 그리고 왜 이따위들이 필요한지도...
문서에 나온 소스를 보니, 알고리즘 이해 없이도 쓸수 있겠끔 잘 만들어진것 같다. 어떤 예측이나 통계적 결과는 적절한 Data 와 적합도를 위한 기준변수 산출이 중요한데, 생각보다 잘 작성되어 진것 같다. 물론 실무에 적용하려면, 이런 여러가지 환경적인 변수를 여러번 테스트해야만 하겠지만, 본 소스는 참조가 많이 될듯...:)
'Mahout' 카테고리의 다른 글
Mahout - Taste :: Item-based Recommender 테스트하기 (0) | 2010.08.20 |
---|---|
Mahout - Taste :: User-based Recommender 테스트하기 (0) | 2010.08.19 |
Apache Mahout 소스코드 프로젝트 살펴보기 (0) | 2010.08.18 |
Apache Mahout 관련 링크 (0) | 2010.08.18 |
Apache Mahout Taste-Web 설치하기 (0) | 2010.08.13 |
Apache Mahout 설치하기 (0) | 2010.08.13 |