陈先森 2014-03-21
1、下载mahout:http://archive.cloudera.com/cdh4/cdh/4/mahout-0.7-cdh4.6.0.tar.gz
2、解压:mahout-0.7-cdh4.5.0.tar.gz
3、改名:mv mahout-0.7-cdh4.5.0 mahout
4、添加环境变量/tec/profile:
export MAHOUT_HOME=/usr/local/mahout
export CLASSPATH=.:$CLASSPATH:$MAHOUT_HOME/lib
export PATH=$PATH:$MAHOUT_HOME/bin
5、验证:
5.1)、下载测试数据:wget http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
5.2)、创建Hadoop目录:hadoop fs -mkdir testdata
5.3)、上传文件:hadoop fs -put synthetic_control.data testdata
5.4)、运行程序:hadoop jar /usr/local/mahout/mahout-examples-0.5-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
由此可见,安装mahout的服务器必须先安装hadoop。
相关阅读: