laotumingke 2011-05-03
本文在总结使用nutch1.2框架做二次开发实验中总结出开发环境的一些设置,详细步骤如下:
一、从apache网站下载apache-nutch-1.2-bin.zip。如果需要分析hadoop也可以顺便下载hadoop-0.21.0.tar.gz,解压以上两个文件。解压后文件分别为nutch-1.2、hadoop-0.21.0。
二、新建web工程,引入nutch-1.2.jar以及nutch-1.2/lib中(可根据需要筛选)的.jar文件。
三、拷贝plugins到src目录下。
四、nutch-1.2/conf中的文件拷贝到src目录下。
以上步骤完成后就可以在二次开发的代码中整合nutch以及hadoop了。