Java 项目生成静态页面的代码

淡泊明智宁静志远 2009-07-01

不外乎有以下因素:
1、从页面加载时间来看:静态页面不需要与数据库建立连接,尤其是访问数据量较大的页面,这种页面大多要查很多结果集,因此建立连接次数就增多了,时间不可观,而静态页面则省去了这些时间。
2、从便于搜索引擎抓取的角度来讲:搜索引擎更喜欢静态的网页,静态网页与动态网页相比,搜索引擎更喜欢静的,更便于抓取,搜索引擎SEO排名更容易提高,一些大门户站页面大多都采用静态或伪静态网页来显示,更便于搜索引擎抓取与排名。
3、从安全性来看:静态网页不宜遭到黑客攻击,因为黑客不知道你的网站的后台、网站采用程序、数据库的地址。
4、从稳定性来看:哪天数据库服务器挂了,动态网页就拜拜了!而要运行一个静态网页的发布服务器,相信大家都知道配置不是太高也行的吧?呵呵。

因此,我认为,生成静态页面具有可行性。

那么怎么把动态网页的代码生成静态网页呢?又存在哪呢?原理其实很简单。
1、利用Freemark模板生成静态页面,网上搜一下大把大把的代码随你挑,我就不在这里铝恕
我很讨厌这种方式,因为对于一个数据量较大的页面来讲工作量太大,要写模板,语法又比较怪异,不流行!
2、也是我偶尔想起来的。用Java中URLConnection抓取某个URL网页源码(这是原理核心)生成html文件,就是这么简单!就是这么Easy!

代码奉上!

1)、以下是捕捉网页源码程序:

代码如下:

import java.io.BufferedReader; 
import java.io.File; 
import java.io.IOException; 
import java.io.InputStreamReader; 
import java.net.MalformedURLException; 
import java.net.URL; 
import java.net.URLConnection; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 

import org.apache.commons.io.FileUtils; 
import org.apache.commons.lang.StringUtils; 

/** 
* @author Xing,XiuDong 
*/ 
public class HTMLGenerator { 

    public static final String generate(final String url) { 
        if (StringUtils.isBlank(url)) { 
            return null; 
        } 

        Pattern pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:]+"); 
        Matcher matcher = pattern.matcher(url); 
        if (!matcher.find()) { 
            return null; 
        } 

        StringBuffer sb = new StringBuffer(); 

        try { 
            URL _url = new URL(url); 
            URLConnection urlConnection = _url.openConnection(); 
            BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream())); 

            String inputLine; 
            while ((inputLine = in.readLine()) != null) { 
                sb.append(inputLine); 
            } 
        } catch (MalformedURLException e) { 
            e.printStackTrace(); 
        } catch (IOException e) { 
            e.printStackTrace(); 
        } 

        return sb.toString(); 
    } 

    /** 
     * Test Code 
     * Target : http://www.google.cn/ 
     */ 
    public static void main(String[] args) throws IOException { 
        String src = HTMLGenerator.generate("http://www.google.cn/"); 

        File file = new File("C:" + File.separator + "index.html"); 
        FileUtils.writeStringToFile(file, src, "UTF-8"); 
    } 

}

2)、将源码写入Html文件,这个需要根据用户的需求了,我根据我项目中遇到的情况写了以下代码:

代码如下:

    /** 
     * generite html source code 
     * 
     * @author Xing,XiuDong 
     * @date 2009.06.22 
     * @param request 
     * @param url 
     * @param toWebRoot 
     * @param encoding 
     * @throws IOException 
     */ 
    public void genHtml(HttpServletRequest request, String url, boolean toWebRoot, String encoding) throws IOException { 

        if (null == url) { 
            url = request.getRequestURL().toString(); 
        } 

        String contextPath = request.getContextPath(); 
        String seq = StringUtils.substring(String.valueOf(new Date().getTime()), -6); 

        String ctxPath = super.getServlet().getServletContext().getRealPath(File.separator); 
        if (!ctxPath.endsWith(File.separator)) { 
            ctxPath += File.separator; 
        } 

        String filePath = StringUtils.substringAfter(url, contextPath); 
        filePath = filePath.replaceAll("\\.(do|jsp|html|shtml)$", ".html"); 

        String savePath = ""; 
        String autoCreatedDateDir = ""; 
        if (!toWebRoot) { 
            savePath = StringUtils.join(new String[] { "files", "history", "" }, File.separator); 

            String[] folderPatterns = new String[] { "yyyy", "MM", "dd", "" }; 
            autoCreatedDateDir = DateFormatUtils.format(new Date(), StringUtils.join(folderPatterns, File.separator)); 

            filePath = StringUtils.substringBefore(filePath, ".html") + "-" + seq + ".html"; 
        } 

        File file = new File(ctxPath + savePath + autoCreatedDateDir + filePath); 
        FileUtils.writeStringToFile(file, HTMLGenerator.generate(url), encoding); 
    }

来源:http://blog.csdn.net/xxd851116

相关推荐