Hibernate延迟加载机制详解

延迟加载：

延迟加载机制是为了避免一些无谓的性能开销而提出来的，所谓延迟加载就是当在真正需要数据的时候，才真正执行数据加载操作。在Hibernate中提供了对实体对象的延迟加载以及对集合的延迟加载，另外在Hibernate3中还提供了对属性的延迟加载。下面我们就分别介绍这些种类的延迟加载的细节。

A、实体对象的延迟加载：

如果想对实体对象使用延迟加载，必须要在实体的映射配置文件中进行相应的配置，如下所示：

<hibernate-mapping>

<classname=”com.neusoft.entity.User”table=”user”lazy=”true”>

……

</class>

</hibernate-mapping>

通过将class的lazy属性设置为true，来开启实体的延迟加载特性。如果我们运行下面的代码：

Useruser=(User)session.load(User.class,”1”);（1）

System.out.println(user.getName());（2）

当运行到(1)处时，Hibernate并没有发起对数据的查询，如果我们此时通过一些调试工具(比如JBuilder2005的Debug工具)，观察此时user对象的内存快照，我们会惊奇的发现，此时返回的可能是User$EnhancerByCGLIB$$bede8986类型的对象，而且其属性为null,这是怎么回事？还记得前面我曾讲过session.load()方法，会返回实体对象的代理类对象，这里所返回的对象类型就是User对象的代理类对象。在Hibernate中通过使用CGLIB,来实现动态构造一个目标对象的代理类对象，并且在代理类对象中包含目标对象的所有属性和方法，而且所有属性均被赋值为null。通过调试器显示的内存快照，我们可以看出此时真正的User对象，是包含在代理对象的CGLIB$CALBACK_0.target属性中，当代码运行到（2）处时，此时调用user.getName()方法，这时通过CGLIB赋予的回调机制，实际上调用CGLIB$CALBACK_0.getName()方法，当调用该方法时，Hibernate会首先检查CGLIB$CALBACK_0.target属性是否为null，如果不为空，则调用目标对象的getName方法，如果为空，则会发起数据库查询，生成类似这样的SQL语句：select*fromuserwhereid=’1’;来查询数据，并构造目标对象，并且将它赋值到CGLIB$CALBACK_0.target属性中。

这样，通过一个中间代理对象，Hibernate实现了实体的延迟加载，只有当用户真正发起获得实体对象属性的动作时，才真正会发起数据库查询操作。所以实体的延迟加载是用通过中间代理类完成的，所以只有session.load()方法才会利用实体延迟加载，因为只有session.load()方法才会返回实体类的代理类对象。

B、集合类型的延迟加载：

在Hibernate的延迟加载机制中，针对集合类型的应用，意义是最为重大的，因为这有可能使性能得到大幅度的提高，为此Hibernate进行了大量的努力，其中包括对JDKCollection的独立实现，我们在一对多关联中，定义的用来容纳关联对象的Set集合，并不是java.util.Set类型或其子类型，而是net.sf.hibernate.collection.Set类型，通过使用自定义集合类的实现，Hibernate实现了集合类型的延迟加载。为了对集合类型使用延迟加载，我们必须如下配置我们的实体类的关于关联的部分：

<hibernate-mapping>

<classname=”com.neusoft.entity.User”table=”user”>

…..

<setname=”addresses”table=”address”lazy=”true”inverse=”true”>

<keycolumn=”user_id”/>

<one-to-manyclass=”com.neusoft.entity.Arrderss”/>

</set>

</class>

</hibernate-mapping>

通过将<set>元素的lazy属性设置为true来开启集合类型的延迟加载特性。我们看下面的代码：

Useruser=(User)session.load(User.class,”1”);

Collectionaddset=user.getAddresses();(1)

Iteratorit=addset.iterator();(2)

while(it.hasNext()){

Addressaddress=(Address)it.next();

System.out.println(address.getAddress());

}

当程序执行到(1)处时，这时并不会发起对关联数据的查询来加载关联数据，只有运行到(2)处时，真正的数据读取操作才会开始，这时Hibernate会根据缓存中符合条件的数据索引，来查找符合条件的实体对象。

这里我们引入了一个全新的概念——数据索引，下面我们首先将接一下什么是数据索引。在Hibernate中对集合类型进行缓存时，是分两部分进行缓存的，首先缓存集合中所有实体的id列表，然后缓存实体对象，这些实体对象的id列表，就是所谓的数据索引。当查找数据索引时，如果没有找到对应的数据索引，这时就会一条selectSQL的执行，获得符合条件的数据，并构造实体对象集合和数据索引，然后返回实体对象的集合，并且将实体对象和数据索引纳入Hibernate的缓存之中。另一方面，如果找到对应的数据索引，则从数据索引中取出id列表，然后根据id在缓存中查找对应的实体，如果找到就从缓存中返回，如果没有找到，在发起selectSQL查询。在这里我们看出了另外一个问题，这个问题可能会对性能产生影响，这就是集合类型的缓存策略。如果我们如下配置集合类型：

<hibernate-mapping>

<classname=”com.neusoft.entity.User”table=”user”>

…..

<setname=”addresses”table=”address”lazy=”true”inverse=”true”>

<cacheusage=”read-only”/>

<keycolumn=”user_id”/>

<one-to-manyclass=”com.neusoft.entity.Arrderss”/>

</set>

</class>

</hibernate-mapping>

这里我们应用了<cacheusage=”read-only”/>配置，如果采用这种策略来配置集合类型，Hibernate将只会对数据索引进行缓存，而不会对集合中的实体对象进行缓存。如上配置我们运行下面的代码：

Useruser=(User)session.load(User.class,”1”);

Collectionaddset=user.getAddresses();

Iteratorit=addset.iterator();

while(it.hasNext()){

Addressaddress=(Address)it.next();

System.out.println(address.getAddress());

}

System.out.println(“Secondquery……”);

Useruser2=(User)session.load(User.class,”1”);

Collectionit2=user2.getAddresses();

while(it2.hasNext()){

Addressaddress2=(Address)it2.next();

System.out.println(address2.getAddress());

}

运行这段代码，会得到类似下面的输出：

Select*fromuserwhereid=’1’;

Select*fromaddresswhereuser_id=’1’;

Tianjin

Dalian

Secondquery……

Select*fromaddresswhereid=’1’;

Select*fromaddresswhereid=’2’;

Tianjin

Dalian

我们看到，当第二次执行查询时，执行了两条对address表的查询操作，为什么会这样？这是因为当第一次加载实体后，根据集合类型缓存策略的配置，只对集合数据索引进行了缓存，而并没有对集合中的实体对象进行缓存，所以在第二次再次加载实体时，Hibernate找到了对应实体的数据索引，但是根据数据索引，却无法在缓存中找到对应的实体，所以Hibernate根据找到的数据索引发起了两条selectSQL的查询操作，这里造成了对性能的浪费，怎样才能避免这种情况呢？我们必须对集合类型中的实体也指定缓存策略，所以我们要如下对集合类型进行配置：

<hibernate-mapping>

<classname=”com.neusoft.entity.User”table=”user”>

…..

<setname=”addresses”table=”address”lazy=”true”inverse=”true”>

<cacheusage=”read-write”/>

<keycolumn=”user_id”/>

<one-to-manyclass=”com.neusoft.entity.Arrderss”/>

</set>

</class>

</hibernate-mapping>

此时Hibernate会对集合类型中的实体也进行缓存，如果根据这个配置再次运行上面的代码，将会得到类似如下的输出：

Select*fromuserwhereid=’1’;

Select*fromaddresswhereuser_id=’1’;

Tianjin

Dalian

Secondquery……

Tianjin

Dalian

这时将不会再有根据数据索引进行查询的SQL语句，因为此时可以直接从缓存中获得集合类型中存放的实体对象。

C、属性延迟加载：

在Hibernate3中，引入了一种新的特性——属性的延迟加载，这个机制又为获取高性能查询提供了有力的工具。在前面我们讲大数据对象读取时，在User对象中有一个resume字段，该字段是一个java.sql.Clob类型，包含了用户的简历信息，当我们加载该对象时，我们不得不每一次都要加载这个字段，而不论我们是否真的需要它，而且这种大数据对象的读取本身会带来很大的性能开销。在Hibernate2中，我们只有通过我们前面讲过的面性能的粒度细分，来分解User类，来解决这个问题（请参照那一节的论述），但是在Hibernate3中，我们可以通过属性延迟加载机制，来使我们获得只有当我们真正需要操作这个字段时，才去读取这个字段数据的能力，为此我们必须如下配置我们的实体类：

<hibernate-mapping>

<classname=”com.neusoft.entity.User”table=”user”>

……

<propertyname=”resume”type=”java.sql.Clob”column=”resume”lazy=”true”/>

</class>

</hibernate-mapping>

通过对<property>元素的lazy属性设置true来开启属性的延迟加载，在Hibernate3中为了实现属性的延迟加载，使用了类增强器来对实体类的Class文件进行强化处理，通过增强器的增强，将CGLIB的回调机制逻辑，加入实体类，这里我们可以看出属性的延迟加载，还是通过CGLIB来实现的。CGLIB是Apache的一个开源工程，这个类库可以操纵java类的字节码，根据字节码来动态构造符合要求的类对象。根据上面的配置我们运行下面的代码：

Stringsql=”fromUseruserwhereuser.name=’zx’”;

Queryquery=session.createQuery(sql);(1)

Listlist=query.list();

for(inti=0;i<list.size();i++){

Useruser=(User)list.get(i);

System.out.println(user.getName());

System.out.println(user.getResume());(2)

}

当执行到(1)处时，会生成类似如下的SQL语句：

Selectid,age,namefromuserwherename=’zx’;

这时Hibernate会检索User实体中所有非延迟加载属性对应的字段数据，当执行到(2)处时，会生成类似如下的SQL语句：

Selectresumefromuserwhereid=’1’;

这时会发起对resume字段数据真正的读取操作。

Hibernate延迟加载机制详解

相关推荐