2008年(3500)
分类:
2008-05-04 21:01:35
保存各种信息对于应用程序来说非常平常,大多数时候它们是保存在关系数据库中。数据库处理规范数据类型十分在行,但是在处理如图像、文档等二进制数据时却不是那么得心应手。尽管可以用文件系统作为替代——而且它们还提供了更好的性能。但它们既没有提供用于搜索信息的查询语言,也没有提供表示关系或事务的概念。
幸运的是,被称为Java内容仓库(Java Content Repository,JCR)的JSR-170,试图以独立于具体实现的方式解决这些(以及其它)问题。即,不论底层资源(如,数据库,本地或虚拟文件系统)是什么,API都将相同。在数据存储之上,JCR提供诸如访问粒度控制、版本控制、内容事件、全文检索和过滤等内容服务。由Day Software领导的JSR-170背后的专家组令人印象深刻,包括内容管理系统(CMS)提供商Vignette、Hummingbird Ltd.、Stellent和通用Java驱动解决方案提供商,如BEA Systems、IBM和Oracle。该规范很可能成为内容管理和文档存储方面事实上的标准。
经过几乎2年半的努力,工作最终于2005年6月完成,在javax.jcr包中,API包含了大约50个类(主要是接口和异常)。2006年早些时候,发布了初始1.0版本的参考实现(JackRabbit)。
Java内容仓库建立在仓库(除了是“用于安全地保存货物的地点”的通常含义之外)概念之上,它提供了几个操作数据的特性。仓库使用“树结构”保存信息,如下图,树由节点和属性组成。圆圈代表节点,方框代表属性。1个节点有且只有1个父亲,有任意数目的孩子(子节点)和任意数目的属性。1个属性有且只有一个父亲(它是节点),它没有子节点,由一个名字和一个或多个值组成。属性值的类型可以是:布尔(Boolean)、日期(Date)、双精(Double),长整(Long),字符串(String)或流(Stream)。只有属性可以被用来存储信息,节点则被用来创建树内部的“路径”。在某种程度上,这棵树类似文件系统的结构,节点是目录,属性是实际的文件。
仓库的功能被划分为几个“兼容性”级别,每个级别提供一组特定的特性:
值得注意的是,JCR的实现并不要求达到级别2或者更高层次。因此与只读仓库一起工作也是完全符合规范的。
使用JSR-170时,建议使用来自javax.jcr包的接口。这样,更换JCR实现时会容易些,不会有任何代码的变动。
API的核心类是Session,它代表客户端和仓库之间的连接,使用连接活跃其上的workspace名和所提供的credentials进行定义。Session包含读(级别1)和写(级别2)方法;使用底层仓库不支持的功能时将抛出异常。
这个包还包含了那些组成仓库的单元接口的定义:Workspace,Credentials,Node,Property,Item(Node和Property的超类)和Value。javax.jcr.query包负责处理查询,javax.jcr.nodetype包负责定义节点类型。剩余的包负责可选级别的功能,如javax.jcr.version、javax.jcr.observation、javax.jcr.lock。一个有趣的包是javax.jcr.util,它包含一个ItemVisitor的实现,它源自GOF(四人帮,Gang of Four)撰写的著名的设计模式中的访问者模式(Visitor-pattern)接口。
Google和SourceForge会列出好几页的JSR-170实现,但是它们中的大多数都处于alpha阶段,没有发布任何版本。以下是一个可以自由下载的项目列表,它们已经被作者使用过:
Spring Modules的一部分,JCR模块的主要目标是:以一种类似Spring主分发包中ORM包的方式,简化使用JSR-170 API进行开发。特点如下:
本文将使用参考实现(Jackrabbit),由于JCR模块使用的是javax.jcr接口,因此改变实现根本就是一个配置的问题。让我们一步一步地来看看在Jackrabbit之上如何使用Java内容仓库,以及如何让Spring模块来帮助完成这一工作。
JCR支持提供RepositoryFactoryBean类配置Jackrabbit,它需要JackRabbit的配置文件和主目录。注意,RepositoryFactoryBean在使用本地文件系统时特别有用;对于服务器环境,仓库可能被注册在JNDI中,此时可以使用JndiObjectFactoryBean帮助类(Spring分发包的一部分)检索它:
或使用Spring 2.0的模式名字空间:
为了简化与JCR的工作,模块增加了SessionFactory接口:
public interface SessionFactory {
public Session getSession() throws RepositoryException;
public SessionHolder getSessionHolder(Session session);
}
SessionFactory隐藏了实现内部的认证细节,因此一旦配置完成,使用同一证书的会话可以很容易的被检索出来。为了利用实现的特性(没有涵盖在规范中的),这个接口允许检索SessionHolder。它是一个JCR模块特定类,主要被用于事务和会话管理(通过一种可用于每个JCR实现的缺省、通用实现),但是它不支持可选特性或自定义特性(如JackrabbitSessionHolder,它支持Jackrabbit的事务基础结构)。JCR模块提供一种简易、透明的方式来发现SessionHolder实现(这些我将在以后详细提到),使之很容易地插入对JSR-170其它兼容库的支持。
SessionFactory的缺省实现是JcrSessionFactory,它要求一个进行工作的仓库和证书。
这个bean声明非常简单,唯一需要注意的地方是,密码被提供给SimpleCredential的构造函数:它只接受字符数组,使用Spring工厂声明作为一种变通。
JcrTemplate是JCR模块的核心类之一,它提供了与JCR会话一起工作的方便方法,将调用者从必须处理的打开和关闭会话、事务回滚(如果底层仓库提供)、以及处理其它特性中的异常等工作中解放出来:
模板定义非常简单,类似来自Spring框架的其它模板类,如HibernateTemplate。
既然仓库已经配置了,接下来看看“Spring化”的例子之一,它来自Jackrabbit的wiki页:
public Node importFile(final Node folderNode, final File file, final String mimeType,
final String encoding) {
return (Node) execute(new JcrCallback() {
/**
* @see org.springmodules.jcr.JcrCallback#doInJcr(javax.jcr.Session)
*/
public Object doInJcr(Session session) throws
RepositoryException, IOException {
JcrConstants jcrConstants = new JcrConstants(session);
//create the file node - see section 6.7.22.6 of the spec
Node fileNode = folderNode.addNode(file.getName(),
jcrConstants.getNT_FILE());
//create the mandatory child node - jcr:content
Node resNode = fileNode.addNode(jcrConstants.getJCR_CONTENT(),
jcrConstants.getNT_RESOURCE());
resNode.setProperty(jcrConstants.getJCR_MIMETYPE(), mimeType);
resNode.setProperty(jcrConstants.getJCR_ENCODING(), encoding);
resNode.setProperty(jcrConstants.getJCR_DATA(), new FileInputStream(file));
Calendar lastModified = Calendar.getInstance();
lastModified.setTimeInMillis (file.lastModified ());
resNode.setProperty(jcrConstants.getJCR_LASTMODIFIED(), lastModified);
session.save();
return resNode;
}
});
}
主要区别是:代码被包装在一个JCR模板中,它将我们从不得不使用的try/catch语句块(因为IO和Repository的需检查异常)和处理会话(和事务,如果有的话)清除工作中解放出来。值得提及的是硬编码字符串,如“jcr:data”,是通过JcrConstants工具类解析出来的。它知道名字空间的前缀变化,并提供一种干净的方式处理JCR常数。正如你看到的,我只是使例子更加健壮,但是对于实际业务代码影响最小。
使用JCR模块的一个好处就是能将Spring事务基础设施(包括声明性和编程性)应用于Java内容仓库。JSR 170将事务支持视为可选特性,并没有强制一个标准的方式来暴露事务钩子,因此每个实现可以选择不同的方法。在本文撰写时,只有Jackrabbit支持事务(在它的大部分操作中),它通过为每个JcrSession暴露一个javax.transaction.XAResource做到这一点。JCR模块提供LocalTransactionManager用于本地事务:
为了声明事务划分,我与上述事务管理器bean声明一起使用标准Spring类:
true
PROPAGATION_REQUIRED
PROPAGATION_REQUIRED, readOnly
如果要求一个JTA管理器,一个简单而优雅的解决办法是使用来自Jackrabbit捐献包的jca连接器。为了使用jca,你并不需要一个应用服务器,因为你可以用一个可插入的JCA容器,如Jencks。JCA容器的配置已经超出本文的范围,但是你可以参考JCR模块例子中使用Jencks的例子。
对于要求普通JCR代码的应用程序,JCR模块允许用直接使用JCR API的代码,透明地使用事务驱动会话。 此时,可以使用TransactionAwareRepository,它有一个参数是JcrSessionFactory。这样,在使用Session.login()(它接收定义在JcrSessionFactory中的参数)创建任何新会话时,如果发现有线程绑定的会话,就将返回它。注意:如果使用事务,JCR会话就是事务性的,否则你必须手动设置属性allowNonTxRepository为true,配置如下,要不然将抛出一个异常:
transactionRepositorybean可以被用作一个普通的JCR仓库,不关心底层机制或线程绑定会话、事务性或非事务性(如果有事务,关闭会话时要提交事务)。
为了最大化代码重用,但仍然允许插入可选特性,如用于不同JCR实现的事务支持,JCR模块使用SessionHolder接口(前面已经提到),同时还有SessionHolderProvider和SessionHolderProviderManager接口。用户一般不用与它们打交道,因为它们是框架内部使用的;但是,它们代表了JCR模块主要的扩展点。
SessionHolder类被内部不同组件使用,主要被事务管理器用来操作会话,SessionHolderProvider和SessionHolderProviderManager处理sessionHolder创建的方式以及提供者是如何被个别使用的。缺省将使用ServiceSessionHolderProviderManager,它利用JDK 1.3 Service Provider的自动发现特性。管理器将在类路径中搜索META-INF/services/org.springmodules.jcr.SessionHolderProvider条目,它包含了SessionHolderProvider实现的完整限定名。Jackrabbit支持就是这样配置的,JCR模块的分发包中包含一个META-INF/services/org.springmodules.jcr.SessionHolderProvider(译注:原文有误,没有给出后面的文件名)文件,它只有一行:
org.springmodules.jcr.jackrabbit.support.JackRabbitSessionHolderProvider
缺省,SessionHolderProviderManager被JcrSessionFactory内部使用,因此在工厂启动时,任何客户化实现可以被获取,并与合适的仓库一起使用。但是,通过设置JcrSessionFactory中的SessionHolderProviderManager,可以很容易的切换到一个不同的发现策略。一个可替代的发现服务是ListSessionHolderProviderManager,它接收一组提供者列表,可以方便地使用自定义提供(如测试)。
...
注意,每个仓库一个提供者。如果列表包含多个工作于同一仓库的提供者,顺序将非常重要,因为先匹配的先使用。
尽管JSR-170已经于2005年5月完成,Java内容仓库的工作并没有终止。JSR-283,官方的后继者,将聚焦于功能增强,如联邦,remoting,客户端/服务器协议映射和扩展内容模型的能力。同时还存在着一些JSR之外的想法和项目:绑定/映射框架,它可以将java类转换为一个JCR树,反之亦然(类似ORM,后端用Java内容仓库替代数据库),建构于JCR之上的WebDAV服务器(参见Jackrabbit的捐献包),以及其他。已经出现了用于不同产品的JSR-170连接器,如Alfresco、BEA Portal Server和IBM Domino。
至于JCR模块,路线图包括用于几个实现的Acegi安全集成,支持Spring 2.0名字空间模式(它将减少XML的配置)和与其它JCR实现集成。很显然,JCR的看起来一片光明。
下载本文示例代码