一、xml技术简介
XML(eXtensible Markup Language??可扩展标记语言)是一种 扩展的源标记语言,是可以定义其他语言的语言。
它是SGML的一个简化子集,这个子集是专为Web环境设计的,这就是说,它必须处理面向数据处理的(而不是面向发布的)、生存期短的(实际上是动态产生的)信息。
XML与HTML对比:
XML语法严格,数据与显示分离,便于其他程序交互和检索数据。
HTML语法容错性大,数据和显示都在一起,检索数据困难较大。
XML又明确的DOM对象,可以对XML文件进行读写添删数据的操作。
HTML没有这种明确的对象来完成该操作。
XML克服了HTML的种种不足,将网络上传输的文档规范化,并赋予标签一定的含义。
XML作为一种网络系统中通用的数据交换格式迅速得到了支持,使用XML的实际好处有:
结构化??建立有任何复杂层次的数扭模型。
可扩展性??根椐需要定义新的标识。
验证??检查数据在结构上的正确性。
独立与媒介??以多种方式发布内容。
独立于供应商和平台??使用标准的商业软件甚至文本工具处理任何符合(XML标准)的文档。
XML文档可以通过可扩展样式语言XSL(Extensible Style Language XSL)转换和格式化XML文档。从而实现数据和页面样式的分离。
二、用JSP技术实现XML
JSP提供了一系列的特点,可以非常理想地和XML协同工作,JSP网页可以包含任何类型的文本数据,所以JSP可以直接生成含有XML的文档。而且,JSP可以利用强大的JAVA平台来解析、转换XML信息和文档。由于JSP也是JAVA软件环境的一部分,JSP也可以使用API对象来处理XML数据。JSP技术的强大功能和很好的灵活性加上XML技术规范化的数据,可以完美的实现网页的动态显示功能。
三、开发环境
1、编辑工具
现在,开发XML文档的工具越来越来多,从链接大型公司数据库的企业级XML开发环境,到简化标记开发过程的简单的小型文本编辑器。最新的工具可以从了解到。目前,常用的几种开发工具介绍如下:
UltraEdit 由IDM Computer Solution 公司开发,可到或免费下载有限期使用版。它是界面类似于Windows的资源管理器式的界面,有很强的文本编缉功能。
XML Spy Icon Information-Systems 公司的XML Spy 是XML 一个集成开发环境,包括进行XML开发的各个方面,功能较强,简单易用。XML Spy是一个真正完整的XML开发环境。它将所有开发XML所需的要素都包含在一个简单易用的产品中。它包括:XML编辑器和检验、Schema/DTD编辑器和检验、XSL编辑器和转换。同时还包含最新的XML草案,是一个不可多得的好软件。
XML Writer 这个软件是由Wattle Software-Chris Howard 开发的,可从下载(试用)。在Window 95/98/2000 and Windows NT4下使用,也有着大家熟悉的Windows界面,提供了工程管理环境,可能刨建、查看工程,工程下包含文件,用户可自定义工具条、快捷键,并且可为命令选择显示图标。可用XSL样式表转换XML文件为HTML文件,不仅可使用XSL,而且可以使用XQL,用DTD或XML Schema 对XML进行检验,用XML格式直接的将CSS结合到XML,提供在线帮助功能,并且它对中文的支持较好。
2、XML服务器
由于XML技术有很大的发展潜力,众多厂商提供了自己的XML服务器,其中有Apache、Microsoft、Sun等。
3、浏览XML的工具
现在,大多数方案是将XML存储在数据库中,当需要时取出代码,将其与数据结合起来,使用XSL将其转换为HTML,然后发送到浏览器。所以浏览XML一般选用IE可Netscape, 而且版本越新对XML文档支持越好。
四、具体实现
1、 规范定义XML文档中元素名称
首先定义XML文档头部,包括XML遵循的规范、编码方式、注释等。例如:
< ?xml version=”1.0” encoding=”gb2312” standalone=”yes”?>
“version=”1.0” “,表示该XML文档遵循XML1.0方案,这个喜剧声明是必须的。
“encoding=”gb2312” ”,如果没有这个声明,必须使用Unicode,以UTF-8或UTF-16作为编号方式。如果文件中使用了中文,就必须进行编码声明。
“standalone=”yes” ”,XML声明还可以有standalone特性,它说明,文档是否在这一个文件里需要从处部导入文件。如果XML文档在一个文件里完成,那么standalone特性的值就设置为“yes”。
然后,根据业务的需要规范定义页面上要显示的元素,以及定义它们的元素名称,元素名称可以是中文的,这样对数据描述更加简单明了,这是HTML无法实现的。元素是文档的主要逻辑部件,由开始和结束标记界定,格式为:
< 元素名称 属性名1=“属性值1” 属性名2=“属性值2”>
元素的内容
< /元素名称>
元素的内容,可以直接写在页面上,也可以从数据库中取得。
文档中还可以包括实体声明和实体引用。简单地说,实体分为一般实体和参数实体。参数实体只能出现在DTD中,一般实体出现在一根元素开始的主XML文档中。实体声明格式为:。一般实体的引用很简单:“&实体名称;”,参数实体的引用与一般实体的引用类似:“%实体名称;”。实体是功能强大的工具,提供了管理大量内容的便捷机制。
更多信息请查看IT技术专栏