资源预览内容
第1页 / 共5页
第2页 / 共5页
第3页 / 共5页
第4页 / 共5页
第5页 / 共5页
亲,该文档总共5页全部预览完了,如果喜欢就下载吧!
资源描述
可扩展显标语言( X ML ) 的概念与实现 李宁刘京志张红王凌 ( 北京信息工程学院 软件工程研究中心 1 0 0 1 0 1 ) 摘 共 文 档 . 理 的 一 个 , 要 内 容 是 文 档 脸 证 。 通 用 t 标 语 官 的 出 攀 . 为 这 类 应 用 提 供 了 有 效的 手段。 如何 在主涟 的 通用 文档 .辑.如在M S W O R D若 劝上. 设计一个 其有f标 语义 侧导曲力的、 可 进 行 结 构内 容 脸 证的、 且 二 处 理中 文的 文 档 编 辑 二 以 及 如 何 将 旅. 辑 .与 所 . 辑的 文 档和当 今广 为采 纳的文档甘理工具和办公自 动化工具L a m e N ot es结合. 与i n t e r 口 et 结合. 则是本文介用 的,点。*文擂 述了 这 禅 一 个以 可 扩 晨 f 标 语 官 ( X M L ) 为 核 心 的 分布 式 文摘 集 成开 发 环 峰. 它 具有嚣 几文 摘的 . 辑、 浏 览、 查 询 和 管 留 等 功 住 。 这 个系 魄 成 功 地 维 成了 t 标 技 术、 通 用 幼 衡 翻 和1 . a n S N a t .的 精华 . 也为 开 发X M L 的中文应用扭供了一个可操作的平白。 要.翻W O R D N o t es 抽辑器!o语言 一、 背景 文档 管理的 一个 盆要内 容是 文档脸 证。 例如, 软件工 程文档的 写作 必须 合乎规范, 这些规范 包 含在数 个国 标和 军标的 文 档开发 指南之中【 1 。 那么 如何 保证写出 的文 档符合 规范呢? 另 外, 是否 对 不 同 的 平 台 、 不 同 的 文 档 我 们 都 要 写 一 套 脸 证程 序 来 位 查 文 档 的 规 范 性呢 ? t 标 语 言( M a r - a p 并且, I标 过的各 个部分可以 形成语义胜接, 从而成为超文本。使用f标语言的优点有: 文档可采用标准的文本格 式; 文 档处 理与 软 硬件平台 无关; 文 档具有 严格的 结构形式和良 好的可扩充 性; 各文档可建立语义 关联, 支持超文本的网 络棋整; 支持广泛的 操体形式, 如图像、 声音、 动态形像乃至X合的多媒体对 象, 等等。 由. Vo r ld W i d e W e b C o n a o r t iu m ( W 3 C ) 组 织制 定的X M L 如果 是S G M L 2 3 的一个子集, 它 针对W e b 应用, 简化了一 些S G M L 的 不常 用的内 容。 X M L 是一 组用来 形成语义 It标 的规则 集合, 这些 置标可 把文档的 各 个部 分按 预先定义 的语 义结构 组织 起来并 进行 结构化的 验证。使用X M L , 可以用容易而且一致的 方式格式化和传送数据的方式. 解决目 前H T M L 在处理大型的、 非常复杂 ” 文 X M L )E FA 黑em et lff j * 9 撬 X M L已 开始在国内 外大1t 应用【 4 , 术, 是未来I n t e m e t 、 电子出版、 多媒体应用的荃石。而 X ML 分析器和编辑器则是开展X ML 应用的墓础。北信X M L 编辑器建立在我中心改进的X M L 分析器的基础之上, 具有语义制导、 置标提示和检查脸证的能力, 并支持分布式网 络应用, 支持全中 文 的 操 作 界 面 、 中 文 置 标 和 中 文 内 容 , 支 持W 3 C 推 荐 标 准 12 1 。 北 信X M L 编 辑 器 基 于 徽 软 的 W O R D 9 7 文 档 编 辑器, 保留 了W O R D 的 优 点, 有 较强 的用户 羞 础。 编辑 器 与L o t u s N o te s 文档 管 1 9 2 理平台紧密集成, 实现对X ML 文本进行有效的管理。 二、 一个分布式扩展置标应用实例 北京信息工程学院软件 工程研究中心在1 9 9 7 年开发成功签于标准通用里标语言S G ML 的超 媒 体软件工程文档开发环境【 5 之后, 又进行了X M L的分析与研究。目 前, 已 经初步实现了一个 集X ML 文档写作、 浏览、 查询和管理等功能于一体的文档开发环境。这个系统的结构如田1 3 图1 或 统结构圈 L o t u s D o r m.支持的 文档.务器中 存放文件类型定义( D T D ) , X M L 文档、 X S L 式样单( S t y le S h e e t ) 以 及x M 王分 析服务器( P 垃盯S e r v e r ) 等。文 档服务器通过局 城网与文 档客户机 连接. 容户 机羞子L o t u s N o t e s 平台, 其上 安装M S W O R D 9 7 中 文 版和X M L 分析器容 户端 。容户 要求位 用熟 悉的W O R D 文 档编 辑器来编 辑文 档。因 而魏们 对W O R D 进 行了 二次开发, 利用V E L A , 提供编辑 D T D , X M L 文档和X S L 式样单的 功能。在编辑X M L 文档的过程中, 绷辑拐佣用X M L 分析器容 户 端, 再通过S o c k e t 调用X M L 分析 服务器, 很 据D T D 实时 给出 可 用的 it 标标记和 属性, 以 对翻 辑 过程进行 语义 创导。同 时 用户 可随时 进行脸 证位查( 词1山 现) 。 三、 X ML 编辑器与分析器的设计与实现 根 据藉求润查, 我们为X M L 编辑器列出的主要设计目标有: 1 ) 签于M S W O R D , 可使用 W O R D 提供的字体、 翻色、 版式和文本结构等手段方便编释过程p 2 ) 可以使用中文f标柯中文内 容: 3 ) 可以 动态选择D M ; 幻可以 很据所选的D M 随时给出可用的it标标记供用户选撅 并可设 定 属 性, 5 ) 可 以 动恋 给出 宜 株 层 次 信 息 , 用 户 借 此 可以 知 道当 前的 位 I以 选 排正确 的 标记: 6 ) 可以 随时 进行X M L 脸证, 给出.误定位信息。_一 目 前大多效的X M L 编辑器只 提供文本方式的编辑, 附 带检查格式是否良 好( w e l l f o r c e d ) 或提 供脸证的能力。大多不能实现实时语义翻导。而几乎 所有的X M L 分析器部只对整个文件进行处 理, 虽然 通过S A X ( S ir p le A P I f o r X M L ) 6 和D O M A P I 7 可以 处理t标树结构的 各个部分, 但 在 抽入不完 整文 本的 情 况下, 分析器一般只能 报借。 为了 进免从头开发分析器程序, 充 分利用I n - t e r n e t 上的 共享 资 滚, 我 们 对多 个X M L 脸 证 分 析 器 进 行了 分 析比 较, 如e x p a t , m s x n d , X M L F o r J a - v a , D X P 等, 最后决定在徽软的X M L 验证分析器基础上进行修改, 最终研制出适合编辑器使用的 分析器 8 , 目 前实现的X M L 编辑 器基 于M S W O R D 9 7 , 运用V is u a l B a s ic fo r A p p l ic a t io n ( V B A ) 进行7宏 扩展。虽然N o t e s 也有较强的文档编辑能力, 但是静态的N o t e s 表单不能支持动态的文档结构, 而 且N o t e s 的每 个文 档的 文 本大小 存在6 4 K字节的 上限T , 使用W O R D和V B A来开发编辑器更具 可行性。 编辑器还同时引人了部分所见即所得( WY S I W Y G ) 的 编辑风格。虽然W Y S I W Y G本非 置标语言的目 标, 但在编辑过程中引 入WY S I WY G确能方便编辑过程, 特别是图形和表格的擂入。 以下是为X M L 编辑器的开发的主要宏功能: D T D 装载。读入D T D , 生成内 部D T D 语义结构以使进行语义制导。 文档结构。按照D T D的 定义和约定, 从当前正在幼辑的X M L 文档中抽取文档结构( 标题) 并 以 树形结构显示出来。用户可以由 此定位到相应的文档段落上。 X M L 生成。 将验 证 过的W OR D文 档转换成X M L 文档( n n ic o d e 文本) . 并 保存到N o t .文档 库中 。 其中 , W O R D文 档中的图 形和表格 都被 转成X M L / H T M L 语句。 语法枪查。 对正在编辑的X ML 文档, 调用分析器进行“ w e l l f o r m e d 检查 和D T D 脸证, 给出 . 明 确的错误原因, 井定位到出错的位里上。 . 置标 扭 示。 对 所 编 辑 的X M L 文 档的 当 前 光标位 且 之 前的内 容 调用 分析 器进行 语义 枪查, 若 语 法 年 确 , 则 给 出 当 前 光 标 位 里 上 可 以 使 用 的 所 有 置 标 , 月 性 及 其 可 能 的 属 性 值 。 同 时 列 出 当 前的纽标层次路径。用户通过眼 标从列表中选取。 .拍 确 o w 曹 先 进 行 切 义 植 A , P O E 定 当 前 光 标 位 It 上 是 否 可 拍 人 圈 形 。 若 是 、 . 弹 出 一 文 件 选择窗口, 用户 选定图形文件便可擂人到当前光标位皿上。图形最后由 泊辑器转换成X M I J H T M L 超桩接。 . 擂人表格。 首先进行语义检查, 以 决定当 前光标位2上是否可擂入表格。 若是, 则用户在一弹 出 窗口中 指定表格的行致和列数, 井擂入到当前光标位里上。表格.后由偏辑器转换成 X M L / H T M L 的 且标。 . 盆标的陈蔽/ 显示。用户可选定胜截还是显示正在编辑的X M L 文档 中的x标。 X M L 编 辑 器 的 用户 界 面 举 例 如 图2 , N、 X ML 文档的分布式集成开发环境的实现 我中 心目 前 开发出 用于 军用软 件工穆文档 管 理的X M L 文档分布式 集 成开 发环境, 集X M L 文 档写作、 浏览、 查询和管理等功能于一体。除了 上述的 文档绮辑和x M f . 分析功能外, 主要通过L o- t u s D o m i n o / N o t e s 来进行文档管理。以下是几个在D o m i n o S a v e r 上 建立的文档狱据库: . 文 件 类 型 定 义 库: 其 中 存 放 我 们 开 发的 与H T M L 3 . 2 兼 容 的 .、 符 合 军 标 的1 6 个 软件 工程 文 档 呱 。 一这 些 D T I ) 除 专 门 人 员 外 一 般 不 允 许 随 便 修 改 。 文 档 开 发 人 员 可 以 阅 读 。 . 文档棋板库: 其中存放按上述D T D写成的X M L 格式的1 6 个软件工穆文档。这些文档的内 容与军标文档规范的内 容相一致。文档开发人员可以阅读这些文档。 .开 发 岌 档 库 : 其 中 存 放 与 具 体 应 用 相 关 的 W O R D , , 格 式 的 软 件 工 程 文 档 。 我 们 使 用 N o t e s S c r ip t 为 这个 库增加了W O R D 9 7 的 调用界 面箱内 容。 文档的 所有 者、 评阅 者和 读者由 文 档管 理员指 定。 这 个库中 还具有“ 评阅 ” 、 “ 催办” 和“
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号