资源预览内容
第1页 / 共42页
第2页 / 共42页
第3页 / 共42页
第4页 / 共42页
第5页 / 共42页
第6页 / 共42页
第7页 / 共42页
第8页 / 共42页
第9页 / 共42页
第10页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Page1www.apabi.cn新一代结构化版式文档技术方正技术研究院数字出版分院院长北京方正阿帕比技术有限公司CTO汤 帜内容提纲1. 版式文档技术现状2. CEBX的技术架构3. CEBX的关键技术问题和技术特点4. 小结5. CEBX技术的未来发展www.apabi.cn版式技术的背景介绍版式文档(Fixed-Layout Document)版式固定 所见即所得:What you see is what you get, 简称WYSIWYG 用于成文文件 正式出版物、发布公文、档案 成文后不再修改典型的版式文件格式PDF、CEB、XPS阅读终端多样化图片来自互联网人们阅读的不仅仅是纯文字版的小说,还包括缺少统一的技术、转换困难PC机阅读:CEB 、PDF等移动终端:ePub 、azw、lit、 mobi、XEB等印刷:PDF结构化版式文档技术的研究现状(1)基于XML的版式文档格式MARS以版式信息描述为主,其结构信息描述的方式 没有解决Tagged PDF的缺点2001Adobe推出的PDF 1.4中引入了Tagged PDF结构信息不完全:剪裁对象的处理、表格结 构、复杂效果的描述等结构化版式文档技术的研究现状(2)Bloechle在2006年提出,通过引用版面中的文字、图像、图形等内 容来构造一个包含完整版面信息与流式信息的文档 2008年,Bloechle在XCDF的基础上提出了一种从已有固定版式文 档中重新构造文档逻辑结 构的方法Dolores 2009年Bloechle又对XCDF格式进行了优化,缩小了所生成的文档 体积,使其更利于使用。XCDF & OCD格式PDF(1993年)CEB(2000年)XPS(2005年) 版式阅读技术OebPS (1999年)XEB (2001年)ePub (2006年)Azw (2007年)流式阅读技术Tagged-PDF、 MARS 流式特征ePub 2.1 Charter (2011.4.6.)研 究 版 式 和 流 式 融 合 技 术 (2 0 0 5 年 )启 动 C E B X ( 2 0 0 6 年 )C E B X 1. 0 ( 2 0 0 9 年 )C E B X 1 . 1 ( 2 0 1 0 年 )版式和流式融 合的阅读技术文档阅读格式的发展PDF(1993年)CEB(2000年)XPS(2005年) 版式阅读技术OebPS (1999年)XEB (2001年)ePub (2006年)Azw (2007年)流式阅读技术Tagged-PDF、 MARS 流式特征ePub 2.1 Charter (2011.4.6.)研 究 版 式 和 流 式 融 合 技 术 (2 0 0 5 年 )启 动 C E B X ( 2 0 0 6 年 )C E B X 1. 0 ( 2 0 0 9 年 )C E B X 1 . 1 ( 2 0 1 0 年 )版式和流式融 合的阅读技术版式文档的发展第一代版式文档: 印刷第二代版式文档: 印刷+阅读第三代版式文档: 跨终端阅读 +印刷内容提纲1. 版式文档技术现状2. CEBX的技术架构3. CEBX的关键技术问题和技术特点4. 小结5. CEBX技术的未来发展www.apabi.cn设计目标开放、标准支持多语种的文档跨平台、跨终端文档的数据量小、压缩倍率要高解析引擎内核精练,适合嵌入系统更好地支持网络阅读 (边下载边阅读 )安全性、细粒度保护www.apabi.cnCEBX总体架构www.apabi.cnCEBX Document FormatXMLData FilterLayoutLocal SecurityDRM SecurityScriptReflow SupportTableGraphicsFormInteractivityExtended InterfaceMediaXDADoc ModelCEBX的数据组织www.apabi.cnPage13内容提纲1. 版式文档技术现状2. CEBX的技术架构3. CEBX的关键技术问题和技术特点4. 小结5. CEBX技术的未来发展www.apabi.cn3.1 CEBX的技术特点:数据打包XDA多文档打包结 构CEBX能在一个文 件中容纳大量对象 和数据 解决压缩 率、随机 访问 数据、线性化 处理问题www.apabi.cn3.1 CEBX的技术特点:数据打包ZIP containerOOXML, ePub, MARS采用问题不支持:增加修改;修 改历史;线性化; XML的压缩率不高Zip包(Package)结构的比较文件头数据块数据块数据块数据块数据块数据块数据块数据块CEBX文件公共数据第一页数据第二页数据线性化文件头数据块数据块数据块数据块数据块数据块数据块数据块CEBX文件公共数据第一页数据第二页数据XTrimXML数据压缩方法2010/12/16北京大学博士研究生学位论文18解析、优优化 XML Schema最小化结结构 信息数据分离、 分组组基于语语种处处 理数据生成索引结结 构数据分块块数据块优块优 化XTrim压缩率比较www.apabi.cn3.2 CEBX的技术特点:屏幕自适应 同时支持版式信息和完整的结构信息www.apabi.cn源文档屏幕自适应版式融合版式和结构信息CEBX版式呈现 采用和设备无关的成像模型以保证原版原式(呈现效果固定,所见即所得) 具备复杂版面效果的描述能力CEBX流式呈现 基于文档的逻辑结构信息 易于编辑和图文混排 屏幕自适应 版式流式实时切换屏幕自适应屏幕自适应(cont.)3.3 CEBX的技术特点:解析效率 把复杂的计算放在文档的生成过程中 尽量降低解析的复杂度,提高解析效率www.apabi.cnXDA其他 文件XMLXML速度比较测试测试 文件文件格式文件大小平均全文搜索时时 间间Document management Portable document format Part 1: PDF 1.7 PDF8,785KB00:00:32:47CEBX6,884KB00:00:10:78备注:其中PDF使用Adobe Reader 9.3,CEBX使用Apabi Reader 4.13.4 CEBX的技术特点:安全性 支持文档、对象等多粒度的保护方法 数字签名、分段授权等机制 本地安全、第三方DRM安全扩展等方式,适应各种应用场合www.apabi.cn3.5 CEBX的技术特点:数据结构化“容器+文档模型”采用XML技术来描述文档数据数据的描述和显示分离 方便地与其他系统进 行数据交换、解析、编辑 、阅读 提高文档操作和应用的灵活性文档的结构信息进行了描述对信息检索和知识提取、知识重利用等都提供了很好的支持www.apabi.cn内容提纲1. 版式文档技术现状2. CEBX的技术架构3. CEBX的关键技术问题和技术特点4. 小结5. CEBX技术的未来发展www.apabi.cn小结CEBX是第三代结构化版式文档技术CEBX文档模型融合固定版式信息和结构化的流式信息解决了数字出版中的终端多样化所带来的问题www.apabi.cnhttp:/www.founderrd.com/CEBX的标准规范下载地址http:/sourceforge.net/projects/xdakit/XDAKit 开源项目地址样例演示内容提纲1. 版式文档技术现状2. CEBX的技术架构3. CEBX的关键技术问题和技术特点4. 小结5. CEBX技术的未来发展www.apabi.cn电子书包www.apabi.cn需解决的问题数学公式、表格等版面在阅读终 端中 的展示! 交互操作的支持基于CEBX的资源(云)存储中心www.apabi.cnCEBXCEBXCEBXCEBX基于CEBX的资源(云)存储中心各种文档转换为 CEBX的效率 问题CEBX自适应版面生成的效 率、并行处理、Cache机制等 等 文档结构信息、语义信息的 提取算法及效率 公式检索、图形检索需解决的问题www.apabi.cn36页眉表格图表注释标题段落脚注版心多文档、多模式混合www.apabi.cn多文档、多模式混合www.apabi.cn实时 内容重组 文档内容关联与聚合 适合多种应用模式的文档处理需解决的问题终端的适应性无处不在(ubiquitous)www.apabi.cn终端的适应性无处不在(ubiquitous)www.apabi.cn普适文档(ubiquitous document)?www.apabi.cn第一代版式文档: 印刷第二代版式文档: 印刷+阅读第三代版式文档: 跨终端阅读 +印刷第四代?ubiquitous document?谢 谢!www.apabi.cn
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号